WO2012046906A1 - Device and method for providing resource search information on marked correlations between research subjects using a knowledge base from a combination of multiple resources - Google Patents

Device and method for providing resource search information on marked correlations between research subjects using a knowledge base from a combination of multiple resources Download PDF

Info

Publication number
WO2012046906A1
WO2012046906A1 PCT/KR2010/007242 KR2010007242W WO2012046906A1 WO 2012046906 A1 WO2012046906 A1 WO 2012046906A1 KR 2010007242 W KR2010007242 W KR 2010007242W WO 2012046906 A1 WO2012046906 A1 WO 2012046906A1
Authority
WO
WIPO (PCT)
Prior art keywords
resource
technical
knowledge base
research
search information
Prior art date
Application number
PCT/KR2010/007242
Other languages
French (fr)
Korean (ko)
Inventor
정한민
김평
이승우
이미경
서동민
성원경
Original Assignee
한국과학기술정보연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술정보연구원 filed Critical 한국과학기술정보연구원
Publication of WO2012046906A1 publication Critical patent/WO2012046906A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Definitions

  • the present invention relates to an apparatus and method for providing resource retrieval information in which correlations among research subjects are displayed by using a knowledge base integrating multiple resources. More specifically, the present invention relates to a relationship between technical terms and technical terms recognized in different multiple resources. After mapping and storing with integrated ontology, inferring the integrated ontology, expanding the integrated knowledge base, and receiving the technical field type and research subject type for the technical field input by the user, the integrated knowledge base Search for the technical terms for the technical field type and the technical field to obtain one or more representative research subjects corresponding to the research subject type, and resource search information of the representative research subjects for each of the acquired technical terms. After each acquisition, the correlation between the representative research subjects on the obtained resource search information Using the deduced by incorporating multiple resources provided by fusion to the obtained resource information search the knowledge base relates to resource discovery information providing apparatus and method is shown the correlation between study subjects.
  • the resource retrieval information providing apparatus is a device that collects, classifies, and accumulates information to be extracted as needed.
  • the resource retrieval information providing device is a device that quickly finds information suitable for a demand from a database accumulated in an easy-to-find form by collecting, processing, and processing information or data that is expected to be needed by an information consumer.
  • the search results output from the information retrieval device may be reported by telephone, fax or mail, and the search results may be sent online to the home or office of the requester who owns the computer via the Internet. have.
  • Reference search is the search for bibliographic references in the literature that focus on the subject that the requester wants to know.
  • the fact search is to search general data, numerical data and fact data.
  • the full-text search can search and view not only the bibliographic data but also the relevant text or the original text as needed from the database that accumulates the full text of the literature.
  • the conventional resource retrieval information providing apparatus has a limitation in that it can only present papers, research reports, patents, and the like independently of each other, and cannot present each piece of information related to science and technology.
  • search information which is a convergence of different resources, is categorized and provided according to the user's needs, so as to service convergence information by technology field necessary for research and development and research trends in the relevant technology field. There is a need to make it possible to use science and technology.
  • the present invention has been proposed to solve the above conventional problems, and an object of the present invention is to provide a converged correlation between the search information and the research subject according to the technical field type and research subject type input by the user.
  • the present invention provides an apparatus and method for providing resource retrieval information in which correlations among research subjects are displayed using a knowledge base integrating multiple resources.
  • Another object of the present invention is to provide a resource retrieval information providing the correlation between the study subjects using a knowledge base that integrates multiple resources to enable information services from various viewpoints in accordance with the user's needs by fusing different multiple resources And providing a method.
  • a technical term dictionary and context pattern information in which technical terms are defined for each technical field are stored, and the technical term is recognized in an input document by using the technical term dictionary for each resource.
  • a technical term recognition and relationship generation module for generating a relationship between the recognized technical terms using context pattern information, and mapping and storing the relation between the recognized technical terms and technical terms in an integrated ontology in different multiple resources, and storing the integrated terms.
  • Knowledge base construction module that expands the integrated knowledge base by performing inference on ontology, and if requested to provide resource retrieval information for the technical field input by the user, select the technical field type and research subject type for the technical field. Provides the type selection screen to input the technology field type and research subject type.
  • a type selection module searching the integrated knowledge base, obtaining technical terms for the technical field type and one or more representative research subjects corresponding to the research subject type for the technical field, and then representing the respective technical terms.
  • a resource search information acquisition module for acquiring resource search information of research subjects, a correlation inference module for inferring a correlation between representative research subjects on the obtained resource search information by searching the integrated knowledge base, and the obtained resource search
  • a resource retrieval information providing apparatus displaying correlations between study subjects using a knowledge base incorporating multiple resources including a resource retrieval information providing module that fuses the correlation between information and the inferred representative research subjects.
  • the database may include at least one technical field, a technical term belonging to each technical field, a technical term dictionary database storing a technical term dictionary mapped with an identifier of each technical term, a context pattern information database storing pattern information about a context between technical terms, Contains a normalization dictionary database for normalizing context.
  • the terminology recognition and relationship generation module recognizes terms by performing morphological analysis, syntax analysis, and semantic analysis on the input document, and if the recognized terms are registered in the terminology dictionary, When two or more technical terms are recognized by the term recognition unit and the technical term recognition module, the context between the recognized technical terms is extracted based on the context pattern information, and the extracted context is based on the normalized dictionary database. It includes a relationship generating unit for generating a relationship between the technical terms in a manner that normalizes.
  • the technical term recognition unit assigns a technical field and an identifier to each of the recognized technical terms.
  • the relationship generation module expresses a relationship between the extracted description term and the generated description term as a subject, a relationship name, and an object.
  • the knowledge base construction module stores the relationship between the technical terms generated in the different multiple resources or the metadata of each resource as an integrated ontology representing the connection relationship between the multiple resources.
  • the type selection screen includes a technical field type selection area for selecting a technical field type for the technical field, and a research subject type selection area for selecting a research subject type.
  • the technical field type includes at least one or more of an element technology field, a similar technology field, a competitive technology field, and a related technology field
  • the research subject type includes at least one of a country, a group, an institution, and a researcher.
  • the type selection screen includes a resource selection area or a year range designation area for selecting at least one resource of a patent, a paper, a report, an academic document, a standard, a statistics, and an electronic document.
  • the resource search information obtaining module searches only the resource search information corresponding to the resource and year range among the obtained resource search information.
  • the correlation inference module searches the integrated knowledge base and conducts collaborative research by researchers who are collaborative with researchers, different institutions to which researchers belong to the institution, and other countries to which the institutions of the partnership belong. Infer the correlation in a partnership.
  • the resource retrieval information providing module displays the resource retrieval information on a graph around the technical terms and the representative research subjects, and the resource retrieval information has a different size according to the number of resource retrieval and a correlation is displayed.
  • the model is displayed on the graph.
  • the resource search information providing module calculates and assigns a weighted value according to the ratio of each resource to resource search information obtained from the multiple resources, and calculates the calculated technical term. Provides a convergence between the resource search information of each resource and the representative research subject.
  • the resource search information providing module has an upper predetermined number of technical terms list among the technical terms acquired through the resource search information acquisition module as one axis, and the upper predetermined number of research subjects among the acquired research subjects. Create a graph with the main research subject as the other axis.
  • a method for providing resource search information in which the resource search information providing apparatus displays correlations between research subjects by using a knowledge base incorporating multiple resources, comprising: (a) a technical term dictionary for each resource; Recognizing the technical terminology in the input document by using, and generating a relationship between the recognized technical terminology using context pattern information, (b) The relationship between the recognized technical term and the technical term in different multiple resources Mapping and storing the integrated ontology and performing inference on the integrated ontology to expand the integrated knowledge base; and (c) when requested to provide resource search information on the technical field input by the user, It provides a type selection screen for selecting the type of technology field and the type of research subject.
  • the step (a) is to perform a morphological analysis, a syntax analysis, a semantic analysis on the input document to recognize a term, and if the recognized term is registered in the technical term dictionary, recognize the term as technical term, the recognition Extracting a context between the recognized descriptive terms based on the context pattern information, and extracting a context between descriptive terms in a manner of normalizing the extracted context based on a previously stored normalization dictionary. Generating.
  • the technical field type includes at least one or more of an element technology field, a similar technology field, a competitive technology field, and a related technology field
  • the research subject type includes at least one of a country, a group, an institution, and a researcher.
  • the type selection screen may include: a technical field type selection area for selecting a technical field type for the technical field, a research subject type selection area for selecting a research subject type, a resource selection area for selecting at least one resource, and a year range At least one of the designated areas.
  • step (e) when a resource is selected through the type selection screen and a year range is designated, only the resource search information corresponding to the resource and year range is searched from the obtained resource search information.
  • Correlation between the representative research subjects may be competition or cooperation.
  • the resource search information is displayed on a graph around the technical terms and the representative research subjects, and the resource search information has a different size and correlation is displayed according to the number of resource search cases.
  • the model is displayed on the graph.
  • the graph may be a graph having a predetermined number of technical term lists among the technical terms as one axis and a representative subject of a higher number as the other axis.
  • a recording medium in which a method for providing a resource retrieval information providing method in which correlations among research subjects are displayed using a knowledge base incorporating multiple resources is recorded and can be read by an electronic device.
  • the correlation between the research information and the research subject according to the technical field type and the research subject type inputted by the user is provided by fusing, the cooperation / competition relationship between the research subjects can be easily grasped.
  • FIG. 1 is a block diagram schematically illustrating an apparatus for providing resource search information in which correlations among research subjects are displayed using a knowledge base incorporating multiple resources according to an embodiment of the present invention.
  • FIG. 2 is a flowchart illustrating a method for providing a resource search information in which the resource search information providing apparatus according to an embodiment of the present invention shows correlations between research subjects by using a knowledge base incorporating multiple resources.
  • FIG. 3 is an exemplary view showing a search word input screen according to the present invention.
  • FIG 4 is an exemplary view showing a type selection screen according to the present invention.
  • FIG. 5 is an exemplary view showing a resource search information providing screen according to the present invention.
  • FIG. 1 is a block diagram schematically illustrating an apparatus for providing resource search information in which correlations among research subjects are displayed by using a knowledge base incorporating multiple resources according to an embodiment of the present invention.
  • a resource retrieval information providing device 100 displaying correlations between research subjects using a knowledge base incorporating multiple resources may include a database 110 and a technical term recognition. And a relationship generation module 120, a knowledge base construction module 130, a type selection module 150, a resource search information acquisition module 160, a correlation inference module 170, and a resource search information providing module 180. do.
  • the database 110 includes one or more technical fields, a technical term belonging to each technical field, a technical term dictionary database 112 in which a technical term dictionary mapped with an identifier of each technical term is stored, and pattern information about a context between technical terms.
  • the terminology recognition and relationship generation module 120 recognizes a terminology in an input document by using the terminology dictionary for each resource, and generates a relationship between the recognized terminology using the context pattern information.
  • the terminology recognition and relationship generation module 120 as described above includes a terminology recognition unit 122 and a relationship generation unit 124.
  • the technical term recognition unit 122 recognizes terms by performing morphological analysis, syntax analysis, and semantic analysis on the input document, and recognizes the technical terms when the recognized terms are registered in the technical term dictionary. In this case, the technical term recognition unit 122 assigns a technical field and an identifier to each recognized technical term.
  • the relationship generator 124 extracts a context between the recognized technical terms based on the context pattern information, and extracts the normalized dictionary database. On the basis of 116, the relation between the technical terms is generated by normalizing the extracted context.
  • the terminology recognition unit 122 recognizes the terminology of the notebook, monitor, SSD, mobile processor in the sentence.
  • the relationship generation unit 124 extracts only the contexts matching the pre-stored context pattern information, for example, "Be verb + past participle type + preposition".
  • the relationship generation unit 124 then unifies the tense of the context into “be” and “be” based on the normalization dictionary, and similar expressions, for example, “similar to” and “similar with”. Contextual normalization, such as unification to ", is performed to create relationships between descriptive terms.
  • the relationship generating unit 9224 expresses the relationship between the extracted technical term and the generated technical term as a subject, a predicate, and an object.
  • the technical term recognition and relationship generation module 120 is a method for generating the technical term recognition and relationship is made for each resource, where the resource refers to patents, articles, reports, academic data, standards, statistics, electronic documents, and the like.
  • the knowledge base construction module 130 maps and stores the relationship between the technical term and the technical term recognized in the technical term recognition and relationship generation module 120 as an integrated ontology in different multiple resources, and infers the integrated ontology. Extend the integrated knowledge base by doing
  • the knowledge base construction module 130 stores the relationship between the technical terms generated in the different multiple resources or metadata of each resource as an integrated ontology represented as a connection relationship between the multiple resources.
  • the integrated knowledge base generated by the knowledge base building module 130 is stored in the knowledge base DB 140.
  • the type selection module 150 When the type selection module 150 is requested to provide resource search information for a technical field input by a user, the type selection module 150 provides a type selection screen for selecting a technical field type and a research subject type for the technical field. Enter the type and research subject type. That is, the type selection module 150 provides a type selection screen for selecting a technology field type and a research subject type for the technology field when a user inputs a technology field to search for.
  • the type selection screen may include: a technical field type selection area for selecting a technical field type for the technical field, a research subject type selection area for selecting a research subject type, a resource selection area for selecting at least one resource, and a year range It includes a designated area.
  • the user may input a technical field type and a research subject type through the type selection screen, and additionally specify a resource selection or a year range.
  • the technical field type includes at least one or more of the element technology field, similar technology field, competition technology field, related technology field, and the research subject type includes at least one of a country, a group, an institution, and a researcher.
  • the resources refer to patents, articles, reports, scholarly articles, standards, statistics, electronic documents and the like.
  • the resource retrieval information acquisition module 160 searches the integrated knowledge base to cover technical terms for the technical field type and the technical field, and acquires one or more representative research subjects corresponding to the research subject type. Obtain resource retrieval information of representative research subjects for each technical term.
  • the resource search information acquisition module 160 searches the integrated knowledge base to obtain technical terms for the technical field type, and extracts a predetermined number of technical terms from the obtained technical terms.
  • the resource search information acquisition module 160 searches the integrated knowledge base to deal with the technical field, search for research subjects corresponding to the research subject type, and select a predetermined number of research subjects among the searched research subjects. Acquired as a representative research subject.
  • the resource search information acquisition module 160 searches the knowledge base to obtain resource search information of representative research subjects for each of the acquired technical terms.
  • the resource search information obtaining module 160 searches only the resource search information corresponding to the resource and the year range among the obtained resource search information. do.
  • the correlation inference module 170 searches the integrated knowledge base and infers a correlation between representative research subjects for the resource search information acquired in the resource search information acquisition module.
  • the correlation refers to cooperation, competition, and the like.
  • the correlation inference module 170 searches the integrated knowledge base and conducts collaborative research by researchers. Different countries infer correlations with national partnerships.
  • the resource search information providing module 180 fuses and provides a correlation between the resource search information acquired by the resource search information obtaining module 160 and a representative research subject inferred by the correlation inference module 170.
  • the resource search information providing module 180 displays the resource search information on a graph around the technical terms and the representative research subjects, and the resource search information has a different size according to the number of resource search cases. At the same time, a correlation model is displayed on the graph.
  • the resource retrieval information providing module 180 has an upper predetermined number of technical terms list among the technical terms acquired through the resource retrieval information acquisition module 160 as one axis, and among the acquired research subjects. Using a predetermined number of top research subjects as a representative research subject, a graph having the representative research subject as another axis is generated, and resource search information is displayed on the graph.
  • the resource retrieval information providing module 180 calculates by assigning weights according to the ratio of each resource to the resource retrieval information obtained from the multiple resources. In addition, the correlation between the calculated technical term resource search information and the representative research subject is provided.
  • the resource search information providing module 180 has a predetermined number of technical term lists among the technical terms acquired through the resource search information obtaining module 160 as one axis, and is higher among the acquired research subjects. A number of research subjects are created and provided as a graph with the main research subject as the other axis.
  • the resource search information providing apparatus 100 configured as described above fuses the correlation between the research information and the research subject according to the technical field type and the research subject type inputted by the user, and thus the correlation between cooperation and competition among the research subjects. Make it easy to identify relationships.
  • the resource retrieval information providing apparatus 100 configured as described above extracts implicit information through text mining within multiple resources such as a paper, a patent, a report, and fuses it with explicit information such as metadata. In addition, it enables the information service from various viewpoints by uploading it to the service platform based on semantic web technology.
  • FIG. 1 is a block diagram schematically illustrating an apparatus for providing resource search information in which correlations among research subjects are displayed by using a knowledge base incorporating multiple resources according to an embodiment of the present invention.
  • a resource retrieval information providing device 100 displaying correlations between research subjects using a knowledge base incorporating multiple resources may include a database 110 and a technical term recognition. And a relationship generation module 120, a knowledge base construction module 130, a type selection module 150, a resource search information acquisition module 160, a correlation inference module 170, and a resource search information providing module 180. do.
  • the database 110 includes one or more technical fields, a technical term belonging to each technical field, a technical term dictionary database 112 in which a technical term dictionary mapped with an identifier of each technical term is stored, and pattern information about a context between technical terms.
  • the terminology recognition and relationship generation module 120 recognizes a terminology in an input document by using the terminology dictionary for each resource, and generates a relationship between the recognized terminology using the context pattern information.
  • the terminology recognition and relationship generation module 120 as described above includes a terminology recognition unit 122 and a relationship generation unit 124.
  • the technical term recognition unit 122 recognizes terms by performing morphological analysis, syntax analysis, and semantic analysis on the input document, and recognizes the technical terms when the recognized terms are registered in the technical term dictionary. In this case, the technical term recognition unit 122 assigns a technical field and an identifier to each recognized technical term.
  • the relationship generator 124 extracts a context between the recognized technical terms based on the context pattern information, and extracts the normalized dictionary database. On the basis of 116, the relation between the technical terms is generated by normalizing the extracted context.
  • the terminology recognition unit 122 recognizes the terminology of the notebook, monitor, SSD, mobile processor in the sentence.
  • the relationship generation unit 124 extracts only the contexts matching the pre-stored context pattern information, for example, "Be verb + past participle type + preposition".
  • the relationship generation unit 124 then unifies the tense of the context into “be” and “be” based on the normalization dictionary, and similar expressions, for example, “similar to” and “similar with”. Contextual normalization, such as unification to ", is performed to create relationships between descriptive terms.
  • the relationship generating unit 9224 expresses the relationship between the extracted technical term and the generated technical term as a subject, a predicate, and an object.
  • the technical term recognition and relationship generation module 120 is a method for generating the technical term recognition and relationship is made for each resource, where the resource refers to patents, articles, reports, academic data, standards, statistics, electronic documents, and the like.
  • the knowledge base construction module 130 maps and stores the relationship between the technical term and the technical term recognized in the technical term recognition and relationship generation module 120 as an integrated ontology in different multiple resources, and infers the integrated ontology. Extend the integrated knowledge base by doing
  • the knowledge base construction module 130 stores the relationship between the technical terms generated in the different multiple resources or metadata of each resource as an integrated ontology represented as a connection relationship between the multiple resources.
  • the integrated knowledge base generated by the knowledge base building module 130 is stored in the knowledge base DB 140.
  • the type selection module 150 When the type selection module 150 is requested to provide resource search information for a technical field input by a user, the type selection module 150 provides a type selection screen for selecting a technical field type and a research subject type for the technical field. Enter the type and research subject type. That is, the type selection module 150 provides a type selection screen for selecting a technology field type and a research subject type for the technology field when a user inputs a technology field to search for.
  • the type selection screen may include: a technical field type selection area for selecting a technical field type for the technical field, a research subject type selection area for selecting a research subject type, a resource selection area for selecting at least one resource, and a year range It includes a designated area.
  • the user may input a technical field type and a research subject type through the type selection screen, and additionally specify a resource selection or a year range.
  • the technical field type includes at least one or more of the element technology field, similar technology field, competition technology field, related technology field, and the research subject type includes at least one of a country, a group, an institution, and a researcher.
  • the resources refer to patents, articles, reports, scholarly articles, standards, statistics, electronic documents and the like.
  • the resource retrieval information acquisition module 160 searches the integrated knowledge base to cover technical terms for the technical field type and the technical field, and acquires one or more representative research subjects corresponding to the research subject type. Obtain resource retrieval information of representative research subjects for each technical term.
  • the resource search information acquisition module 160 searches the integrated knowledge base to obtain technical terms for the technical field type, and extracts a predetermined number of technical terms from the obtained technical terms.
  • the resource search information acquisition module 160 searches the integrated knowledge base to deal with the technical field, search for research subjects corresponding to the research subject type, and select a predetermined number of research subjects among the searched research subjects. Acquired as a representative research subject.
  • the resource search information acquisition module 160 searches the knowledge base to obtain resource search information of representative research subjects for each of the acquired technical terms.
  • the resource search information obtaining module 160 searches only the resource search information corresponding to the resource and the year range among the obtained resource search information. do.
  • the correlation inference module 170 searches the integrated knowledge base and infers a correlation between representative research subjects for the resource search information acquired in the resource search information acquisition module.
  • the correlation refers to cooperation, competition, and the like.
  • the correlation inference module 170 searches the integrated knowledge base and conducts collaborative research by researchers. Different countries infer correlations with national partnerships.
  • the resource search information providing module 180 fuses and provides a correlation between the resource search information acquired by the resource search information obtaining module 160 and a representative research subject inferred by the correlation inference module 170.
  • the resource search information providing module 180 displays the resource search information on a graph around the technical terms and the representative research subjects, and the resource search information has a different size according to the number of resource search cases. At the same time, a correlation model is displayed on the graph.
  • the resource retrieval information providing module 180 has an upper predetermined number of technical terms list among the technical terms acquired through the resource retrieval information acquisition module 160 as one axis, and among the acquired research subjects. Using a predetermined number of top research subjects as a representative research subject, a graph having the representative research subject as another axis is generated, and resource search information is displayed on the graph.
  • the resource retrieval information providing module 180 calculates by assigning weights according to the ratio of each resource to the resource retrieval information obtained from the multiple resources. In addition, the correlation between the calculated technical term resource search information and the representative research subject is provided.
  • the resource search information providing module 180 has a predetermined number of technical term lists among the technical terms acquired through the resource search information obtaining module 160 as one axis, and is higher among the acquired research subjects. A number of research subjects are created and provided as a graph with the main research subject as the other axis.
  • the resource search information providing apparatus 100 configured as described above fuses the correlation between the research information and the research subject according to the technical field type and the research subject type inputted by the user, and thus the correlation between cooperation and competition among the research subjects. Make it easy to identify relationships.
  • the resource retrieval information providing apparatus 100 configured as described above extracts implicit information through text mining within multiple resources such as a paper, a patent, a report, and fuses it with explicit information such as metadata. In addition, it enables the information service from various viewpoints by uploading it to the service platform based on semantic web technology.
  • FIG. 2 is a flowchart illustrating a method for providing resource search information in which a correlation between research subjects is displayed by using a knowledge base including multiple resources by an apparatus for providing resource search information according to an embodiment of the present invention.
  • FIG. 4 is an exemplary diagram illustrating a search word input screen
  • FIG. 4 is an exemplary diagram illustrating a type selection screen according to the present invention
  • FIG. 5 is an exemplary diagram showing a resource search information providing screen according to the present invention.
  • the apparatus for providing resource search information recognizes a technical term in an input document by using a technical term dictionary for each resource (S200), and generates a relationship between the recognized technical terms using context pattern information. (S202). That is, terms are recognized by performing morphological analysis, syntax analysis, and semantic analysis on the input document, and when the recognized terms are registered in the technical term dictionary, they are recognized as technical terms. Then, the resource search information providing apparatus extracts a context between the recognized technical terms based on the context pattern information when the recognized technical terms are two or more, and based on the extracted normalized dictionary, the extracted contexts Create relationships between descriptive terms by normalizing them.
  • the apparatus for providing resource search information maps and stores the relationship between the technical terms and the technical terms respectively recognized in different multiple resources as an integrated ontology (S204), and performs inference about the integrated ontology to perform integrated knowledge.
  • the base is expanded (S206).
  • the resource retrieval information providing apparatus extracts internal information through text mining within multiple resources such as papers, patents, and reports, fuses it with external information such as metadata, and uploads it to a semantic web technology based service platform. Enable information services from the point of view.
  • the resource search information providing apparatus for selecting the technical field type and research subject type for the technical field
  • the type selection screen is provided to receive the technical field type and the research subject type (S210).
  • the resource search information providing apparatus provides a type selection screen 400 as shown in FIG.
  • the type selection screen 400 may include a technology field display area 410 for displaying a technology field input through a search word input screen, and a technology field for the technology field.
  • Technical field type selection area 420 for selecting a type for selecting a type
  • research subject type selection area 440 for selecting a research subject type for selecting a research subject type
  • resource selection area 460 for selecting at least one resource for selecting at least one resource
  • year range designation area ( 470) and the like may be included in the type selection screen 400.
  • the user selects one of the element technology field, the similar technology field, the competition technology field, and the related technology field in the technology field type selection area 420, and the country, organization, institution, Select one of the researchers.
  • the user may select at least one of patents, articles, reports, academic articles, standards, statistics, and electronic documents in the resource selection area 460, and designate a desired year in the year range designation area 470.
  • the resource selection area 460 is configured in the form of a slide bar for selecting two resources, it is natural that the resource selection area 460 can be in various forms for selecting a plurality of resources such as three or four.
  • the apparatus for providing resource search information searches the integrated knowledge base to obtain technical terms for the technical field type and the technical field, and to obtain one or more representative research subjects corresponding to the research subject type. (S212).
  • the resource search information providing apparatus searches the integrated knowledge base to obtain resource search information of representative research subjects for each of the acquired technical terms (S214), and searches the integrated knowledge base to obtain the obtained resources.
  • the correlation between representative research subjects for the search information is inferred (S216).
  • the correlation between the representative research subjects refers to competition, cooperation, and the like.
  • the apparatus for providing resource search information provides a fusion of the correlation between the acquired resource search information and the inferred representative research subject (S218).
  • the apparatus for providing resource retrieval information displays the resource retrieval information on a graph around the technical terms and the representative research subjects, and the resource retrieval information has a different size according to the number of resource retrieval and is correlated.
  • the model is displayed on the graph.
  • the graph may be a graph having a predetermined number of technical term lists among the technical terms as one axis and a representative subject of a higher number as the other axis.
  • a user searches for a technology field of “Smart Grid” and selects a technology field type selection area 420 of the type selection screen.
  • the "element technology field” is selected, and the "country” is selected in the research subject type selection area 440.
  • the apparatus for providing resource search information searches the integrated knowledge base to obtain technical terms for the element technology field of the "Smart Grid", and a predetermined number of technical terms "Electric Power T, Distribution MS” among the obtained technical terms. , Smart Meter, Electric City Distribution, Superconduction PC, Intelligent Monitoring S, High Penetration of CET, Demand Driver C., Electric Control, PHEV ".
  • the apparatus for providing resource search information searches the integrated knowledge base and extracts a predetermined number of countries "Italy, Australia, the United Kingdom, the United States, and Korea” from among the countries covering the "Smart Grid” technology field as representative research subjects. .
  • the resource search information providing apparatus searches the knowledge base to obtain resource search information of representative research subjects for each extracted technical term, and competes and cooperates among the representative research subjects for the obtained resource search information. Infer the correlation, etc.
  • the apparatus for providing resource search information generates a graph with the obtained technical terms 430 as the Y axis, the representative research subjects 450 as the X axis, and the obtained resource search information. Display on the generated graph.
  • the resource search information is displayed on the graph in a circle having a different size and correlations according to the number of resource searches.
  • the shape can be varied.
  • the research subjects are displayed in different colors according to cooperation or competition, the correlation may be displayed in various ways such as text and other models.
  • the apparatus for providing resource retrieval information provides a convergence of the correlation between the search information and the research subject according to the technical field type and the research subject type inputted by the user, thereby facilitating the correlation between cooperation and competition among the research subjects. Make it understandable.
  • an apparatus and method for providing resource retrieval information in which correlations among research subjects are displayed by using a knowledge base incorporating multiple resources of the present invention is search information and research subject according to the technical field type and research subject type inputted by a user. It is suitable for the high necessity to easily identify the cooperation / competition relationship among study subjects by fusing and providing the correlation between them.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

The present invention relates to a device and method for providing resource search information on marked correlations between research bodies using a knowledge base from a combination of multiple resources. The invention comprises a database having stored information on a technical terminology dictionary which defines technical terms for each technical field and context patterns; a technical term recognition and relationship generation module for recognizing, by resource, technical terms in an input document using the technical terminology dictionary and for generating relationships between the recognized technical terms using the context pattern information; a knowledge base construction module for mapping and storing, as integrated ontologies, the recognized technical terms and relationships between the technical terms from multiple resources which are different from one another, and for expanding an integrated knowledge base, by performing inference over the integrated ontologies; a type selection module for receiving the type of resource and the type of research body inputted using a type selection screen provided for selection of the type of resource and the type of research body in a technology field when a user inputs a request to provide resource search information in the technology field; a resource search information acquisition module for obtaining one or more representative research bodies corresponding to the type of research body in the technology field and then obtaining resource search information, on the obtained representative research bodies, corresponding to the inputted type of resource, by searching the integrated knowledge base; and a correlation deducing module for making a deduction on the correlation between representative research bodies from resource search information obtained from the search of the integrated knowledge base; and resource search information providing module which provides a combination of deduced correlations between representative research bodies obtained from the resource search information. Therefore, according to the present invention, the relationships of cooperation / competition between research bodies can be easily identified by providing a combination of correlations between research bodies and the search information on the type of technology field and type of research body inputted by a user.

Description

다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치 및 방법Apparatus and method for providing resource retrieval information showing correlations among research subjects using knowledge base that integrates multiple resources
본 발명은 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치 및 방법에 관한 것으로서, 더욱 상세하게는 서로 다른 다중 자원에서 인식된 기술용어와 기술용어간의 관계를 통합 온톨로지로 매핑하여 저장하고, 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장한 후, 사용자에 의해 입력된 기술분야에 대한 기술분야유형 및 연구주체유형을 입력받는 경우, 상기 통합 지식베이스를 검색하여 상기 기술분야유형에 대한 기술용어들 및 상기 기술분야를 다루며 상기 연구주체유형에 해당하는 하나 이상의 대표 연구주체를 획득하고, 상기 획득된 각 기술용어에 대한 대표 연구주체들의 자원검색 정보를 각각 획득한 후, 상기 획득된 자원검색 정보에 대한 대표 연구주체간의 상관관계를 추론하여 상기 획득된 자원검색 정보와 융합하여 제공하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치 및 방법에 관한 것이다. The present invention relates to an apparatus and method for providing resource retrieval information in which correlations among research subjects are displayed by using a knowledge base integrating multiple resources. More specifically, the present invention relates to a relationship between technical terms and technical terms recognized in different multiple resources. After mapping and storing with integrated ontology, inferring the integrated ontology, expanding the integrated knowledge base, and receiving the technical field type and research subject type for the technical field input by the user, the integrated knowledge base Search for the technical terms for the technical field type and the technical field to obtain one or more representative research subjects corresponding to the research subject type, and resource search information of the representative research subjects for each of the acquired technical terms. After each acquisition, the correlation between the representative research subjects on the obtained resource search information Using the deduced by incorporating multiple resources provided by fusion to the obtained resource information search the knowledge base relates to resource discovery information providing apparatus and method is shown the correlation between study subjects.
일반적으로 자원검색 정보 제공 장치는 정보를 수집/분류/축적하여 필요에 따라 추출할 수 있도록 하는 장치이다.In general, the resource retrieval information providing apparatus is a device that collects, classifies, and accumulates information to be extracted as needed.
정보화 사회에 있어서 인간의 지적 활동에 필요 불가결한 행위의 하나는 첨단과학기술에 의존한 정보의 수집과 축적 및 검색과 이용이라고 할 수 있다. 개인적으로는 필요한 정보나 데이터를 보다 신속, 정확하게 입수하여 연구개발이나 의사결정에 활용할 수 있는 방법을 모색하고, 사회적으로는 사회 각 부문에서의 다양한 정보요구를 충족시킬 수 있는 방법이 필요하다. 그러므로, 정보검색으로 충족시킬 수 있는 자원검색 정보 제공 장치를 어떻게 구축, 유지, 운영하느냐가 중요하다.One of the indispensable actions of human intellectual activity in the information society is the collection, accumulation, retrieval and use of information based on advanced science and technology. Personally, we need to find ways to obtain necessary information and data more quickly and accurately and to use it for R & D or decision making. Socially, we need a way to meet various information needs in each sector of society. Therefore, how to construct, maintain, and operate a resource retrieval information providing apparatus that can be satisfied by information retrieval is important.
그래서 자원검색 정보 제공 장치는 정보 수요자가 필요하다고 예측되는 정보나 데이터를 미리 수집, 가공, 처리하여 찾기 쉬운 형태로 축적해 놓은 데이터베이스로부터 요구에 적합한 정보를 신속하게 찾아내어 정보 요구자에게 제공하는 장치를 말한다. 이러한 형태에는 정보 검색장치에서 출력된 검색결과를 전화로 알려주거나 팩스로 전송하거나 또는 우송하는 경우가 있고, 인터넷을 통해 컴퓨터를 보유하고 있는 요구자의 가정이나 사무실에 온라인으로 검색결과를 전송해 줄 수 있다.Therefore, the resource retrieval information providing device is a device that quickly finds information suitable for a demand from a database accumulated in an easy-to-find form by collecting, processing, and processing information or data that is expected to be needed by an information consumer. Say. In this form, the search results output from the information retrieval device may be reported by telephone, fax or mail, and the search results may be sent online to the home or office of the requester who owns the computer via the Internet. have.
그리고 데이터베이스에 축적되어 있는 정보의 종류에 따라 참조검색/사실검색/전문(full-text)검색으로 구분된다. 참조검색은 요구자가 알고자 하는 주제를 핵심적으로 다루고 있는 문헌의 서지사항을 검색하는 것이다. 사실검색은 일반데이터나 수치데이터 및 사실데이터를 검색할 수 있는 것이다. 전문검색은 문헌의 전문을 축적해 놓은 데이터베이스로부터 서지적 데이터뿐만 아니라 해당문장이나 원문 전부를 필요에 따라 검색해서 볼 수 있는 것이다.It is divided into reference search, fact search, and full-text search according to the kind of information accumulated in the database. Reference search is the search for bibliographic references in the literature that focus on the subject that the requester wants to know. The fact search is to search general data, numerical data and fact data. The full-text search can search and view not only the bibliographic data but also the relevant text or the original text as needed from the database that accumulates the full text of the literature.
그러나 종래의 자원검색 정보 제공 장치는 논문, 연구보고서, 특허 등을 서로 독립적으로 그 자체만 제시할 뿐 과학기술과 관련된 이들 각각의 정보들을 융합하여 제시하지는 못하는 한계가 있었다.However, the conventional resource retrieval information providing apparatus has a limitation in that it can only present papers, research reports, patents, and the like independently of each other, and cannot present each piece of information related to science and technology.
따라서 정보의 홍수 속에서 서로 다른 다중 자원을 융합한 검색 정보를 사용자의 요구에 따라 기술분야별로 분류하여 제공함으로써 해당 기술분야에 대한 연구개발과 연구동향 파악에 필요한 기술분야별 융합 정보를 서비스하여 시기적절하게 과학기술을 활용할 수 있도록 할 필요성이 대두되었다.Therefore, in the flood of information, search information, which is a convergence of different resources, is categorized and provided according to the user's needs, so as to service convergence information by technology field necessary for research and development and research trends in the relevant technology field. There is a need to make it possible to use science and technology.
본 발명은 상기와 같은 종래의 제반 문제점을 해결하기 위해 제안된 것으로, 본 발명의 목적은 사용자에 의해 입력된 기술분야유형 및 연구주체유형에 따른 검색 정보와 연구주체간의 상관관계를 융합하여 제공하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치 및 방법을 제공하는데 있다. The present invention has been proposed to solve the above conventional problems, and an object of the present invention is to provide a converged correlation between the search information and the research subject according to the technical field type and research subject type input by the user. The present invention provides an apparatus and method for providing resource retrieval information in which correlations among research subjects are displayed using a knowledge base integrating multiple resources.
본 발명의 다른 목적은 서로 다른 다중 자원을 융합하여 사용자의 요구에 따라 다양한 관점에서의 정보 서비스를 가능하게 하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치 및 방법을 제공하는데 있다.Another object of the present invention is to provide a resource retrieval information providing the correlation between the study subjects using a knowledge base that integrates multiple resources to enable information services from various viewpoints in accordance with the user's needs by fusing different multiple resources And providing a method.
본 발명의 한 측면에 따르면, 각 기술분야에 대한 기술용어가 정의된 기술용어 사전 및 문맥 패턴 정보가 저장된 데이터베이스, 각 자원별로 상기 기술용어 사전을 이용하여 입력 문서에서의 기술용어를 인식하고, 상기 문맥 패턴 정보를 이용하여 상기 인식된 기술용어간의 관계를 생성하는 기술용어 인식 및 관계 생성 모듈, 서로 다른 다중 자원에서 상기 인식된 기술용어와 기술용어간의 관계를 통합 온톨로지로 매핑하여 저장하고, 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장하는 지식베이스 구축 모듈, 사용자에 의해 입력된 기술분야에 대한 자원 검색 정보 제공이 요청된 경우, 상기 기술분야에 대한 기술분야유형 및 연구주체유형을 선택하기 위한 유형 선택 화면을 제공하여 기술분야유형 및 연구주체유형을 입력받는 유형 선택 모듈, 상기 통합 지식베이스를 검색하여 상기 기술분야유형에 대한 기술용어들 및 상기 기술분야에 대해 상기 연구주체유형에 해당하는 하나 이상의 대표 연구주체를 획득한 후, 상기 각 기술용어에 대한 대표 연구주체들의 자원검색 정보를 각각 획득하는 자원검색 정보 획득 모듈, 상기 통합 지식베이스를 검색하여 상기 획득된 자원검색 정보에 대한 대표 연구주체간의 상관관계를 추론하는 상관관계 추론 모듈, 상기 획득된 자원검색 정보와 상기 추론된 대표 연구주체간의 상관관계를 융합하여 제공하는 자원검색 정보 제공 모듈을 포함하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치가 제공된다. According to an aspect of the present invention, a technical term dictionary and context pattern information in which technical terms are defined for each technical field are stored, and the technical term is recognized in an input document by using the technical term dictionary for each resource. A technical term recognition and relationship generation module for generating a relationship between the recognized technical terms using context pattern information, and mapping and storing the relation between the recognized technical terms and technical terms in an integrated ontology in different multiple resources, and storing the integrated terms. Knowledge base construction module that expands the integrated knowledge base by performing inference on ontology, and if requested to provide resource retrieval information for the technical field input by the user, select the technical field type and research subject type for the technical field. Provides the type selection screen to input the technology field type and research subject type. A type selection module, searching the integrated knowledge base, obtaining technical terms for the technical field type and one or more representative research subjects corresponding to the research subject type for the technical field, and then representing the respective technical terms. A resource search information acquisition module for acquiring resource search information of research subjects, a correlation inference module for inferring a correlation between representative research subjects on the obtained resource search information by searching the integrated knowledge base, and the obtained resource search Provided is a resource retrieval information providing apparatus displaying correlations between study subjects using a knowledge base incorporating multiple resources including a resource retrieval information providing module that fuses the correlation between information and the inferred representative research subjects.
상기 데이터베이스는 하나 이상의 기술분야, 각 기술분야에 속하는 기술용어, 각 기술용어의 식별자가 매핑된 기술용어 사전이 저장된 기술용어 사전 데이터베이스, 기술용어 사이의 문맥에 대한 패턴 정보가 저장된 문맥 패턴 정보 데이터베이스, 문맥을 정규화하기 위한 정규화 사전 데이터베이스를 포함한다. The database may include at least one technical field, a technical term belonging to each technical field, a technical term dictionary database storing a technical term dictionary mapped with an identifier of each technical term, a context pattern information database storing pattern information about a context between technical terms, Contains a normalization dictionary database for normalizing context.
상기 기술용어 인식 및 관계 생성 모듈은 상기 입력 문서에 대해 형태소 분석, 구문 분석, 의미 분석을 수행하여 용어를 인식하고, 상기 인식된 용어가 상기 기술용어 사전에 등록된 경우, 기술용어로 인식하는 기술용어 인식부, 상기 기술용어 인식 모듈에서 2개 이상의 기술용어가 인식된 경우, 상기 문맥 패턴 정보를 근거로 상기 인식된 기술용어 사이의 문맥을 추출하고, 상기 정규화 사전 데이터베이스를 근거로 상기 추출된 문맥을 정규화하는 방식으로 기술용어간의 관계를 생성하는 관계 생성부를 포함한다. The terminology recognition and relationship generation module recognizes terms by performing morphological analysis, syntax analysis, and semantic analysis on the input document, and if the recognized terms are registered in the terminology dictionary, When two or more technical terms are recognized by the term recognition unit and the technical term recognition module, the context between the recognized technical terms is extracted based on the context pattern information, and the extracted context is based on the normalized dictionary database. It includes a relationship generating unit for generating a relationship between the technical terms in a manner that normalizes.
상기 기술용어 인식부는 상기 인식된 각 기술용어에 기술분야 및 식별자를 부여한다.The technical term recognition unit assigns a technical field and an identifier to each of the recognized technical terms.
상기 관계 생성 모듈은 상기 추출된 기술용어와 상기 생성된 기술용어간의 관계를 주체(Subject), 관계명(Predicate), 객체(Object)로 표현한다.The relationship generation module expresses a relationship between the extracted description term and the generated description term as a subject, a relationship name, and an object.
상기 지식베이스 구축 모듈은 상기 서로 다른 다중 자원에서 생성된 기술용어간의 관계 또는 각 자원의 메타 데이터를 다중 자원간의 연결관계를 표현한 통합 온톨로지로 저장한다.The knowledge base construction module stores the relationship between the technical terms generated in the different multiple resources or the metadata of each resource as an integrated ontology representing the connection relationship between the multiple resources.
상기 유형 선택 화면은 상기 기술분야에 대한 기술분야유형을 선택하기 위한 기술분야유형 선택 영역, 연구주체유형을 선택하기 위한 연구주체유형 선택 영역을 포함한다.The type selection screen includes a technical field type selection area for selecting a technical field type for the technical field, and a research subject type selection area for selecting a research subject type.
상기 기술분야유형은 요소기술분야, 유사기술분야, 경쟁기술분야, 연관기술분야 중 적어도 하나 이상을 포함하고, 상기 연구주체유형은 국가, 단체, 기관, 연구자 중 적어도 하나를 포함한다.The technical field type includes at least one or more of an element technology field, a similar technology field, a competitive technology field, and a related technology field, and the research subject type includes at least one of a country, a group, an institution, and a researcher.
상기 유형 선택 화면은 특허, 논문, 보고서, 학술자료, 표준, 통계, 전자 문서 중 적어도 하나의 자원을 선택하기 위한 자원 선택 영역 또는 연도범위 지정영역을 포함한다.The type selection screen includes a resource selection area or a year range designation area for selecting at least one resource of a patent, a paper, a report, an academic document, a standard, a statistics, and an electronic document.
상기 자원검색 정보 획득 모듈은 상기 유형 선택 화면을 통해 자원이 선택되고, 연도범위가 지정된 경우, 상기 획득된 자원검색 정보 중에서 상기 자원 및 연도 범위에 해당하는 자원검색 정보만을 검색한다.When a resource is selected through the type selection screen and a year range is designated, the resource search information obtaining module searches only the resource search information corresponding to the resource and year range among the obtained resource search information.
상기 상관관계 추론 모듈은 상기 통합 지식베이스를 검색하여 공동 연구를 한 연구자들은 연구자 협력 관계, 협력 관계의 연구자가 소속된 서로 다른 기관들은 기관 협력 관계, 협력관계의 기관이 소속된 서로 다른 국가들은 국가 협력 관계로 상관관계를 추론한다.The correlation inference module searches the integrated knowledge base and conducts collaborative research by researchers who are collaborative with researchers, different institutions to which researchers belong to the institution, and other countries to which the institutions of the partnership belong. Infer the correlation in a partnership.
상기 자원검색정보 제공 모듈은 상기 자원 검색 정보를 상기 기술용어들과 상기 대표 연구주체들을 축으로 하는 그래프상에 표시하되, 상기 자원 검색 정보는 자원 검색 건수에 따라 다른 크기를 갖는 동시에 상관관계가 표시되는 모형으로 상기 그래프상에 표시된다.The resource retrieval information providing module displays the resource retrieval information on a graph around the technical terms and the representative research subjects, and the resource retrieval information has a different size according to the number of resource retrieval and a correlation is displayed. The model is displayed on the graph.
상기 자원검색정보 제공 모듈은 상기 유형 선택 화면을 통해 자원에 대한 비율이 선택된 경우, 상기 다중 자원들로부터 획득된 자원검색정보에 각 자원의 비율에 따른 가중치를 부여하여 연산하고, 그 연산된 기술용어별 자원 검색 정보와 상기 대표 연구주체간의 상관관계를 융합하여 제공한다.When the ratio of resources is selected through the type selection screen, the resource search information providing module calculates and assigns a weighted value according to the ratio of each resource to resource search information obtained from the multiple resources, and calculates the calculated technical term. Provides a convergence between the resource search information of each resource and the representative research subject.
또한, 상기 자원 검색 정보 제공 모듈은 상기 자원 검색 정보 획득 모듈을 통해 획득된 기술용어들 중에서 상위 일정 개수의 기술용어 목록을 한 축으로 하고, 상기 획득된 연구주체들 중에서 상위 일정 개수의 연구주체들을 대표연구주체를 다른 한 축으로 하는 그래프를 생성한다.In addition, the resource search information providing module has an upper predetermined number of technical terms list among the technical terms acquired through the resource search information acquisition module as one axis, and the upper predetermined number of research subjects among the acquired research subjects. Create a graph with the main research subject as the other axis.
본 발명의 다른 측면에 따르면, 자원검색 정보 제공 장치가 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보를 제공하는 방법에 있어서, (a) 각 자원별로 기술용어 사전을 이용하여 입력 문서에서의 기술용어를 인식하고, 문맥 패턴 정보를 이용하여 상기 인식된 기술용어간의 관계를 생성하는 단계, (b) 서로 다른 다중 자원에서 상기 인식된 기술용어와 기술용어간의 관계를 통합 온톨로지로 매핑하여 저장하고, 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장하는 단계, (c) 사용자에 의해 입력된 기술분야에 대한 자원 검색 정보 제공이 요청된 경우, 상기 기술분야에 대한 기술분야유형 및 연구주체유형을 선택하기 위한 유형 선택 화면을 제공하여 기술분야유형 및 연구주체유형을 입력받는 단계, (d) 상기 통합 지식베이스를 검색하여 상기 기술분야유형에 대한 기술용어들 및 상기 기술분야에 대해 상기 연구주체유형에 해당하는 하나 이상의 대표 연구주체를 획득하는 단계, (e) 상기 통합 지식베이스를 검색하여 상기 획득된 각 기술용어에 대한 대표 연구주체들의 자원검색 정보를 각각 획득하는 단계, (f) 상기 통합 지식베이스를 검색하여 상기 획득된 자원검색 정보에 대한 대표 연구주체간의 상관관계를 추론하는 단계, (g) 상기 획득된 자원검색 정보와 상기 추론된 대표 연구주체간의 상관관계를 융합하여 제공하는 단계를 포함하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 방법이 제공된다. According to another aspect of the present invention, a method for providing resource search information in which the resource search information providing apparatus displays correlations between research subjects by using a knowledge base incorporating multiple resources, comprising: (a) a technical term dictionary for each resource; Recognizing the technical terminology in the input document by using, and generating a relationship between the recognized technical terminology using context pattern information, (b) The relationship between the recognized technical term and the technical term in different multiple resources Mapping and storing the integrated ontology and performing inference on the integrated ontology to expand the integrated knowledge base; and (c) when requested to provide resource search information on the technical field input by the user, It provides a type selection screen for selecting the type of technology field and the type of research subject. (D) searching the integrated knowledge base to obtain technical terms for the technical field type and one or more representative research subjects corresponding to the research subject type for the technical field, (e) the integration Acquiring resource search information of representative research subjects for each acquired technical term by searching a knowledge base; and (f) correlation between representative research subjects for the acquired resource search information by searching the integrated knowledge base. Deriving the correlation between the research subjects by using a knowledge base incorporating multiple resources, comprising: inferring and fusing and providing a correlation between the obtained resource search information and the inferred representative research subject. A method for providing resource search information is provided.
상기 (a) 단계는 상기 입력 문서에 대해 형태소 분석, 구문 분석, 의미 분석을 수행하여 용어를 인식하고, 상기 인식된 용어가 상기 기술용어 사전에 등록된 경우, 기술용어로 인식하는 단계, 상기 인식된 기술용어가 2개 이상인 경우, 상기 문맥 패턴 정보를 근거로 상기 인식된 기술용어 사이의 문맥을 추출하는 단계, 기 저장된 정규화 사전을 근거로 상기 추출된 문맥을 정규화하는 방식으로 기술용어간의 관계를 생성하는 단계를 포함한다.The step (a) is to perform a morphological analysis, a syntax analysis, a semantic analysis on the input document to recognize a term, and if the recognized term is registered in the technical term dictionary, recognize the term as technical term, the recognition Extracting a context between the recognized descriptive terms based on the context pattern information, and extracting a context between descriptive terms in a manner of normalizing the extracted context based on a previously stored normalization dictionary. Generating.
상기 기술분야유형은 요소기술분야, 유사기술분야, 경쟁기술분야, 연관기술분야 중 적어도 하나 이상을 포함하고, 상기 연구주체유형은 국가, 단체, 기관, 연구자 중 적어도 하나를 포함한다.The technical field type includes at least one or more of an element technology field, a similar technology field, a competitive technology field, and a related technology field, and the research subject type includes at least one of a country, a group, an institution, and a researcher.
상기 유형 선택 화면은 상기 기술분야에 대한 기술분야유형을 선택하기 위한 기술분야유형 선택 영역, 연구주체유형을 선택하기 위한 연구주체유형 선택 영역, 적어도 하나의 자원을 선택하기 위한 자원 선택 영역, 연도범위 지정영역 중 적어도 하나를 포함한다.The type selection screen may include: a technical field type selection area for selecting a technical field type for the technical field, a research subject type selection area for selecting a research subject type, a resource selection area for selecting at least one resource, and a year range At least one of the designated areas.
상기 (e) 단계는 상기 유형 선택 화면을 통해 자원이 선택되고, 연도범위가 지정된 경우, 상기 획득된 자원검색 정보 중에서 상기 자원 및 연도 범위에 해당하는 자원검색 정보만을 검색한다.In step (e), when a resource is selected through the type selection screen and a year range is designated, only the resource search information corresponding to the resource and year range is searched from the obtained resource search information.
상기 대표 연구주체간의 상관관계는 경쟁 또는 협력 관계일 수 있다.Correlation between the representative research subjects may be competition or cooperation.
상기 (g) 단계는 상기 자원 검색 정보를 상기 기술용어들과 상기 대표 연구주체들을 축으로 하는 그래프상에 표시하되, 상기 자원 검색 정보는 자원 검색 건수에 따라 다른 크기를 갖는 동시에 상관관계가 표시되는 모형으로 상기 그래프상에 표시된다.In the step (g), the resource search information is displayed on a graph around the technical terms and the representative research subjects, and the resource search information has a different size and correlation is displayed according to the number of resource search cases. The model is displayed on the graph.
상기 그래프는 상기 기술용어들 중에서 상위 일정 개수의 기술용어 목록을 한 축으로 하고, 상위 일정 개수의 대표 연구주체를 다른 한 축으로 한 그래프일 수 있다.The graph may be a graph having a predetermined number of technical term lists among the technical terms as one axis and a representative subject of a higher number as the other axis.
본 발명의 또 다른 측면에 따르면, 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 방법을 수행하는 프로그램이 기록되고 전자 장치에서 판독 가능한 기록 매체가 제공된다.According to another aspect of the present invention, there is provided a recording medium in which a method for providing a resource retrieval information providing method in which correlations among research subjects are displayed using a knowledge base incorporating multiple resources is recorded and can be read by an electronic device.
본 발명에 따르면, 사용자에 의해 입력된 기술분야유형 및 연구주체유형에 따른 검색 정보와 연구주체간의 상관관계를 융합하여 제공하므로, 연구주체간의 협력/경쟁 관계를 용이하게 파악할 수 있다.According to the present invention, since the correlation between the research information and the research subject according to the technical field type and the research subject type inputted by the user is provided by fusing, the cooperation / competition relationship between the research subjects can be easily grasped.
또한, 서로 다른 다중 자원을 융합하여 사용자의 요구에 따라 다양한 관점에서의 정보 서비스가 가능하고, 의사 결정을 지원하기 위한 여러 서비스들을 제공함으로써 단편적 지식에 의한 의사 결정 오류를 방지하고 정확한 결정이 가능한 효과가 있다.In addition, by combining multiple different resources, it is possible to provide information service from various viewpoints according to user's needs, and provide various services to support decision-making, thereby preventing decision errors due to fragmentary knowledge and making accurate decisions. There is.
도 1은 본 발명의 실시예에 따른 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치를 개략적으로 나타낸 블럭도. 1 is a block diagram schematically illustrating an apparatus for providing resource search information in which correlations among research subjects are displayed using a knowledge base incorporating multiple resources according to an embodiment of the present invention.
도 2는 본 발명의 실시예에 따른 자원검색 정보 제공 장치가 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보를 제공하는 방법을 나타낸 흐름도.2 is a flowchart illustrating a method for providing a resource search information in which the resource search information providing apparatus according to an embodiment of the present invention shows correlations between research subjects by using a knowledge base incorporating multiple resources.
도 3은 본 발명에 따른 검색어 입력 화면을 나타낸 예시도, 3 is an exemplary view showing a search word input screen according to the present invention;
도 4는 본 발명에 따른 유형 선택 화면을 나타낸 예시도.4 is an exemplary view showing a type selection screen according to the present invention.
도 5는 본 발명에 따른 자원 검색 정보 제공 화면을 나타낸 예시도.5 is an exemplary view showing a resource search information providing screen according to the present invention.
본 발명의 전술한 목적과 기술적 구성 및 그에 따른 작용 효과에 관한 자세한 사항은 본 발명의 명세서에 첨부된 도면에 의거한 이하 상세한 설명에 의해 보다 명확하게 이해될 것이다.Details of the above-described objects and technical configurations of the present invention and the effects thereof according to the present invention will be more clearly understood by the following detailed description based on the accompanying drawings.
도 1은 본 발명의 실시예에 따른 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치를 개략적으로 나타낸 블럭도이다. 1 is a block diagram schematically illustrating an apparatus for providing resource search information in which correlations among research subjects are displayed by using a knowledge base incorporating multiple resources according to an embodiment of the present invention.
도 1을 참조하면, 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치(이하 자원검색 정보 제공 장치로 칭함)(100)는 데이터베이스(110), 기술용어 인식 및 관계 생성 모듈(120), 지식베이스 구축 모듈(130), 유형 선택 모듈(150), 자원검색 정보 획득 모듈(160), 상관관계 추론 모듈(170), 자원 검색정보 제공 모듈(180)을 포함한다. Referring to FIG. 1, a resource retrieval information providing device (hereinafter referred to as a resource retrieval information providing device) 100 displaying correlations between research subjects using a knowledge base incorporating multiple resources may include a database 110 and a technical term recognition. And a relationship generation module 120, a knowledge base construction module 130, a type selection module 150, a resource search information acquisition module 160, a correlation inference module 170, and a resource search information providing module 180. do.
상기 데이터 베이스(110)는 하나 이상의 기술분야, 각 기술분야에 속하는 기술용어, 각 기술용어의 식별자가 매핑된 기술용어 사전이 저장된 기술용어 사전 데이터베이스(112), 기술용어 사이의 문맥에 대한 패턴 정보가 저장된 문맥 패턴 정보 데이터베이스(114), 문맥을 정규화하기 위한 정규화 사전 데이터베이스(116)를 포함한다. The database 110 includes one or more technical fields, a technical term belonging to each technical field, a technical term dictionary database 112 in which a technical term dictionary mapped with an identifier of each technical term is stored, and pattern information about a context between technical terms. A context pattern information database 114 stored therein, and a normalization dictionary database 116 for normalizing the context.
상기 기술용어 인식 및 관계 생성 모듈(120)은 각 자원별로 상기 기술용어 사전을 이용하여 입력 문서에서의 기술용어를 인식하고, 상기 문맥 패턴 정보를 이용하여 상기 인식된 기술용어간의 관계를 생성한다. The terminology recognition and relationship generation module 120 recognizes a terminology in an input document by using the terminology dictionary for each resource, and generates a relationship between the recognized terminology using the context pattern information.
상기와 같은 기술용어 인식 및 관계 생성 모듈(120)은 기술용어 인식부(122)와 관계 생성부(124)로 구성된다. The terminology recognition and relationship generation module 120 as described above includes a terminology recognition unit 122 and a relationship generation unit 124.
상기 기술용어 인식부(122)는 상기 입력 문서에 대해 형태소 분석, 구문 분석, 의미 분석을 수행하여 용어를 인식하고, 상기 인식된 용어가 상기 기술용어 사전에 등록된 경우, 기술용어로 인식한다. 이때, 상기 기술용어 인식부(122)는 상기 인식된 각 기술용어에 기술분야 및 식별자를 부여한다.The technical term recognition unit 122 recognizes terms by performing morphological analysis, syntax analysis, and semantic analysis on the input document, and recognizes the technical terms when the recognized terms are registered in the technical term dictionary. In this case, the technical term recognition unit 122 assigns a technical field and an identifier to each recognized technical term.
상기 관계 생성부(124)는 상기 기술용어 인식부(122)에서 2개 이상의 기술용어가 인식된 경우, 상기 문맥 패턴 정보를 근거로 상기 인식된 기술용어 사이의 문맥을 추출하고, 상기 정규화 사전 데이터베이스(116)를 근거로 상기 추출된 문맥을 정규화하는 방식으로 기술용어간의 관계를 생성한다.When two or more technical terms are recognized by the technical term recognition unit 122, the relationship generator 124 extracts a context between the recognized technical terms based on the context pattern information, and extracts the normalized dictionary database. On the basis of 116, the relation between the technical terms is generated by normalizing the extracted context.
예를 들어, "notebook consists of monitor, SSD, and mobile processor" 문장의 경우, 상기 기술용어 인식부(122)는 상기 문장에서 notebook, monitor, SSD, mobile processor의 기술용어를 인식하게 된다. For example, in the case of a "notebook consists of monitor, SSD, and mobile processor" sentence, the terminology recognition unit 122 recognizes the terminology of the notebook, monitor, SSD, mobile processor in the sentence.
이때, 2개 이상의 기술용어가 인식되었으므로, 상기 관계 생성부(124)는 기 저장된 문맥 패턴 정보 예를 들면, "Be동사 + 과거분사형 + 전치사"에 부합하는 문맥만을 추출한다.In this case, since two or more technical terms have been recognized, the relationship generation unit 124 extracts only the contexts matching the pre-stored context pattern information, for example, "Be verb + past participle type + preposition".
그런 다음 상기 관계 생성부(124)는 상기 정규화 사전을 근거로 해당 문맥의 시제를 "was"를 "be"로 통일하고, 유사표현 예를 들면, “similar to"와 "similar with"를 "similar to"로 통일하는 등의 문맥 정규화를 수행하여 기술용어간의 관계를 생성한다.The relationship generation unit 124 then unifies the tense of the context into "be" and "be" based on the normalization dictionary, and similar expressions, for example, "similar to" and "similar with". Contextual normalization, such as unification to ", is performed to create relationships between descriptive terms.
상기 관계 생성부9124)는 상기 추출된 기술용어와 상기 생성된 기술용어간의 관계를 주체(Subject), 관계명(Predicate), 객체(Object)로 표현한다.The relationship generating unit 9224 expresses the relationship between the extracted technical term and the generated technical term as a subject, a predicate, and an object.
상기 기술용어 인식 및 관계 생성 모듈(120)이 기술용어 인식 및 관계를 생성하는 방법은 자원별로 이루어지고, 여기서 자원은 특허, 논문, 보고서, 학술자료, 표준, 통계, 전자 문서 등을 말한다. The technical term recognition and relationship generation module 120 is a method for generating the technical term recognition and relationship is made for each resource, where the resource refers to patents, articles, reports, academic data, standards, statistics, electronic documents, and the like.
상기 지식베이스 구축 모듈(130)은 서로 다른 다중 자원에서 상기 기술용어 인식 및 관계 생성 모듈(120)에서 인식된 기술용어와 기술용어간의 관계를 통합 온톨로지로 매핑하여 저장하고, 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장한다.The knowledge base construction module 130 maps and stores the relationship between the technical term and the technical term recognized in the technical term recognition and relationship generation module 120 as an integrated ontology in different multiple resources, and infers the integrated ontology. Extend the integrated knowledge base by doing
이때, 상기 지식베이스 구축 모듈(130)은 상기 서로 다른 다중 자원에서 생성된 기술용어간의 관계 또는 각 자원의 메타 데이터를 다중 자원간의 연결관계로 표현한 통합 온톨로지로 저장한다.At this time, the knowledge base construction module 130 stores the relationship between the technical terms generated in the different multiple resources or metadata of each resource as an integrated ontology represented as a connection relationship between the multiple resources.
상기 지식 베이스 구축 모듈(130)에 의해 생성된 통합 지식베이스는 지식 베이스 DB(140)에 저장된다.The integrated knowledge base generated by the knowledge base building module 130 is stored in the knowledge base DB 140.
상기 유형 선택 모듈(150)은 사용자에 의해 입력된 기술분야에 대한 자원 검색 정보 제공이 요청된 경우, 상기 기술분야에 대한 기술분야유형 및 연구주체유형을 선택하기 위한 유형 선택 화면을 제공하여 기술분야유형 및 연구주체유형을 입력받는다. 즉, 상기 유형 선택 모듈(150)은 사용자가 검색을 원하는 기술분야를 입력하면, 상기 기술분야에 대한 기술분야유형 및 연구주체유형을 선택하기 위한 유형 선택 화면을 제공한다. 상기 유형 선택 화면은 상기 기술분야에 대한 기술분야유형을 선택하기 위한 기술분야유형 선택 영역, 연구주체유형을 선택하기 위한 연구주체유형 선택 영역, 적어도 하나의 자원을 선택하기 위한 자원 선택 영역, 연도범위 지정영역 등을 포함한다. When the type selection module 150 is requested to provide resource search information for a technical field input by a user, the type selection module 150 provides a type selection screen for selecting a technical field type and a research subject type for the technical field. Enter the type and research subject type. That is, the type selection module 150 provides a type selection screen for selecting a technology field type and a research subject type for the technology field when a user inputs a technology field to search for. The type selection screen may include: a technical field type selection area for selecting a technical field type for the technical field, a research subject type selection area for selecting a research subject type, a resource selection area for selecting at least one resource, and a year range It includes a designated area.
상기 사용자는 상기 유형 선택 화면을 통해 기술분야유형 및 연구주체유형을 입력하고, 부가적으로 자원 선택 또는 연도범위를 지정할 수 있다. The user may input a technical field type and a research subject type through the type selection screen, and additionally specify a resource selection or a year range.
여기서, 상기 기술분야유형은 요소기술분야, 유사기술분야, 경쟁기술분야, 연관기술분야 중 적어도 하나 이상을 포함하고, 상기 연구주체유형은 국가, 단체, 기관, 연구자 중 적어도 하나를 포함한다. 또한, 상기 자원은 특허, 논문, 보고서, 학술자료, 표준, 통계, 전자 문서 등을 말한다.Here, the technical field type includes at least one or more of the element technology field, similar technology field, competition technology field, related technology field, and the research subject type includes at least one of a country, a group, an institution, and a researcher. In addition, the resources refer to patents, articles, reports, scholarly articles, standards, statistics, electronic documents and the like.
상기 자원검색 정보 획득 모듈(160)은 상기 통합 지식베이스를 검색하여 상기 기술분야유형에 대한 기술용어들 및 상기 기술분야를 다루며 상기 연구주체유형에 해당하는 하나 이상의 대표 연구주체를 획득한 후, 상기 각 기술용어에 대한 대표 연구주체들의 자원검색 정보를 각각 획득한다. The resource retrieval information acquisition module 160 searches the integrated knowledge base to cover technical terms for the technical field type and the technical field, and acquires one or more representative research subjects corresponding to the research subject type. Obtain resource retrieval information of representative research subjects for each technical term.
즉, 상기 자원검색 정보 획득 모듈(160)은 상기 통합 지식베이스를 검색하여 상기 기술분야유형에 대한 기술용어들을 획득하고, 상기 획득된 기술용어 중에서 상위 일정 개수의 기술용어들을 추출한다. 또한, 상기 자원검색 정보 획득 모듈(160)은 상기 통합 지식베이스를 검색하여 상기 기술분야를 다루며 상기 연구주체유형에 해당하는 연구주체들을 검색하고, 상기 검색된 연구주체들 중에서 상위 일정 개수의 연구주체들을 대표 연구주체로 획득한다. That is, the resource search information acquisition module 160 searches the integrated knowledge base to obtain technical terms for the technical field type, and extracts a predetermined number of technical terms from the obtained technical terms. In addition, the resource search information acquisition module 160 searches the integrated knowledge base to deal with the technical field, search for research subjects corresponding to the research subject type, and select a predetermined number of research subjects among the searched research subjects. Acquired as a representative research subject.
그런 다음 상기 자원검색 정보 획득 모듈(160)은 상기 지식 베이스를 검색하여 상기 획득된 각 기술용어에 대한 대표 연구주체들의 자원검색 정보를 각각 획득한다. Then, the resource search information acquisition module 160 searches the knowledge base to obtain resource search information of representative research subjects for each of the acquired technical terms.
이때, 상기 자원검색 정보 획득 모듈(160)은 상기 유형 선택 화면을 통해 자원이 선택되고, 연도범위가 지정된 경우, 상기 획득된 자원검색 정보 중에서 상기 자원 및 연도 범위에 해당하는 자원검색 정보만을 검색하게 된다. In this case, when the resource is selected through the type selection screen and the year range is designated, the resource search information obtaining module 160 searches only the resource search information corresponding to the resource and the year range among the obtained resource search information. do.
상기 상관관계 추론 모듈(170)은 상기 통합 지식베이스를 검색하여 상기 자원검색 정보 획득 모듈에서 획득된 자원검색 정보에 대한 대표 연구주체간의 상관관계를 추론한다. 여기서, 상기 상관관계는 협력, 경쟁 등을 말한다. The correlation inference module 170 searches the integrated knowledge base and infers a correlation between representative research subjects for the resource search information acquired in the resource search information acquisition module. Here, the correlation refers to cooperation, competition, and the like.
즉, 상기 상관관계 추론 모듈(170)은 상기 통합 지식베이스를 검색하여 공동 연구를 한 연구자들은 연구자 협력 관계, 협력 관계의 연구자가 소속된 서로 다른 기관들은 기관 협력 관계, 협력관계의 기관이 소속된 서로 다른 국가들은 국가 협력 관계로 상관관계를 추론한다.That is, the correlation inference module 170 searches the integrated knowledge base and conducts collaborative research by researchers. Different countries infer correlations with national partnerships.
상기 자원검색 정보 제공 모듈(180)은 상기 자원검색 정보 획득 모듈(160)에서 획득된 자원검색 정보와 상기 상관관계 추론 모듈(170)에서 추론된 대표 연구주체간의 상관관계를 융합하여 제공한다.The resource search information providing module 180 fuses and provides a correlation between the resource search information acquired by the resource search information obtaining module 160 and a representative research subject inferred by the correlation inference module 170.
즉, 상기 자원검색정보 제공 모듈(180)은 상기 자원 검색 정보를 상기 기술용어들과 상기 대표 연구주체들을 축으로 하는 그래프상에 표시하되, 상기 자원 검색 정보는 자원 검색 건수에 따라 다른 크기를 갖는 동시에 상관관계가 표시되는 모형으로 상기 그래프상에 표시된다. That is, the resource search information providing module 180 displays the resource search information on a graph around the technical terms and the representative research subjects, and the resource search information has a different size according to the number of resource search cases. At the same time, a correlation model is displayed on the graph.
다시 말하면, 상기 자원 검색 정보 제공 모듈(180)은 상기 자원 검색 정보 획득 모듈(160)을 통해 획득된 기술용어들 중에서 상위 일정 개수의 기술용어 목록을 한 축으로 하고, 상기 획득된 연구주체들 중에서 상위 일정 개수의 연구주체들을 대표 연구주체로 하여 상기 대표 연구주체를 다른 한 축으로 하는 그래프를 생성하고, 그 그래프상에 자원 검색 정보를 표시하게 된다.In other words, the resource retrieval information providing module 180 has an upper predetermined number of technical terms list among the technical terms acquired through the resource retrieval information acquisition module 160 as one axis, and among the acquired research subjects. Using a predetermined number of top research subjects as a representative research subject, a graph having the representative research subject as another axis is generated, and resource search information is displayed on the graph.
또한, 상기 자원검색정보 제공 모듈(180)은 상기 유형 선택 화면을 통해 자원에 대한 비율이 입력된 경우, 상기 다중 자원들로부터 획득된 자원검색정보에 각 자원의 비율에 따른 가중치를 부여하여 연산하고, 그 연산된 기술용어별 자원 검색 정보와 상기 대표 연구주체간의 상관관계를 융합하여 제공한다.In addition, when the ratio of resources is input through the type selection screen, the resource retrieval information providing module 180 calculates by assigning weights according to the ratio of each resource to the resource retrieval information obtained from the multiple resources. In addition, the correlation between the calculated technical term resource search information and the representative research subject is provided.
또한, 상기 자원 검색 정보 제공 모듈(180)은 상기 자원 검색 정보 획득 모듈(160)을 통해 획득된 기술용어들 중에서 상위 일정 개수의 기술용어 목록을 한 축으로 하고, 상기 획득된 연구주체들 중에서 상위 일정 개수의 연구주체들을 대표연구주체를 다른 한 축으로 하는 그래프를 생성하여 제공한다. In addition, the resource search information providing module 180 has a predetermined number of technical term lists among the technical terms acquired through the resource search information obtaining module 160 as one axis, and is higher among the acquired research subjects. A number of research subjects are created and provided as a graph with the main research subject as the other axis.
상기와 같이 구성된 자원 검색 정보 제공 장치(100)는 사용자에 의해 입력된 기술분야유형 및 연구주체유형에 따른 검색 정보와 연구주체간의 상관관계를 융합하여 제공하므로, 연구주체간의 협력, 경쟁 등의 상관관계를 용이하게 파악할 수 있도록 한다.The resource search information providing apparatus 100 configured as described above fuses the correlation between the research information and the research subject according to the technical field type and the research subject type inputted by the user, and thus the correlation between cooperation and competition among the research subjects. Make it easy to identify relationships.
상기와 같이 구성된 자원 검색 정보 제공 장치(100)는 논문, 특허, 보고서 등 다중 자원 내에서 텍스트 마이닝을 통해 내적 정보(Implicit Information)를 추출하여 메타데이터와 같은 외형적 정보(Explicit Information)와 융합하고, 이를 시맨틱 웹 기술 기반의 서비스 플랫폼에 올려 다양한 관점에서의 정보 서비스를 가능하게 한다. The resource retrieval information providing apparatus 100 configured as described above extracts implicit information through text mining within multiple resources such as a paper, a patent, a report, and fuses it with explicit information such as metadata. In addition, it enables the information service from various viewpoints by uploading it to the service platform based on semantic web technology.
본 발명의 전술한 목적과 기술적 구성 및 그에 따른 작용 효과에 관한 자세한 사항은 본 발명의 명세서에 첨부된 도면에 의거한 이하 상세한 설명에 의해 보다 명확하게 이해될 것이다.Details of the above-described objects and technical configurations of the present invention and the effects thereof according to the present invention will be more clearly understood by the following detailed description based on the accompanying drawings.
도 1은 본 발명의 실시예에 따른 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치를 개략적으로 나타낸 블럭도이다. 1 is a block diagram schematically illustrating an apparatus for providing resource search information in which correlations among research subjects are displayed by using a knowledge base incorporating multiple resources according to an embodiment of the present invention.
도 1을 참조하면, 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치(이하 자원검색 정보 제공 장치로 칭함)(100)는 데이터베이스(110), 기술용어 인식 및 관계 생성 모듈(120), 지식베이스 구축 모듈(130), 유형 선택 모듈(150), 자원검색 정보 획득 모듈(160), 상관관계 추론 모듈(170), 자원 검색정보 제공 모듈(180)을 포함한다. Referring to FIG. 1, a resource retrieval information providing device (hereinafter referred to as a resource retrieval information providing device) 100 displaying correlations between research subjects using a knowledge base incorporating multiple resources may include a database 110 and a technical term recognition. And a relationship generation module 120, a knowledge base construction module 130, a type selection module 150, a resource search information acquisition module 160, a correlation inference module 170, and a resource search information providing module 180. do.
상기 데이터 베이스(110)는 하나 이상의 기술분야, 각 기술분야에 속하는 기술용어, 각 기술용어의 식별자가 매핑된 기술용어 사전이 저장된 기술용어 사전 데이터베이스(112), 기술용어 사이의 문맥에 대한 패턴 정보가 저장된 문맥 패턴 정보 데이터베이스(114), 문맥을 정규화하기 위한 정규화 사전 데이터베이스(116)를 포함한다. The database 110 includes one or more technical fields, a technical term belonging to each technical field, a technical term dictionary database 112 in which a technical term dictionary mapped with an identifier of each technical term is stored, and pattern information about a context between technical terms. A context pattern information database 114 stored therein, and a normalization dictionary database 116 for normalizing the context.
상기 기술용어 인식 및 관계 생성 모듈(120)은 각 자원별로 상기 기술용어 사전을 이용하여 입력 문서에서의 기술용어를 인식하고, 상기 문맥 패턴 정보를 이용하여 상기 인식된 기술용어간의 관계를 생성한다. The terminology recognition and relationship generation module 120 recognizes a terminology in an input document by using the terminology dictionary for each resource, and generates a relationship between the recognized terminology using the context pattern information.
상기와 같은 기술용어 인식 및 관계 생성 모듈(120)은 기술용어 인식부(122)와 관계 생성부(124)로 구성된다. The terminology recognition and relationship generation module 120 as described above includes a terminology recognition unit 122 and a relationship generation unit 124.
상기 기술용어 인식부(122)는 상기 입력 문서에 대해 형태소 분석, 구문 분석, 의미 분석을 수행하여 용어를 인식하고, 상기 인식된 용어가 상기 기술용어 사전에 등록된 경우, 기술용어로 인식한다. 이때, 상기 기술용어 인식부(122)는 상기 인식된 각 기술용어에 기술분야 및 식별자를 부여한다.The technical term recognition unit 122 recognizes terms by performing morphological analysis, syntax analysis, and semantic analysis on the input document, and recognizes the technical terms when the recognized terms are registered in the technical term dictionary. In this case, the technical term recognition unit 122 assigns a technical field and an identifier to each recognized technical term.
상기 관계 생성부(124)는 상기 기술용어 인식부(122)에서 2개 이상의 기술용어가 인식된 경우, 상기 문맥 패턴 정보를 근거로 상기 인식된 기술용어 사이의 문맥을 추출하고, 상기 정규화 사전 데이터베이스(116)를 근거로 상기 추출된 문맥을 정규화하는 방식으로 기술용어간의 관계를 생성한다.When two or more technical terms are recognized by the technical term recognition unit 122, the relationship generator 124 extracts a context between the recognized technical terms based on the context pattern information, and extracts the normalized dictionary database. On the basis of 116, the relation between the technical terms is generated by normalizing the extracted context.
예를 들어, "notebook consists of monitor, SSD, and mobile processor" 문장의 경우, 상기 기술용어 인식부(122)는 상기 문장에서 notebook, monitor, SSD, mobile processor의 기술용어를 인식하게 된다. For example, in the case of a "notebook consists of monitor, SSD, and mobile processor" sentence, the terminology recognition unit 122 recognizes the terminology of the notebook, monitor, SSD, mobile processor in the sentence.
이때, 2개 이상의 기술용어가 인식되었으므로, 상기 관계 생성부(124)는 기 저장된 문맥 패턴 정보 예를 들면, "Be동사 + 과거분사형 + 전치사"에 부합하는 문맥만을 추출한다.In this case, since two or more technical terms have been recognized, the relationship generation unit 124 extracts only the contexts matching the pre-stored context pattern information, for example, "Be verb + past participle type + preposition".
그런 다음 상기 관계 생성부(124)는 상기 정규화 사전을 근거로 해당 문맥의 시제를 "was"를 "be"로 통일하고, 유사표현 예를 들면, “similar to"와 "similar with"를 "similar to"로 통일하는 등의 문맥 정규화를 수행하여 기술용어간의 관계를 생성한다.The relationship generation unit 124 then unifies the tense of the context into "be" and "be" based on the normalization dictionary, and similar expressions, for example, "similar to" and "similar with". Contextual normalization, such as unification to ", is performed to create relationships between descriptive terms.
상기 관계 생성부9124)는 상기 추출된 기술용어와 상기 생성된 기술용어간의 관계를 주체(Subject), 관계명(Predicate), 객체(Object)로 표현한다.The relationship generating unit 9224 expresses the relationship between the extracted technical term and the generated technical term as a subject, a predicate, and an object.
상기 기술용어 인식 및 관계 생성 모듈(120)이 기술용어 인식 및 관계를 생성하는 방법은 자원별로 이루어지고, 여기서 자원은 특허, 논문, 보고서, 학술자료, 표준, 통계, 전자 문서 등을 말한다. The technical term recognition and relationship generation module 120 is a method for generating the technical term recognition and relationship is made for each resource, where the resource refers to patents, articles, reports, academic data, standards, statistics, electronic documents, and the like.
상기 지식베이스 구축 모듈(130)은 서로 다른 다중 자원에서 상기 기술용어 인식 및 관계 생성 모듈(120)에서 인식된 기술용어와 기술용어간의 관계를 통합 온톨로지로 매핑하여 저장하고, 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장한다.The knowledge base construction module 130 maps and stores the relationship between the technical term and the technical term recognized in the technical term recognition and relationship generation module 120 as an integrated ontology in different multiple resources, and infers the integrated ontology. Extend the integrated knowledge base by doing
이때, 상기 지식베이스 구축 모듈(130)은 상기 서로 다른 다중 자원에서 생성된 기술용어간의 관계 또는 각 자원의 메타 데이터를 다중 자원간의 연결관계로 표현한 통합 온톨로지로 저장한다.At this time, the knowledge base construction module 130 stores the relationship between the technical terms generated in the different multiple resources or metadata of each resource as an integrated ontology represented as a connection relationship between the multiple resources.
상기 지식 베이스 구축 모듈(130)에 의해 생성된 통합 지식베이스는 지식 베이스 DB(140)에 저장된다.The integrated knowledge base generated by the knowledge base building module 130 is stored in the knowledge base DB 140.
상기 유형 선택 모듈(150)은 사용자에 의해 입력된 기술분야에 대한 자원 검색 정보 제공이 요청된 경우, 상기 기술분야에 대한 기술분야유형 및 연구주체유형을 선택하기 위한 유형 선택 화면을 제공하여 기술분야유형 및 연구주체유형을 입력받는다. 즉, 상기 유형 선택 모듈(150)은 사용자가 검색을 원하는 기술분야를 입력하면, 상기 기술분야에 대한 기술분야유형 및 연구주체유형을 선택하기 위한 유형 선택 화면을 제공한다. 상기 유형 선택 화면은 상기 기술분야에 대한 기술분야유형을 선택하기 위한 기술분야유형 선택 영역, 연구주체유형을 선택하기 위한 연구주체유형 선택 영역, 적어도 하나의 자원을 선택하기 위한 자원 선택 영역, 연도범위 지정영역 등을 포함한다. When the type selection module 150 is requested to provide resource search information for a technical field input by a user, the type selection module 150 provides a type selection screen for selecting a technical field type and a research subject type for the technical field. Enter the type and research subject type. That is, the type selection module 150 provides a type selection screen for selecting a technology field type and a research subject type for the technology field when a user inputs a technology field to search for. The type selection screen may include: a technical field type selection area for selecting a technical field type for the technical field, a research subject type selection area for selecting a research subject type, a resource selection area for selecting at least one resource, and a year range It includes a designated area.
상기 사용자는 상기 유형 선택 화면을 통해 기술분야유형 및 연구주체유형을 입력하고, 부가적으로 자원 선택 또는 연도범위를 지정할 수 있다. The user may input a technical field type and a research subject type through the type selection screen, and additionally specify a resource selection or a year range.
여기서, 상기 기술분야유형은 요소기술분야, 유사기술분야, 경쟁기술분야, 연관기술분야 중 적어도 하나 이상을 포함하고, 상기 연구주체유형은 국가, 단체, 기관, 연구자 중 적어도 하나를 포함한다. 또한, 상기 자원은 특허, 논문, 보고서, 학술자료, 표준, 통계, 전자 문서 등을 말한다.Here, the technical field type includes at least one or more of the element technology field, similar technology field, competition technology field, related technology field, and the research subject type includes at least one of a country, a group, an institution, and a researcher. In addition, the resources refer to patents, articles, reports, scholarly articles, standards, statistics, electronic documents and the like.
상기 자원검색 정보 획득 모듈(160)은 상기 통합 지식베이스를 검색하여 상기 기술분야유형에 대한 기술용어들 및 상기 기술분야를 다루며 상기 연구주체유형에 해당하는 하나 이상의 대표 연구주체를 획득한 후, 상기 각 기술용어에 대한 대표 연구주체들의 자원검색 정보를 각각 획득한다. The resource retrieval information acquisition module 160 searches the integrated knowledge base to cover technical terms for the technical field type and the technical field, and acquires one or more representative research subjects corresponding to the research subject type. Obtain resource retrieval information of representative research subjects for each technical term.
즉, 상기 자원검색 정보 획득 모듈(160)은 상기 통합 지식베이스를 검색하여 상기 기술분야유형에 대한 기술용어들을 획득하고, 상기 획득된 기술용어 중에서 상위 일정 개수의 기술용어들을 추출한다. 또한, 상기 자원검색 정보 획득 모듈(160)은 상기 통합 지식베이스를 검색하여 상기 기술분야를 다루며 상기 연구주체유형에 해당하는 연구주체들을 검색하고, 상기 검색된 연구주체들 중에서 상위 일정 개수의 연구주체들을 대표 연구주체로 획득한다. That is, the resource search information acquisition module 160 searches the integrated knowledge base to obtain technical terms for the technical field type, and extracts a predetermined number of technical terms from the obtained technical terms. In addition, the resource search information acquisition module 160 searches the integrated knowledge base to deal with the technical field, search for research subjects corresponding to the research subject type, and select a predetermined number of research subjects among the searched research subjects. Acquired as a representative research subject.
그런 다음 상기 자원검색 정보 획득 모듈(160)은 상기 지식 베이스를 검색하여 상기 획득된 각 기술용어에 대한 대표 연구주체들의 자원검색 정보를 각각 획득한다. Then, the resource search information acquisition module 160 searches the knowledge base to obtain resource search information of representative research subjects for each of the acquired technical terms.
이때, 상기 자원검색 정보 획득 모듈(160)은 상기 유형 선택 화면을 통해 자원이 선택되고, 연도범위가 지정된 경우, 상기 획득된 자원검색 정보 중에서 상기 자원 및 연도 범위에 해당하는 자원검색 정보만을 검색하게 된다. In this case, when the resource is selected through the type selection screen and the year range is designated, the resource search information obtaining module 160 searches only the resource search information corresponding to the resource and the year range among the obtained resource search information. do.
상기 상관관계 추론 모듈(170)은 상기 통합 지식베이스를 검색하여 상기 자원검색 정보 획득 모듈에서 획득된 자원검색 정보에 대한 대표 연구주체간의 상관관계를 추론한다. 여기서, 상기 상관관계는 협력, 경쟁 등을 말한다. The correlation inference module 170 searches the integrated knowledge base and infers a correlation between representative research subjects for the resource search information acquired in the resource search information acquisition module. Here, the correlation refers to cooperation, competition, and the like.
즉, 상기 상관관계 추론 모듈(170)은 상기 통합 지식베이스를 검색하여 공동 연구를 한 연구자들은 연구자 협력 관계, 협력 관계의 연구자가 소속된 서로 다른 기관들은 기관 협력 관계, 협력관계의 기관이 소속된 서로 다른 국가들은 국가 협력 관계로 상관관계를 추론한다.That is, the correlation inference module 170 searches the integrated knowledge base and conducts collaborative research by researchers. Different countries infer correlations with national partnerships.
상기 자원검색 정보 제공 모듈(180)은 상기 자원검색 정보 획득 모듈(160)에서 획득된 자원검색 정보와 상기 상관관계 추론 모듈(170)에서 추론된 대표 연구주체간의 상관관계를 융합하여 제공한다.The resource search information providing module 180 fuses and provides a correlation between the resource search information acquired by the resource search information obtaining module 160 and a representative research subject inferred by the correlation inference module 170.
즉, 상기 자원검색정보 제공 모듈(180)은 상기 자원 검색 정보를 상기 기술용어들과 상기 대표 연구주체들을 축으로 하는 그래프상에 표시하되, 상기 자원 검색 정보는 자원 검색 건수에 따라 다른 크기를 갖는 동시에 상관관계가 표시되는 모형으로 상기 그래프상에 표시된다. That is, the resource search information providing module 180 displays the resource search information on a graph around the technical terms and the representative research subjects, and the resource search information has a different size according to the number of resource search cases. At the same time, a correlation model is displayed on the graph.
다시 말하면, 상기 자원 검색 정보 제공 모듈(180)은 상기 자원 검색 정보 획득 모듈(160)을 통해 획득된 기술용어들 중에서 상위 일정 개수의 기술용어 목록을 한 축으로 하고, 상기 획득된 연구주체들 중에서 상위 일정 개수의 연구주체들을 대표 연구주체로 하여 상기 대표 연구주체를 다른 한 축으로 하는 그래프를 생성하고, 그 그래프상에 자원 검색 정보를 표시하게 된다.In other words, the resource retrieval information providing module 180 has an upper predetermined number of technical terms list among the technical terms acquired through the resource retrieval information acquisition module 160 as one axis, and among the acquired research subjects. Using a predetermined number of top research subjects as a representative research subject, a graph having the representative research subject as another axis is generated, and resource search information is displayed on the graph.
또한, 상기 자원검색정보 제공 모듈(180)은 상기 유형 선택 화면을 통해 자원에 대한 비율이 입력된 경우, 상기 다중 자원들로부터 획득된 자원검색정보에 각 자원의 비율에 따른 가중치를 부여하여 연산하고, 그 연산된 기술용어별 자원 검색 정보와 상기 대표 연구주체간의 상관관계를 융합하여 제공한다.In addition, when the ratio of resources is input through the type selection screen, the resource retrieval information providing module 180 calculates by assigning weights according to the ratio of each resource to the resource retrieval information obtained from the multiple resources. In addition, the correlation between the calculated technical term resource search information and the representative research subject is provided.
또한, 상기 자원 검색 정보 제공 모듈(180)은 상기 자원 검색 정보 획득 모듈(160)을 통해 획득된 기술용어들 중에서 상위 일정 개수의 기술용어 목록을 한 축으로 하고, 상기 획득된 연구주체들 중에서 상위 일정 개수의 연구주체들을 대표연구주체를 다른 한 축으로 하는 그래프를 생성하여 제공한다. In addition, the resource search information providing module 180 has a predetermined number of technical term lists among the technical terms acquired through the resource search information obtaining module 160 as one axis, and is higher among the acquired research subjects. A number of research subjects are created and provided as a graph with the main research subject as the other axis.
상기와 같이 구성된 자원 검색 정보 제공 장치(100)는 사용자에 의해 입력된 기술분야유형 및 연구주체유형에 따른 검색 정보와 연구주체간의 상관관계를 융합하여 제공하므로, 연구주체간의 협력, 경쟁 등의 상관관계를 용이하게 파악할 수 있도록 한다.The resource search information providing apparatus 100 configured as described above fuses the correlation between the research information and the research subject according to the technical field type and the research subject type inputted by the user, and thus the correlation between cooperation and competition among the research subjects. Make it easy to identify relationships.
상기와 같이 구성된 자원 검색 정보 제공 장치(100)는 논문, 특허, 보고서 등 다중 자원 내에서 텍스트 마이닝을 통해 내적 정보(Implicit Information)를 추출하여 메타데이터와 같은 외형적 정보(Explicit Information)와 융합하고, 이를 시맨틱 웹 기술 기반의 서비스 플랫폼에 올려 다양한 관점에서의 정보 서비스를 가능하게 한다. The resource retrieval information providing apparatus 100 configured as described above extracts implicit information through text mining within multiple resources such as a paper, a patent, a report, and fuses it with explicit information such as metadata. In addition, it enables the information service from various viewpoints by uploading it to the service platform based on semantic web technology.
도 2는 본 발명의 실시예에 따른 자원검색 정보 제공 장치가 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보를 제공하는 방법을 나타낸 흐름도, 도 3은 본 발명에 따른 검색어 입력 화면을 나타낸 예시도, 도 4는 본 발명에 따른 유형 선택 화면을 나타낸 예시도, 도 5는 본 발명에 따른 자원 검색 정보 제공 화면을 나타낸 예시도이다. FIG. 2 is a flowchart illustrating a method for providing resource search information in which a correlation between research subjects is displayed by using a knowledge base including multiple resources by an apparatus for providing resource search information according to an embodiment of the present invention. FIG. 4 is an exemplary diagram illustrating a search word input screen, FIG. 4 is an exemplary diagram illustrating a type selection screen according to the present invention, and FIG. 5 is an exemplary diagram showing a resource search information providing screen according to the present invention.
도 2를 참조하면, 자원검색 정보 제공 장치는 각 자원별로 기술용어 사전을 이용하여 입력 문서에서의 기술용어를 인식하고(S200), 문맥 패턴 정보를 이용하여 상기 인식된 기술용어간의 관계를 생성한다(S202). 즉, 상기 입력 문서에 대해 형태소 분석, 구문 분석, 의미 분석을 수행하여 용어를 인식하고, 상기 인식된 용어가 상기 기술용어 사전에 등록된 경우, 기술용어로 인식한다. 그런 다음 상기 자원검색 정보 제공 장치는 상기 인식된 기술용어가 2개 이상인 경우, 상기 문맥 패턴 정보를 근거로 상기 인식된 기술용어 사이의 문맥을 추출하고, 기 저장된 정규화 사전을 근거로 상기 추출된 문맥을 정규화하는 방식으로 기술용어간의 관계를 생성한다.Referring to FIG. 2, the apparatus for providing resource search information recognizes a technical term in an input document by using a technical term dictionary for each resource (S200), and generates a relationship between the recognized technical terms using context pattern information. (S202). That is, terms are recognized by performing morphological analysis, syntax analysis, and semantic analysis on the input document, and when the recognized terms are registered in the technical term dictionary, they are recognized as technical terms. Then, the resource search information providing apparatus extracts a context between the recognized technical terms based on the context pattern information when the recognized technical terms are two or more, and based on the extracted normalized dictionary, the extracted contexts Create relationships between descriptive terms by normalizing them.
상기 S202의 수행 후 상기 자원검색 정보 제공 장치는 서로 다른 다중 자원에서 각각 인식된 기술용어와 기술용어간의 관계를 통합 온톨로지로 매핑하여 저장하고(S204), 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장한다(S206). 즉, 상기 자원 검색 정보 제공 장치는 논문, 특허, 보고서 등 다중 자원 내에서 텍스트 마이닝을 통해 내적 정보를 추출하여 메타데이터와 같은 외형적 정보와 융합하고, 이를 시맨틱 웹 기술 기반의 서비스 플랫폼에 올려 다양한 관점에서의 정보 서비스를 가능하게 한다.After performing the S202, the apparatus for providing resource search information maps and stores the relationship between the technical terms and the technical terms respectively recognized in different multiple resources as an integrated ontology (S204), and performs inference about the integrated ontology to perform integrated knowledge. The base is expanded (S206). In other words, the resource retrieval information providing apparatus extracts internal information through text mining within multiple resources such as papers, patents, and reports, fuses it with external information such as metadata, and uploads it to a semantic web technology based service platform. Enable information services from the point of view.
상기 S206의 수행 후, 사용자에 의해 입력된 기술분야에 대한 자원 검색 정보 제공이 요청된 경우(S208), 상기 자원검색 정보 제공 장치는 상기 기술분야에 대한 기술분야유형 및 연구주체유형을 선택하기 위한 유형 선택 화면을 제공하여 기술분야유형 및 연구주체유형을 입력받는다(S210).After performing the step S206, if the resource search information for the technical field input by the user is requested (S208), the resource search information providing apparatus for selecting the technical field type and research subject type for the technical field The type selection screen is provided to receive the technical field type and the research subject type (S210).
즉, 상기 사용자는 도 3과 같은 검색어 입력 화면(300)을 통해 검색을 원하는 기술분야를 입력한다. 그러면, 상기 자원검색 정보 제공 장치는 도 4와 같은 유형 선택 화면(400)을 제공한다.That is, the user inputs a technical field to be searched through the search word input screen 300 as shown in FIG. 3. Then, the resource search information providing apparatus provides a type selection screen 400 as shown in FIG.
상기 유형 선택 화면(400)에 대해 도 4를 참조하면, 상기 유형 선택 화면(400)은 검색어 입력 화면을 통해 입력된 기술분야가 표시되는 기술분야 표시영역(410), 상기 기술분야에 대한 기술분야유형을 선택하기 위한 기술분야유형 선택 영역(420), 연구주체유형을 선택하기 위한 연구주체유형 선택 영역(440), 적어도 하나의 자원을 선택하기 위한 자원 선택 영역(460), 연도범위 지정영역(470) 등을 포함한다.Referring to FIG. 4 with respect to the type selection screen 400, the type selection screen 400 may include a technology field display area 410 for displaying a technology field input through a search word input screen, and a technology field for the technology field. Technical field type selection area 420 for selecting a type, research subject type selection area 440 for selecting a research subject type, a resource selection area 460 for selecting at least one resource, and a year range designation area ( 470) and the like.
상기 사용자는 상기 기술분야유형 선택 영역(420)에서 요소기술분야, 유사기술분야, 경쟁기술분야, 연관기술분야 중 하나를 선택하고, 상기 연구주체유형 선택 영역(440)에서 국가, 단체, 기관, 연구자 중 하나를 선택한다.The user selects one of the element technology field, the similar technology field, the competition technology field, and the related technology field in the technology field type selection area 420, and the country, organization, institution, Select one of the researchers.
부가적으로 상기 사용자는 상기 자원선택 영역(460)에서 특허, 논문, 보고서, 학술자료, 표준, 통계, 전자 문서 중 적어도 하나를 선택하고, 상기 연도 범위 지정 영역(470)에서 원하는 연도를 지정할 수 있다. 여기에서는 자원선택 영역(460)을 2개의 자원을 선택할 수 있는 슬라이드 바 형식으로 구성하였으나, 3개, 4개 등의 다수개의 자원을 선택할 수 있는 다양한 형태로 할 수 있음은 당연하다.In addition, the user may select at least one of patents, articles, reports, academic articles, standards, statistics, and electronic documents in the resource selection area 460, and designate a desired year in the year range designation area 470. have. Although the resource selection area 460 is configured in the form of a slide bar for selecting two resources, it is natural that the resource selection area 460 can be in various forms for selecting a plurality of resources such as three or four.
상기 S210의 수행 후, 상기 자원 검색 정보 제공 장치는 상기 통합 지식베이스를 검색하여 상기 기술분야유형에 대한 기술용어들 및 상기 기술분야를 다루며 상기 연구주체유형에 해당하는 하나 이상의 대표 연구주체를 획득한다(S212).After performing the S210, the apparatus for providing resource search information searches the integrated knowledge base to obtain technical terms for the technical field type and the technical field, and to obtain one or more representative research subjects corresponding to the research subject type. (S212).
그런 다음 상기 자원검색 정보 제공 장치는 상기 통합 지식베이스를 검색하여 상기 획득된 각 기술용어에 대한 대표 연구주체들의 자원검색 정보를 각각 획득하고(S214), 상기 통합 지식베이스를 검색하여 상기 획득된 자원검색 정보에 대한 대표 연구주체간의 상관관계를 추론한다(S216). 여기서, 상기 대표 연구주체간의 상관관계는 경쟁, 협력 관계 등을 말한다. Then, the resource search information providing apparatus searches the integrated knowledge base to obtain resource search information of representative research subjects for each of the acquired technical terms (S214), and searches the integrated knowledge base to obtain the obtained resources. The correlation between representative research subjects for the search information is inferred (S216). Here, the correlation between the representative research subjects refers to competition, cooperation, and the like.
그런 다음 상기 자원검색 정보 제공 장치는 상기 획득된 자원검색 정보와 상기 추론된 대표 연구주체간의 상관관계를 융합하여 제공한다(S218).Then, the apparatus for providing resource search information provides a fusion of the correlation between the acquired resource search information and the inferred representative research subject (S218).
즉, 상기 자원검색 정보 제공 장치는 상기 자원 검색 정보를 상기 기술용어들과 상기 대표 연구주체들을 축으로 하는 그래프상에 표시하되, 상기 자원 검색 정보는 자원 검색 건수에 따라 다른 크기를 갖는 동시에 상관관계가 표시되는 모형으로 상기 그래프상에 표시한다.That is, the apparatus for providing resource retrieval information displays the resource retrieval information on a graph around the technical terms and the representative research subjects, and the resource retrieval information has a different size according to the number of resource retrieval and is correlated. The model is displayed on the graph.
상기 그래프는 상기 기술용어들 중에서 상위 일정 개수의 기술용어 목록을 한 축으로 하고, 상위 일정 개수의 대표 연구주체를 다른 한 축으로 한 그래프일 수 있다. The graph may be a graph having a predetermined number of technical term lists among the technical terms as one axis and a representative subject of a higher number as the other axis.
상기 자원 검색 정보 제공 장치가 제공하는 자원 검색 정보 제공 화면(500)에 대해 도 5를 참조하면, 사용자가 "Smart Grid" 기술분야를 검색하고, 상기 유형 선택 화면의 기술분야유형 선택 영역(420)에서 "요소기술분야"를 선택하고, 연구주체유형 선택 영역(440)에서 "국가"를 선택한 경우이다.Referring to FIG. 5 for a resource search information providing screen 500 provided by the resource search information providing apparatus, a user searches for a technology field of “Smart Grid” and selects a technology field type selection area 420 of the type selection screen. In this case, the "element technology field" is selected, and the "country" is selected in the research subject type selection area 440.
상기 자원검색 정보 제공 장치는 상기 통합 지식베이스를 검색하여 상기 "Smart Grid"의 요소기술분야 대한 기술용어들을 획득하고, 상기 획득된 기술용어 중에서 상위 일정 개수의 기술용어들 "Electric Power T, Distribution M.S., Smart Meter, Electric city Distribution, Superconduction P.C, Intelligent Monitoring S, High Penetration of C.E.T., Demand Driver C., Electric Control, PHEV"를 획득한다. The apparatus for providing resource search information searches the integrated knowledge base to obtain technical terms for the element technology field of the "Smart Grid", and a predetermined number of technical terms "Electric Power T, Distribution MS" among the obtained technical terms. , Smart Meter, Electric City Distribution, Superconduction PC, Intelligent Monitoring S, High Penetration of CET, Demand Driver C., Electric Control, PHEV ".
또한, 상기 자원검색 정보 제공 장치는 상기 통합 지식베이스를 검색하여 "Smart Grid" 기술분야를 다루는 국가들 중에서 상위 일정 개수의 국가 "이탈리아, 호주, 영국, 미국, 한국"을 대표 연구주체로 추출한다.In addition, the apparatus for providing resource search information searches the integrated knowledge base and extracts a predetermined number of countries "Italy, Australia, the United Kingdom, the United States, and Korea" from among the countries covering the "Smart Grid" technology field as representative research subjects. .
그런 다음 상기 자원검색 정보 제공 장치는 상기 지식 베이스를 검색하여 상기 추출된 각 기술용어에 대한 대표 연구주체들의 자원검색 정보를 각각 획득하고, 상기 획득된 자원검색 정보에 대한 대표 연구주체간의 경쟁, 협력 등의 상관관계를 추론한다.Then, the resource search information providing apparatus searches the knowledge base to obtain resource search information of representative research subjects for each extracted technical term, and competes and cooperates among the representative research subjects for the obtained resource search information. Infer the correlation, etc.
그러면, 상기 자원검색 정보 제공 장치는 상기 획득된 상기 기술용어들(430)을 Y축으로 하고, 상기 대표 연구주체들(450)을 X축으로 하는 그래프를 생성하고, 상기 획득된 자원검색 정보를 상기 생성된 그래프상에 표시한다. 이때, 상기 자원 검색 정보는 자원 검색 건수에 따라 다른 크기를 갖는 동시에 상관관계가 표시되는 원형으로 상기 그래프상에 표시된다. Then, the apparatus for providing resource search information generates a graph with the obtained technical terms 430 as the Y axis, the representative research subjects 450 as the X axis, and the obtained resource search information. Display on the generated graph. At this time, the resource search information is displayed on the graph in a circle having a different size and correlations according to the number of resource searches.
여기에서는 원 모양으로 설명하였으나, 그 모양은 다양하게 할 수 있다. 또한, 연구 주체가 협력이냐 경쟁이냐에 따라 색상을 구분하여 표시하였으나, 문자, 다른 모형 등의 다양한 방법으로 상관관계를 표시할 수도 있다. Here, although described in the shape of a circle, the shape can be varied. In addition, although the research subjects are displayed in different colors according to cooperation or competition, the correlation may be displayed in various ways such as text and other models.
상기와 같이 자원검색 정보 제공 장치는 사용자에 의해 입력된 기술분야유형 및 연구주체유형에 따른 검색 정보와 연구주체간의 상관관계를 융합하여 제공하므로, 연구주체간의 협력, 경쟁 등의 상관관계를 용이하게 파악할 수 있도록 한다.As described above, the apparatus for providing resource retrieval information provides a convergence of the correlation between the search information and the research subject according to the technical field type and the research subject type inputted by the user, thereby facilitating the correlation between cooperation and competition among the research subjects. Make it understandable.
이와 같이, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.As such, those skilled in the art will appreciate that the present invention can be implemented in other specific forms without changing the technical spirit or essential features thereof. Therefore, the above-described embodiments are to be understood as illustrative in all respects and not as restrictive. The scope of the present invention is shown by the following claims rather than the detailed description, and all changes or modifications derived from the meaning and scope of the claims and their equivalents should be construed as being included in the scope of the present invention. do.
이상과 같이 본 발명의 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치 및 방법은 사용자에 의해 입력된 기술분야유형 및 연구주체유형에 따른 검색 정보와 연구주체간의 상관관계를 융합 및 제공하여, 연구주체간의 협력/경쟁 관계를 용이하게 파악할 필요성이 높은 것에 적합하다.As described above, an apparatus and method for providing resource retrieval information in which correlations among research subjects are displayed by using a knowledge base incorporating multiple resources of the present invention is search information and research subject according to the technical field type and research subject type inputted by a user. It is suitable for the high necessity to easily identify the cooperation / competition relationship among study subjects by fusing and providing the correlation between them.

Claims (23)

  1. 각 기술분야에 대한 기술용어가 정의된 기술용어 사전 및 문맥 패턴 정보가 저장된 데이터베이스;A database storing a technical term dictionary and context pattern information in which technical terms for each technical field are defined;
    각 자원별로 상기 기술용어 사전을 이용하여 입력 문서에서의 기술용어를 인식하고, 상기 문맥 패턴 정보를 이용하여 상기 인식된 기술용어간의 관계를 생성하는 기술용어 인식 및 관계 생성 모듈;A technical term recognition and relationship generation module for recognizing a technical term in an input document by using the technical term dictionary for each resource, and generating a relationship between the recognized technical term using the context pattern information;
    서로 다른 다중 자원에서 각각 인식된 기술용어와 기술용어간의 관계를 통합 온톨로지로 매핑하여 저장하고, 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장하는 지식베이스 구축 모듈;A knowledge base building module for mapping and storing relations between technical terms and technology terms recognized in different multiple resources as integrated ontology, and expanding the integrated knowledge base by inferring the integrated ontology;
    사용자에 의해 입력된 기술분야에 대한 자원 검색 정보 제공이 요청된 경우, 상기 기술분야에 대한 기술분야유형 및 연구주체유형을 선택하기 위한 유형 선택 화면을 제공하여 기술분야유형 및 연구주체유형을 입력받는 유형 선택 모듈;When a request for providing resource search information on a technical field input by a user is requested, a type selection screen for selecting a technical field type and a research subject type for the technical field is provided to receive a technical field type and a research subject type. Type selection module;
    상기 통합 지식베이스를 검색하여 상기 기술분야유형에 대한 기술용어들 및 상기 기술분야를 다루며 상기 연구주체유형에 해당하는 하나 이상의 대표 연구주체를 획득한 후, 상기 각 기술용어에 대한 대표 연구주체들의 자원검색 정보를 각각 획득하는 자원검색 정보 획득 모듈; Search the integrated knowledge base to obtain technical terms for the technical field type and one or more representative research subjects corresponding to the research subject type, dealing with the technical field, and then the resources of the representative research subjects for each technical term. A resource search information acquisition module for respectively obtaining search information;
    상기 통합 지식베이스를 검색하여 상기 획득된 자원검색 정보에 대한 대표 연구주체간의 상관관계를 추론하는 상관관계 추론 모듈; 및A correlation inference module for inferring a correlation between representative research subjects on the obtained resource search information by searching the integrated knowledge base; And
    상기 획득된 자원검색 정보와 상기 추론된 대표 연구주체간의 상관관계를 융합하여 제공하는 자원검색 정보 제공 모듈;A resource search information providing module for fusing and providing a correlation between the obtained resource search information and the inferred representative research subject;
    을 포함하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치.Apparatus for providing resource retrieval information in which correlations between research subjects are displayed using a knowledge base including multiple resources.
  2. 제1항에 있어서, The method of claim 1,
    상기 데이터베이스는, The database,
    하나 이상의 기술분야, 각 기술분야에 속하는 기술용어, 각 기술용어의 식별자가 매핑된 기술용어 사전이 저장된 기술용어 사전 데이터베이스; A technical term dictionary database in which one or more technical fields, a technical term belonging to each technical field, and a technical term dictionary mapped with an identifier of each technical term are stored;
    기술용어 사이의 문맥에 대한 패턴 정보가 저장된 문맥 패턴 정보 데이터베이스; 및A context pattern information database in which pattern information about a context between descriptive terms is stored; And
    문맥을 정규화하기 위한 정규화 사전 데이터베이스를 포함하는 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치.A resource retrieval information providing device displaying correlations between research subjects using a knowledge base incorporating multiple resources, comprising a normalization dictionary database for normalizing a context.
  3. 제1항 또는 제2항에 있어서, The method according to claim 1 or 2,
    상기 기술용어 인식 및 관계 생성 모듈은, The terminology recognition and relationship generation module,
    상기 입력 문서에 대해 형태소 분석, 구문 분석, 의미 분석을 수행하여 용어를 인식하고, 상기 인식된 용어가 상기 기술용어 사전에 등록된 경우, 기술용어로 인식하는 기술용어 인식부; 및A technical term recognition unit that recognizes terms by performing morphological analysis, syntax analysis, and semantic analysis on the input document, and recognizes the technical terms when the recognized terms are registered in the technical term dictionary; And
    상기 기술용어 인식 모듈에서 2개 이상의 기술용어가 인식된 경우, 상기 문맥 패턴 정보를 근거로 상기 인식된 기술용어 사이의 문맥을 추출하고, 상기 정규화 사전 데이터베이스를 근거로 상기 추출된 문맥을 정규화하는 방식으로 기술용어간의 관계를 생성하는 관계 생성부를 포함하는 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치.When two or more technical terms are recognized in the technical term recognition module, a context between the recognized technical terms is extracted based on the context pattern information, and the extracted context is normalized based on the normalized dictionary database. And a relationship generating unit for generating a relationship between technical terms. The apparatus for providing resource search information displaying the correlation between study subjects using a knowledge base incorporating multiple resources.
  4. 제3항에 있어서, The method of claim 3,
    상기 기술용어 인식부는 상기 인식된 각 기술용어에 기술분야 및 식별자를 부여하는 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치.And the technical term recognition unit is configured to assign a technical field and an identifier to each of the recognized technical terms. The apparatus of claim 1, wherein the correlation between research subjects is displayed using a knowledge base incorporating multiple resources.
  5. 제3항에 있어서, The method of claim 3,
    상기 관계 생성부는 상기 추출된 기술용어와 상기 생성된 기술용어간의 관계를 주체(Subject), 관계명(Predicate), 객체(Object)로 표현하는 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치.The relation generating unit expresses the relation between the extracted technical term and the generated technical term using a subject, a relation name, and an object. Apparatus for providing resource retrieval information showing correlations among study subjects.
  6. 제1항에 있어서,The method of claim 1,
    상기 지식베이스 구축 모듈은 상기 서로 다른 다중 자원에서 생성된 기술용어간의 관계 또는 각 자원의 메타 데이터를 다중 자원간의 연결관계로 표현한 통합 온톨로지로 저장하는 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치.The knowledge base construction module uses a knowledge base incorporating multiple resources, wherein the knowledge base is stored as an integrated ontology represented as a relation between technical terms generated in the different multiple resources or metadata of each resource as a connection relationship between multiple resources. Apparatus for providing resource search information displaying correlations between research subjects.
  7. 제1항에 있어서, The method of claim 1,
    상기 유형 선택 화면은 상기 기술분야에 대한 기술분야유형을 선택하기 위한 기술분야유형 선택 영역, 연구주체유형을 선택하기 위한 연구주체유형 선택 영역을 포함하는 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치.The type selection screen includes a knowledge base type selection area for selecting a technology field type for the technology field, and a research subject type selection area for selecting a research subject type. Apparatus for providing resource retrieval information in which correlations among study subjects are displayed.
  8. 제7항에 있어서, The method of claim 7, wherein
    상기 기술분야유형은 요소기술분야, 유사기술분야, 경쟁기술분야, 연관기술분야 중 적어도 하나 이상을 포함하고, 상기 연구주체유형은 국가, 단체, 기관, 연구자 중 적어도 하나를 포함하는 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치.The technical field type includes at least one or more of the element technology field, similar technology field, competition technology field, and related technology field, and the research subject type includes at least one of a country, a group, an institution, and a researcher. Apparatus for providing resource retrieval information displaying the correlation between study subjects using a knowledge base that integrates multiple resources.
  9. 제7항에 있어서, The method of claim 7, wherein
    상기 유형 선택 화면은 특허, 논문, 보고서, 학술자료, 표준, 통계, 전자 문서 중 적어도 하나의 자원을 선택하기 위한 자원 선택 영역 또는 연도범위 지정영역을 포함하는 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치.The type selection screen may include a resource selection area or a year range designation area for selecting at least one of a patent, a paper, a report, an academic document, a standard, a statistics, and an electronic document. Apparatus for providing resource retrieval information displaying correlations between study subjects using a database.
  10. 제1항에 있어서, The method of claim 1,
    상기 자원검색 정보 획득 모듈은 상기 유형 선택 화면을 통해 자원이 선택되고, 연도범위가 지정된 경우, 상기 획득된 자원검색 정보 중에서 상기 자원 및 연도 범위에 해당하는 자원검색 정보만을 검색하는 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치.When the resource is selected through the type selection screen and a year range is specified, the resource search information obtaining module searches only resource search information corresponding to the resource and year range among the obtained resource search information. Apparatus for providing resource retrieval information showing correlations among study subjects using a knowledge base that integrates resources.
  11. 제1항에 있어서, The method of claim 1,
    상기 상관관계 추론 모듈은 상기 통합 지식베이스를 검색하여 공동 연구를 한 연구자들은 연구자 협력 관계, 협력 관계의 연구자가 소속된 서로 다른 기관들은 기관 협력 관계, 협력관계의 기관이 소속된 서로 다른 국가들은 국가 협력 관계로 상관관계를 추론하는 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치.The correlation inference module searches the integrated knowledge base and conducts collaborative research by researchers who are collaborative with researchers, different institutions to which researchers belong to the institution, and other countries to which the institutions of the partnership belong. Apparatus for providing resource retrieval information displaying correlations between study subjects using a knowledge base incorporating multiple resources, wherein the correlation is inferred as a cooperative relationship.
  12. 제1항에 있어서,The method of claim 1,
    상기 자원검색정보 제공 모듈은 상기 자원 검색 정보를 상기 기술용어들과 상기 대표 연구주체들을 축으로 하는 그래프상에 표시하되, 상기 자원 검색 정보는 자원 검색 건수에 따라 다른 크기를 갖는 동시에 상관관계가 표시되는 모형으로 상기 그래프상에 표시되는 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치.The resource retrieval information providing module displays the resource retrieval information on a graph around the technical terms and the representative research subjects, and the resource retrieval information has a different size according to the number of resource retrieval and a correlation is displayed. Apparatus for providing resource retrieval information in which a correlation between research subjects is displayed using a knowledge base incorporating multiple resources, wherein the model is displayed on the graph.
  13. 제1항에 있어서,The method of claim 1,
    상기 자원검색정보 제공 모듈은 상기 유형 선택 화면을 통해 자원에 대한 비율이 선택된 경우, 상기 다중 자원들로부터 획득된 자원검색정보에 각 자원의 비율에 따른 가중치를 부여하여 연산하고, 그 연산된 기술용어별 자원 검색 정보와 상기 대표 연구주체간의 상관관계를 융합하여 제공하는 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치.When the ratio of resources is selected through the type selection screen, the resource search information providing module calculates and assigns a weighted value according to the ratio of each resource to resource search information obtained from the multiple resources, and calculates the calculated technical term. Apparatus for providing resource search information displaying correlations between study subjects using a knowledge base incorporating multiple resources, wherein the correlation between the resource search information for each resource and the representative research subject is fused and provided.
  14. 제1항에 있어서,The method of claim 1,
    상기 자원 검색 정보 제공 모듈은 상기 자원 검색 정보 획득 모듈을 통해 획득된 기술용어들 중에서 상위 일정 개수의 기술용어 목록을 한 축으로 하고, 상기 획득된 연구주체들 중에서 상위 일정 개수의 연구주체들을 대표연구주체를 다른 한 축으로 하는 그래프를 생성하는 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치.The resource retrieval information providing module has an upper predetermined number of technical terms list among the technical terms acquired through the resource retrieval information acquisition module as one axis, and a representative study of the upper predetermined number of research subjects among the acquired research subjects A resource retrieval information providing device displaying a correlation between study subjects using a knowledge base incorporating multiple resources, characterized by generating a graph with subjects as one axis.
  15. 자원검색 정보 제공 장치가 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보를 제공하는 방법에 있어서,In a method for providing a resource search information providing resource search information showing the correlation between the study subjects using a knowledge base that integrates multiple resources,
    (a) 각 자원별로 기술용어 사전을 이용하여 입력 문서에서의 기술용어를 인식하고, 문맥 패턴 정보를 이용하여 상기 인식된 기술용어간의 관계를 생성하는 단계;(a) recognizing a technical term in an input document by using a technical term dictionary for each resource, and generating a relationship between the recognized technical terms using context pattern information;
    (b) 서로 다른 다중 자원에서 각각 인식된 기술용어와 기술용어간의 관계를 통합 온톨로지로 매핑하여 저장하고, 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장하는 단계;(b) mapping and storing the relations between the technical terms and the technical terms respectively recognized in different multiple resources as integrated ontology, and expanding the integrated knowledge base by performing inference on the integrated ontology;
    (c) 사용자에 의해 입력된 기술분야에 대한 자원 검색 정보 제공이 요청된 경우, 상기 기술분야에 대한 기술분야유형 및 연구주체유형을 선택하기 위한 유형 선택 화면을 제공하여 기술분야유형 및 연구주체유형을 입력받는 단계;(c) When requested to provide resource retrieval information for a technical field input by a user, a type selection screen for selecting a technical field type and a research subject type for the technical field is provided to provide a technical field type and a research subject type. Receiving an input;
    (d) 상기 통합 지식베이스를 검색하여 상기 기술분야유형에 대한 기술용어들 및 상기 기술분야에 대해 상기 연구주체유형에 해당하는 하나 이상의 대표 연구주체를 획득하는 단계;(d) searching the integrated knowledge base to obtain technical terms for the technical field type and at least one representative research subject corresponding to the research subject type for the technical field;
    (e) 상기 통합 지식베이스를 검색하여 상기 획득된 각 기술용어에 대한 대표 연구주체들의 자원검색 정보를 각각 획득하는 단계;(e) searching the integrated knowledge base to obtain resource search information of representative research subjects for each of the acquired technical terms;
    (f) 상기 통합 지식베이스를 검색하여 상기 획득된 자원검색 정보에 대한 대표 연구주체간의 상관관계를 추론하는 단계; 및(f) searching the integrated knowledge base to infer a correlation between representative research subjects on the obtained resource search information; And
    (g) 상기 획득된 자원검색 정보와 상기 추론된 대표 연구주체간의 상관관계를 융합하여 제공하는 단계;(g) fusing and providing a correlation between the obtained resource search information and the inferred representative research subject;
    를 포함하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 방법.Resource search information providing method that shows the correlation between the study subjects using a knowledge base that incorporates multiple resources.
  16. 제15항에 있어서, The method of claim 15,
    상기 (a) 단계는, In step (a),
    상기 입력 문서에 대해 형태소 분석, 구문 분석, 의미 분석을 수행하여 용어를 인식하고, 상기 인식된 용어가 상기 기술용어 사전에 등록된 경우, 기술용어로 인식하는 단계;Recognizing terms by performing morphological analysis, syntax analysis, and semantic analysis on the input document, and recognizing technical terms when the recognized terms are registered in the technical term dictionary;
    상기 인식된 기술용어가 2개 이상인 경우, 상기 문맥 패턴 정보를 근거로 상기 인식된 기술용어 사이의 문맥을 추출하는 단계; 및Extracting a context between the recognized technical terms based on the context pattern information when the recognized technical terms are two or more; And
    기 저장된 정규화 사전을 근거로 상기 추출된 문맥을 정규화하는 방식으로 기술용어간의 관계를 생성하는 단계를 포함하는 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 방법.Generating relations between technical terms in a manner of normalizing the extracted context based on a previously stored normalization dictionary. Resource search displaying correlations among research subjects using a knowledge base incorporating multiple resources. How to Provide Information.
  17. 제15항에 있어서, The method of claim 15,
    상기 기술분야유형은 요소기술분야, 유사기술분야, 경쟁기술분야, 연관기술분야 중 적어도 하나 이상을 포함하고, 상기 연구주체유형은 국가, 단체, 기관, 연구자 중 적어도 하나를 포함하는 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 방법.The technical field type includes at least one or more of the element technology field, similar technology field, competition technology field, and related technology field, and the research subject type includes at least one of a country, a group, an institution, and a researcher. A method of providing resource retrieval information that shows correlations among research subjects using a knowledge base that integrates multiple resources.
  18. 제15항에 있어서, The method of claim 15,
    상기 유형 선택 화면은 상기 기술분야에 대한 기술분야유형을 선택하기 위한 기술분야유형 선택 영역, 연구주체유형을 선택하기 위한 연구주체유형 선택 영역, 적어도 하나의 자원을 선택하기 위한 자원 선택 영역, 연도범위 지정영역 중 적어도 하나를 포함하는 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 방법.The type selection screen may include: a technical field type selection area for selecting a technical field type for the technical field, a research subject type selection area for selecting a research subject type, a resource selection area for selecting at least one resource, and a year range A method for providing resource retrieval information in which correlations among research subjects are displayed using a knowledge base incorporating multiple resources comprising at least one of designated areas.
  19. 제15항 또는 제18항에 있어서, The method of claim 15 or 18,
    상기 (e) 단계는, In step (e),
    상기 유형 선택 화면을 통해 자원이 선택되고, 연도범위가 지정된 경우, 상기 획득된 자원검색 정보 중에서 상기 자원 및 연도 범위에 해당하는 자원검색 정보만을 검색하는 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 방법.When a resource is selected through the type selection screen and a year range is specified, a knowledge base incorporating multiple resources may be searched for only the resource search information corresponding to the resource and the year range from the obtained resource search information. Method of providing resource retrieval information showing correlations among study subjects.
  20. 제15항에 있어서, The method of claim 15,
    상기 대표 연구주체간의 상관관계는 경쟁 또는 협력 관계인 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 방법.Wherein the correlation between the representative research subjects is competition or cooperation, and the resource searching information providing method displaying the correlations among the research subjects using a knowledge base incorporating multiple resources.
  21. 제15항에 있어서,The method of claim 15,
    상기 (g) 단계는, Step (g) is
    상기 자원 검색 정보를 상기 기술용어들과 상기 대표 연구주체들을 축으로 하는 그래프상에 표시하되, 상기 자원 검색 정보는 자원 검색 건수에 따라 다른 크기를 갖는 동시에 상관관계가 표시되는 모형으로 상기 그래프상에 표시되는 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 방법.The resource search information is displayed on a graph around the technical terms and the representative research subjects, and the resource search information has a different size according to the number of resource searches and a correlation is displayed on the graph. A method for providing resource search information in which correlations among study subjects are displayed using a knowledge base integrating multiple resources.
  22. 제21항에 있어서,The method of claim 21,
    상기 그래프는 상기 기술용어들 중에서 상위 일정 개수의 기술용어 목록을 한 축으로 하고, 상위 일정 개수의 대표 연구주체를 다른 한 축으로 한 그래프인 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 방법.The graph is a graph in which the list of technical terms of the upper predetermined number of the technical terms is on one axis, and the graph of the upper predetermined number of representative research subjects on the other axis, using a knowledge base incorporating multiple resources. A method of providing resource search information that shows correlations among study subjects.
  23. 제15항 내지 제22항에 있어서, 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 방법을 수행하는 프로그램이 기록되고 전자 장치에서 판독 가능한 기록 매체.23. The recording medium according to claim 15, wherein a program for performing a method for providing resource search information in which correlations between research subjects are displayed by using a knowledge base incorporating multiple resources is recorded and can be read by an electronic device.
PCT/KR2010/007242 2010-10-07 2010-10-21 Device and method for providing resource search information on marked correlations between research subjects using a knowledge base from a combination of multiple resources WO2012046906A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020100097798A KR101064981B1 (en) 2010-10-07 2010-10-07 Apparatus and method for providing resource search information marked the relationship between research subject using of knowledge base combined multiple resource
KR10-2010-0097798 2010-10-07

Publications (1)

Publication Number Publication Date
WO2012046906A1 true WO2012046906A1 (en) 2012-04-12

Family

ID=44957406

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2010/007242 WO2012046906A1 (en) 2010-10-07 2010-10-21 Device and method for providing resource search information on marked correlations between research subjects using a knowledge base from a combination of multiple resources

Country Status (2)

Country Link
KR (1) KR101064981B1 (en)
WO (1) WO2012046906A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111522911A (en) * 2020-04-16 2020-08-11 创新奇智(青岛)科技有限公司 Entity linking method, device, equipment and storage medium

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101127883B1 (en) * 2011-09-26 2012-03-21 한국과학기술정보연구원 Method and system for porviding technology change using of technology life cycle graph
KR101143466B1 (en) 2011-09-26 2012-05-10 한국과학기술정보연구원 Method and system for providing study relation service
KR101148927B1 (en) * 2011-09-26 2012-05-22 한국과학기술정보연구원 Method and system for porviding relevancy technology information using of technology life cycle graph
KR101137973B1 (en) * 2011-11-02 2012-04-20 한국과학기술정보연구원 Method and system for providing association technologies service
US9817898B2 (en) 2011-11-14 2017-11-14 Microsoft Technology Licensing, Llc Locating relevant content items across multiple disparate content sources
KR101823463B1 (en) * 2017-05-23 2018-01-31 한국과학기술정보연구원 Apparatus for providing researcher searching service and method thereof

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004348771A (en) * 2004-09-13 2004-12-09 Matsushita Electric Ind Co Ltd Technical document retrieval device
KR100725643B1 (en) * 2006-06-09 2007-06-07 한국과학기술정보연구원 A research worker result report construction and service system, and method thereof and media that can record computer program for method thereof
KR20090114778A (en) * 2008-04-30 2009-11-04 한국과학기술정보연구원 Apparatus of semantic technological intelligence language mining system for large size database
KR20100054587A (en) * 2008-11-14 2010-05-25 한국과학기술정보연구원 System for extracting ralation between technical terms in large collection using a verb-based pattern
KR101007330B1 (en) * 2008-12-24 2011-01-13 한국과학기술정보연구원 Research and development monitoring and alerting system and method in science and technology

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100952634B1 (en) * 2007-10-05 2010-04-20 한국산업기술진흥원 Analysis system for information and method thereof
KR100963668B1 (en) * 2008-04-30 2010-06-15 한국과학기술정보연구원 Method of semantic technological intelligence language mining for large size database

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004348771A (en) * 2004-09-13 2004-12-09 Matsushita Electric Ind Co Ltd Technical document retrieval device
KR100725643B1 (en) * 2006-06-09 2007-06-07 한국과학기술정보연구원 A research worker result report construction and service system, and method thereof and media that can record computer program for method thereof
KR20090114778A (en) * 2008-04-30 2009-11-04 한국과학기술정보연구원 Apparatus of semantic technological intelligence language mining system for large size database
KR20100054587A (en) * 2008-11-14 2010-05-25 한국과학기술정보연구원 System for extracting ralation between technical terms in large collection using a verb-based pattern
KR101007330B1 (en) * 2008-12-24 2011-01-13 한국과학기술정보연구원 Research and development monitoring and alerting system and method in science and technology

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111522911A (en) * 2020-04-16 2020-08-11 创新奇智(青岛)科技有限公司 Entity linking method, device, equipment and storage medium
CN111522911B (en) * 2020-04-16 2023-04-14 创新奇智(青岛)科技有限公司 Entity linking method, device, equipment and storage medium

Also Published As

Publication number Publication date
KR101064981B1 (en) 2011-09-15

Similar Documents

Publication Publication Date Title
WO2012046906A1 (en) Device and method for providing resource search information on marked correlations between research subjects using a knowledge base from a combination of multiple resources
WO2011096690A2 (en) Portable communication terminal for extracting subjects of interest to the user, and a method therefor
WO2012070840A2 (en) Apparatus and method for consensus search
WO2014092446A1 (en) Searching system and searching method for object-based images
WO2011065630A1 (en) Apparatus and method for analyzing research information about a researcher, and computer-readable storage medium for storing computer-executable program for the method
WO2019093599A1 (en) Apparatus for generating user interest information and method therefor
WO2012050252A1 (en) System and method for automatically generating a mass classifier using a dynamic combination of classifiers
WO2021215620A1 (en) Device and method for automatically generating domain-specific image caption by using semantic ontology
WO2011162446A1 (en) Module and method for deciding named entity of term using named entity dictionary combined with ontology schema and mining rule
WO2021107444A1 (en) Knowledge graph-based marketing information analysis service provision method, and device therefor
WO2012046904A1 (en) Device and method for providing multi -resource based search information
WO2012144685A1 (en) Method and device for visualizing development of technology
JP2004234288A (en) Web search method and device, web search program, and recording medium with the program recorded
WO2021107445A1 (en) Method for providing newly-coined word information service based on knowledge graph and country-specific transliteration conversion, and apparatus therefor
WO2021107446A1 (en) Apparatus and method for providing knowledge graph-based marketing analysis chatbot service
WO2012060502A1 (en) System and method for reasoning correlation between research subjects
WO2020242086A1 (en) Server, method, and computer program for inferring comparative advantage of multi-knowledge
WO2021107448A1 (en) Method and apparatus for providing knowledge graph-based marketing information analysis service to support efficient document classification processing
WO2021107447A1 (en) Document classification method for marketing knowledge graph, and apparatus therefor
WO2018143490A1 (en) System for predicting mood of user by using web content, and method therefor
WO2012144683A1 (en) Method and device for assessing promising stage using promising technology life cycle
WO2012144684A1 (en) Method and device for predicting development speed of technology
WO2012046905A1 (en) Device and method for resource search based on combination of multiple resources
Richter et al. HeidelPlace: An extensible framework for geoparsing
WO2012030049A2 (en) Apparatus and method for classifying similar documents by applying a dynamic threshold value

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10858182

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 10858182

Country of ref document: EP

Kind code of ref document: A1