WO2004104859A1 - テーマ分析装置 - Google Patents

テーマ分析装置 Download PDF

Info

Publication number
WO2004104859A1
WO2004104859A1 PCT/JP2003/006395 JP0306395W WO2004104859A1 WO 2004104859 A1 WO2004104859 A1 WO 2004104859A1 JP 0306395 W JP0306395 W JP 0306395W WO 2004104859 A1 WO2004104859 A1 WO 2004104859A1
Authority
WO
WIPO (PCT)
Prior art keywords
theme
progress
analysis
technical
analyzed
Prior art date
Application number
PCT/JP2003/006395
Other languages
English (en)
French (fr)
Inventor
Yoshio Nakao
Koji Maruhashi
Original Assignee
Fujitsu Limited
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Limited filed Critical Fujitsu Limited
Priority to PCT/JP2003/006395 priority Critical patent/WO2004104859A1/ja
Priority to JP2004572108A priority patent/JPWO2004104859A1/ja
Publication of WO2004104859A1 publication Critical patent/WO2004104859A1/ja

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data

Definitions

  • the present invention relates to a theme analysis device for analyzing the progress of a theme based on materials, a theme analysis method, and a theme analysis program for causing a computer to execute the method.
  • the present invention easily compares progress patterns of a plurality of themes.
  • Patent Document 1 Japanese Patent Application Laid-Open No. 8-2221435
  • information on the latest patent application is acquired, and the distribution of application patents is distributed in the form of a map centered on "application date and one field"
  • Patent Document 2 Japanese Patent Application Laid-Open No. 2000-92585
  • patents are classified from two viewpoints, such as “objective effect” and “components”, and the number of patents is determined based on the number of patents.
  • Patent Document 3 Japanese Patent Laid-Open Publication No. Hei 7-325832
  • text information organized by field is analyzed in chronological order, and words that have become a topic in a specific field / period are detected and detected.
  • Patent Document 4 Japanese Unexamined Patent Application Publication No. 2001-216311
  • Patent Document 5 Japanese Patent Application Laid-Open No.
  • a time-series data set and a document set associated with the time-series data set are analyzed, and the theme information (characteristic information) which characteristically appears in correlation with the fluctuation of the time-series data is analyzed.
  • a technology for statistically detecting various types of events has been disclosed.
  • Patent Document 1
  • Patent Document 2
  • Patent Document 5
  • JP 2002-251590 A JP 2002-251590 A
  • the above-mentioned conventional technology basically promotes the discovery of technology development status and background information at a specific point in time, and directly discovers another R & D theme with related technical aspects. There was a problem that it was not support.
  • technology R & D is generally based on the technology and knowledge available at the time, so even if it is R & D on a different theme, it shows the same progress pattern. It is possible. For example, even if research and development are on different themes, there may be cases in which research and development is stuck at the same time due to the common reason that "trace substances cannot be detected".
  • R & D staff can use the progress pattern of R & D as a clue, it is another R & D theme with a technical aspect that is related to Seki Jun. It is possible to discover themes that are developing through stages. In addition, the knowledge and elemental technologies found in R & D themes found in this way could break the deadlock in their own R & D. In other words, for example, the use of “trace substance detection technology” developed for a certain theme could lead to a dramatic progress in R & D for another theme. Regarding the possibility of discovering such breakthrough technologies, the above-mentioned conventional technologies are insufficient in that they do not directly support the discovery of similar R & D themes in progress patterns.
  • the first conventional technology can assist in grasping the number of technical documents at a specific time, the trend of increase and decrease over time, and the change in the number of technical documents in a specific field.
  • the discovery of areas with similar patterns is left to the capabilities of the user.
  • the second prior art can support the extraction of environmental factors that are correlated with the R & D progress pattern of the technology of interest, but can directly discover other similar R & D themes of the progress pattern. I can't really help.
  • the above-mentioned conventional technology is based on the relationship between the characteristic elements (for example, specific elemental technologies) that the user is paying attention to and the progress pattern of the R & D theme (for example, What progress patterns can be brought about, or what progress At the stage, there was also a problem that it was difficult to analyze the relationship between characteristic elements that could work effectively).
  • characteristic elements for example, specific elemental technologies
  • the progress pattern of the R & D theme for example, What progress patterns can be brought about, or what progress At the stage, there was also a problem that it was difficult to analyze the relationship between characteristic elements that could work effectively.
  • technical data is How to present the progress of multiple technology themes in a form that can be compared and analyzed, and how the relationship between the technological aspects of interest and each progress stage can be listed in multiple technical themes. The issue is whether to present it.
  • the present invention has been made to solve the above-described problems of the conventional technology, and it is possible to easily compare the progress of research and development on a plurality of technical themes, and to provide a technology which has attracted the attention of users.
  • Another technology theme that has similar technical aspects to the theme (Technology development is stagnant at the time of theme analysis, but progress can be expected if elemental technologies used in other technology themes are applied) Technology theme weather Supplement)
  • the purpose of this study is to provide a theme analysis device, theme analysis method, and theme analysis program that can encourage the discovery of (1).
  • the present invention can easily compare the development patterns of R & D for multiple themes, not only for the above-mentioned “technical themes” but also for all themes such as advertisements, products, fashions, and magazines.
  • Themes that have similar aspects to the themes that are being watched by the researcher R & D is stagnant at the time of theme analysis, but if ideas used in other themes are applied, progress can be expected. It is also an object of the present invention to provide a theme analysis device, a theme analysis method, and a theme analysis program that can encourage the discovery of various themes. Disclosure of the invention
  • the present invention relates to a theme analysis device for analyzing the progress of a theme based on materials, and a progress analysis means for analyzing the progress of each theme along the same time axis based on materials corresponding to each theme. And progress status output means for outputting the progress status of each theme analyzed by the progress status analysis means so as to be mutually comparable on the same time axis.
  • the progress of each theme can be analyzed along the same time axis based on the material corresponding to each theme, and the analyzed progress of each theme can be compared with each other on the same time axis Output to Therefore, for example, it is possible to easily compare R & D progress patterns on multiple technology themes.
  • a progress pattern as a clue, another technical theme with similar technical aspects to the technical theme of interest (Technical development is stagnant at the time of theme analysis, but is used for another technical theme Technology that can be expected to advance if the applied elemental technology is applied), and breakthrough technology can be discovered by referring to technical data on that technical theme for technological development. Will be possible.
  • the progress analysis means counts the number of materials issued corresponding to each theme by issuance time for each theme, and
  • the feature is to analyze the progress of each theme according to the number of issues.
  • the number of materials issued corresponding to each theme is totaled for each theme at the time of issuance, and the progress of each theme is analyzed according to the number of materials issued at each issue time. Therefore, for example, by examining at which stage the number of publications of materials corresponding to each technical theme is increasing or decreasing, it is possible to analyze the activity at each stage. As a result, it is possible to easily and specifically compare the progress of R & D on multiple technology themes.
  • the progress analysis means counts the number of occurrences of keywords related to each theme in the material corresponding to each theme for each issue at the issuance time, and displays the keyword appearance at each issuance time.
  • the feature is to analyze the progress of each theme according to the number.
  • the number of appearances of keywords related to each theme in the material corresponding to each theme is tabulated for each theme by issuance time, and the progress of each theme is analyzed according to the number of appearances of the keyword for each issuance time. I do. Therefore, for example, by examining at what stage of development the number of keywords related to a particular aspect of each technical theme is increasing or decreasing, the vigor (activity) of each stage of development can be measured in various aspects. It becomes possible to analyze every. As a result, it is possible to easily and concretely compare the R & D progress patterns of multiple technology themes, and to analyze with a focus on specific technical fields.
  • the progress analysis means issues the referenced material referred to by the material corresponding to each theme and the reference material referred to by Z or the material corresponding to each theme.
  • a special feature is to aggregate the numbers for each theme by issue time and to analyze the progress of each theme according to the number of issues of the referenced material and Z or reference material by issue time.
  • the number of referenced materials that refer to the materials corresponding to the respective themes and / or the number of reference materials that refer to the materials corresponding to the respective themes is totaled for each theme by issuance time, Issuance of the referenced material and / or reference material at the time of issuance Analyze the progress of each theme according to the number of lines. Therefore, for example, by examining at what stage of development the number of issuances of the referenced material and Z or the reference material in the material related to each technical theme is increasing or decreasing, Activities), and as a result, it is possible to easily and concretely compare the progress patterns of R & D on multiple technology themes.
  • the present invention in the above invention, further comprises an element relation analysis means for analyzing a relation with a predetermined element with respect to each progress stage in the progress situation of each theme analyzed by the progress situation analysis means.
  • the progress status output means outputs the progress status of each theme and the association with the predetermined element in each progress stage analyzed by the element relation analysis means.
  • the association with a predetermined element is analyzed, and together with the progress status of each theme, the predetermined factor in the analyzed progress stage is analyzed.
  • the present invention in the above invention, further comprises a development stage similarity analysis means for analyzing a similarity relationship between each development stage based on the progress status of each theme analyzed by the development status analysis means,
  • the progress status output means outputs the progress status of each theme and the similarity between the progress stages analyzed by the progress stage similarity analysis means.
  • the similarity between the development stages is analyzed based on the analyzed progress of each theme, and the similarity between the analyzed development stages is output together with the progress of each theme. Therefore, for example, it is also possible to conduct a more efficient comparison and analysis by focusing on technology themes with similar progress, thereby further improving the R & D progress pattern on multiple technology themes. Compare It becomes possible.
  • the present invention in the above invention, further comprises a theme similarity analyzing means for analyzing a similarity relationship between each theme to be analyzed by the progress situation analyzing means, wherein the progress situation output means comprises a progress situation of each theme.
  • a similarity relationship between the themes analyzed by the theme similarity analysis means is output.
  • the similarity between the themes to be analyzed is analyzed, and the similarity between the analyzed themes is output together with the progress of each theme. Therefore, for example, it is possible to perform comparisons and analyzes more efficiently by focusing on technical themes with similar technical aspects, thereby making progress in R & D on multiple technical themes. It becomes possible to compare patterns more effectively.
  • the present invention further comprises a theme extracting means for analyzing the material and extracting a theme
  • the progress analysis means comprises: for each theme extracted by the theme extracting means, It is especially important to analyze the progress of the development.
  • a theme is extracted by analyzing data, and the progress of each theme is analyzed for each extracted theme. Therefore, for example, it is possible for a user to extract each technical theme by organizing multiple technical documents without having to extract the technical theme by himself. It also makes it easy and convenient to compare development progress patterns.
  • the present invention also provides a theme analysis method ′ for analyzing the progress of a theme based on materials.
  • the method includes analyzing the progress of each theme along the same time axis based on the material corresponding to each theme.
  • the progress of each theme is analyzed along the same time axis based on the material corresponding to each theme, and the progress of each analyzed theme is mutually analyzed on the same time axis.
  • Output for comparison So, for example, This makes it easy to compare R & D progress patterns.
  • using the progress pattern as a clue we found another technical theme with a technical aspect similar to the technical theme we are focusing on, and used the technical data on that technical theme as a reference for technological development. It becomes possible to discover through technology.
  • the present invention further comprises an element relation analysis step of analyzing a relation with a predetermined element for each progress stage in the progress situation of each theme analyzed by the progress situation analysis step.
  • the progress status output step outputs the progress status of each theme and the association with the predetermined element in each progress stage analyzed by the element relation analysis step.
  • the association with a predetermined element is analyzed, and together with the progress status of each theme, the predetermined factor in the analyzed progress stage is analyzed.
  • the present invention in the above invention, further includes a development stage similarity analysis step of analyzing a similarity relationship between each development stage based on the progress situation of each theme analyzed in the development situation analysis step,
  • the progress status output step outputs the progress status of each theme and the similarity between the progress stages analyzed by the progress stage similarity analysis process.
  • the similarity between the development stages is analyzed based on the analyzed progress of each theme, and the similarity between the analyzed development stages is output together with the progress of each theme. Therefore, for example, it is also possible to conduct a more efficient comparison and analysis by focusing on technology themes with similar progress, thereby further improving the R & D progress pattern on multiple technology themes. It is possible to make a comparison.
  • the present invention in the above invention, further includes a theme similarity analysis step of analyzing a similarity relationship between themes to be analyzed by the progress state analysis step, wherein the progress state output step includes a progress state of each theme.
  • a similarity relationship between the themes analyzed by the theme similarity analysis means is output.
  • the similarity between the themes to be analyzed is analyzed, and the similarity between the analyzed themes is output together with the progress of each theme. Therefore, for example, it is possible to perform comparisons and analyzes more efficiently by focusing on technical themes with similar technical aspects, thereby making progress in R & D on multiple technical themes. It becomes possible to compare patterns more effectively.
  • the present invention in the above invention, further comprises a theme extraction step of analyzing the material and extracting a theme, wherein the progress analysis step includes, for each theme extracted by the theme extraction means, The feature is to analyze the progress of the theme.
  • a theme is extracted by analyzing data, and the progress of each theme is analyzed for each extracted theme. Therefore, for example, it is possible for a user to extract each technical theme by organizing multiple technical documents without having to extract the technical theme by himself. It also makes it easy and convenient to compare development progress patterns.
  • the present invention is a theme analysis program for causing a computer to execute a method of analyzing the progress of a theme based on a material, wherein the progress of each theme is determined based on the material corresponding to each theme.
  • the special feature is to make the computer execute the and.
  • the progress of each theme can be analyzed along the same time axis based on the material corresponding to each theme, and the analyzed progress of each theme can be compared with each other on the same time axis Output to So, for example,
  • using the progress pattern as a clue we found another technical theme with a technical aspect similar to the technical theme we are focusing on, and used the technical materials related to that technical theme as a reference for technical development. It becomes possible to discover through-the-wire technology.
  • the present invention further comprises an element relation analysis procedure for analyzing a relation between a predetermined element and each progress stage in the progress situation of each theme analyzed by the progress situation analysis procedure.
  • the progress status output step outputs the progress status of each theme and the association with the predetermined element in each progress stage analyzed by the element relation analysis procedure.
  • the association with a predetermined element is analyzed, and together with the progress status of each theme, the predetermined factor in the analyzed progress stage is analyzed.
  • the computer further includes a development stage similarity analysis procedure for analyzing a similarity relationship between respective development stages based on the progress status of each theme analyzed by the progress analysis process.
  • the progress status output procedure outputs the progress status of each theme and the similarity relation between each progress stage analyzed by the progress stage similarity analysis procedure.
  • the similarity between the development stages is analyzed based on the analyzed progress of each theme, and the similarity between the analyzed development stages is output together with the progress of each theme. Therefore, for example, it is also possible to conduct a more efficient comparison and analysis by focusing on technology themes with similar progress, thereby further improving the R & D progress pattern on multiple technology themes. It is possible to make a comparison.
  • the present invention provides the above-mentioned invention, further comprising: causing a computer to further execute a theme similarity analysis procedure for analyzing a similarity relationship between themes to be analyzed by the progress situation analysis procedure. It is characterized in that the similarity between the themes analyzed by the theme similarity analysis means is output together with the progress of the theme.
  • the similarity relationship between the themes to be analyzed is analyzed, and the similarity relationship between the analyzed themes is output together with the progress status of each theme ( therefore, for example, the technical aspects are similar. It is also possible to conduct comparisons and analyzes more efficiently by focusing on technical themes, thereby making it possible to more effectively compare the R & D progress patterns of multiple technical themes. Becomes possible.
  • the computer further executes a theme extraction procedure for analyzing the material and extracting a theme, wherein the progress analysis procedure is performed for each theme extracted by the theme extraction means.
  • the feature is to analyze the progress of each theme.
  • a theme is extracted by analyzing data, and the progress of each theme is analyzed for each extracted theme. Therefore, for example, it is possible for a user to extract each technical theme by organizing multiple technical documents without having to extract the technical theme by himself. It also makes it easy and convenient to compare development progress patterns.
  • FIG. 1 is a block diagram showing the configuration of the technical theme analyzer according to the present embodiment
  • FIG. 2 is a flowchart showing the overall processing flow of the technical theme analyzer
  • FIG. FIG. 4 is a flowchart showing the flow of the technical theme extraction process.
  • FIG. 4 is a diagram for explaining the calculation of the authority score.
  • FIG. 5 is a flowchart showing the flow of the clustering process.
  • Fig. 7 is a diagram showing a specific example of technology theme extraction (part 1)
  • Fig. 7 is a diagram showing a specific example of technology theme extraction
  • FIG. 8 is a diagram (part 1) showing a display example of the output unit
  • FIG. 9 is a diagram (part 2) showing a display example of the output unit.
  • FIG. 11 is a diagram (part 3) showing a display example of the output unit
  • Fig. 11 is a diagram (part 4) showing a display example of the output unit
  • Fig. 12 is a display example of the output unit.
  • FIG. 13 is a system configuration diagram showing a configuration of a computer system according to another embodiment
  • FIG. 14 is a system configuration diagram showing the computer system shown in FIG.
  • FIG. 2 is a block diagram showing a configuration of a main body in the system.
  • the “technical theme (corresponding to the“ theme ”described in the claims)” used in the present embodiment refers to a technical subject that can be extracted from technical materials such as technical papers and patent gazettes.
  • “gene analysis for animals” and “gene analysis for plants” correspond to this.
  • the term “progress of a technical theme (corresponding to the“ progress of a theme ”described in the claims) :)) used in the present embodiment refers to the degree of activity or activity (activity) of a technical theme. Refers to the situation when viewed in chronological order.Specifically, as shown in Fig. 2, etc., the development stage where the R & D of the technical theme is developing or stagnating, and the development is rapid Indicated by the stage of progress.
  • FIG. 1 is a block diagram showing a configuration of a technical theme analysis device according to the present embodiment
  • FIG. 2 is a flowchart showing a flow of overall processing by the technical theme analysis device.
  • the technical theme analysis device 10 shown in Fig. 1 is a device that roughly analyzes the progress of a technical theme based on technical data in order to support technical trend analysis based on technical data.
  • the main feature is that it allows easy comparison of R & D progress patterns on multiple technology themes.
  • the technical theme analyzer 10 first inputs a selection condition from a user to select technical materials to be analyzed. Accept (Step S201).
  • the purpose is to select the analysis target from the technical data DB 14a, which stores a large amount of technical data.
  • the conditions to be specified are, for example, keywords for limiting the target field, target technologies, etc.
  • the time of publication of the material corresponds.
  • the technical theme analyzer 10 obtains technical data matching the selection condition from the technical data DB 14a, and analyzes the obtained technical data to identify the same.
  • the related technical theme is extracted (step S202). Specifically, Based on the similarity between the author information of the technical material and the content of the technical material, as shown in Fig. 2, each technical theme is extracted in the form of grouping (organizing) the technical materials for each technical theme.
  • the technology theme analysis device 10 analyzes the progress of each technology theme along the same time axis based on the technical materials grouped for each technology theme (step S20). 3). To give a concrete example, the number of technical materials issued for each technical theme is tabulated for each issue, and the number of materials issued for each issue is calculated. Is determined to be an activity) and the progress of each technical theme is analyzed.
  • the technology theme analyzer 10 visualizes the powerful analysis results and displays the progress of each technology theme on the same time axis. Output so that they can be compared with each other (step S204). Specifically, as shown in Fig. 2, the progress (vitality, activity) of each technical theme is displayed and output by year.
  • the user who has received the display output can easily make progress in research and development on a plurality of technical themes as described above. Can be compared to As a result, based on the progress pattern, another technical theme with similar technical aspects to the technical theme of interest (used in the technical theme of power, whose technical development is stagnant at the time of theme analysis)
  • elemental technologies it is possible to discover breakthrough technologies by finding technical topics that can be expected to make progress, and using technical materials on the technical themes as references for technological development. become.
  • the technical aspect that the user pays attention to is useful at any stage of progress in the progress of each technical theme. Analysis, and the ability to conduct more efficient comparison analysis by focusing on technical themes with similar progress and technical themes with similar technical aspects.
  • the users themselves have the technical theme Instead of extracting the technical themes, it is necessary to extract each technical theme by organizing multiple technical documents, and to appropriately extract the technical themes from the viewpoint of the contribution of the research subject (author of the technical paper) in the technical field. , which are described later.
  • the technical theme analyzer 10 includes an input unit 11, an output unit 12, an input / output control IF unit 13, a storage unit 14, and a control unit 15. Is done.
  • the input unit 11 is an input means for receiving input of various types of information, and includes a keyboard, a mouse (pointing device), and a microphone. Accept from the user and enter.
  • the output unit 12 is an output unit that outputs various types of information, and includes a monitor (or a display or a touch panel) and a speaker. For example, the output unit 12 can monitor the progress of the technical theme as described above. Output to the user.
  • the input / output control IF unit 13 is a means for controlling the input / output of data by the input unit 11 and the output unit 12.
  • the storage unit 14 is storage means (storage means) for storing data and programs necessary for various processes by the control unit 15. Particularly relevant to the present invention are functionally conceptual It has a technical literature DB (database) 14a that stores a large amount of technical literature.
  • the control unit 15 has a control program such as an OS (Operating System), a program defining various processing procedures, and an internal memory for storing necessary data.
  • OS Operating System
  • the processing contents of these units will be described later.
  • the above-mentioned technical theme analyzer 10 is provided with the functions of the above-described units in a known personal computer, workstation, or information processing device such as a mobile phone, a PHS terminal, a mobile communication terminal, or a PDA. This can be achieved by doing so.
  • the technical theme extractor 15a stores the technical data that matches the selection conditions (keywords for limiting the target field and the timing of issuance of the target technical data) input by the user into the technical data DB1. 4
  • This is a processing unit that obtains from a and analyzes the obtained technical materials and extracts the same or related technical themes. In this way, by analyzing the materials and extracting the themes, it is not necessary for the user to extract the technical themes, but to extract each technical theme by organizing multiple technical materials. This makes it possible to easily and easily compare the progress of research and development on each technology theme.
  • the technical theme extraction unit 15a groups the authors hierarchically according to their contribution to the collection of materials, and extracts themes corresponding to each group. That is, the details will be described later with reference to Fig. 3, etc., but roughly, the range of contribution of each researcher to the technical data set is estimated based on the correspondence between technical data and R & D. Then, a set of materials involving R & D with a wide range of contributions is extracted as a set of materials related to a large technical theme, and the same procedure is used to recursively extract technical themes from the extracted set of materials. Search for a group of hierarchical technical themes.
  • the technical theme extraction unit 15a further converts each technical theme into similarity in content. It is also possible to perform clustering based on these and extract themes corresponding to each cluster. In other words, the purpose is to cluster the extracted technical themes in accordance with the similarity of the contents, whereby the technical themes can be more appropriately extracted. The details of this process will be described later with reference to FIG.
  • the technical theme extraction unit 15a further performs a similarity relationship between the contents of the materials corresponding to each technical theme and a reference relationship (relationship with reference materials referencing the materials corresponding to each technical theme). Based on and / or referenced relationships (relationships with referenced materials referenced by the documents corresponding to each technical theme), each technical theme can be integrated and Z or subdivided and extracted. In other words, the purpose is to aim and subdivide the extracted technical themes from various points of view, which makes it possible to more appropriately extract the technical themes.
  • FIG. 3 is a flowchart showing the flow of the technical theme extraction process.
  • the technical theme extraction unit 15a first initializes a technical data collection queue (step S301). That is, the technical data set queue is cleared, and the technical data set obtained by selecting from the technical data DB 14a power is added as the first processing target. Subsequently, the technical theme extraction unit 15a determines whether the technical data collection queue is empty (step S302), and if it is empty (step S302 affirmative), The theme extraction processing is completed, and if it is not empty (No at Step S302), the processing after Step S303 is continued.
  • the “authority author list” is a list of authors with a high authority score, as shown in Fig. 3 (c). For example, authors with an authority score of 0.2 or more are authoritative authors. And create a list of leading authors.
  • the authoritative score referred to here is such a score that the author who strongly leads the research and development of the technical theme related to the collection of materials gets higher, and here, as shown in Fig. , And is calculated by dividing the number of materials whose author is the leading author by the number of materials in the target material set.
  • the “leading author” refers to the author who is the effective author of a material and has the largest number of published materials in the collection of materials.
  • the “effective author” is the previous process, Authors other than those that were selected as leading authors in the creation of the target material set.
  • the data set consists of five materials, Material 1 (doc-l) to Material 5 (doc- 5 ), and the authors of materials doc-1 and doc- 2
  • Author 1 (author-1), Author 2 (author-2), and two authors of document doc-3 are author 1 (author-1) and author 3 (author-3), and document doc-4
  • the authoritative score is 4/5 for author-1 and 4/5 for author-2. 1/5, 0 for author-3.
  • step S305 determines whether the influential author list is empty (step S305), and If there is (step S305 affirmative), the process is repeated from step S301, and if not empty (step S305 no), the process from step S306 is continued .
  • the technical theme extraction unit 15a clusters the extracted material set based on the similarity of the material contents (step S308).
  • various known methods can be used as the clustering method. The method used in the present embodiment will be described later with reference to FIG.
  • the technical theme extraction unit 15a adds the material cluster obtained as a result of the clustering to the technical material collection queue, and Repeat the process.
  • FIG. 5 is a flowchart showing a procedure of the clustering process. As shown in the figure, the technical theme extraction unit 15a first calculates the similarity for all combinations of materials (step S501).
  • the “similarity” is a parameter value that increases as the combination of materials having similar contents increases, and is obtained, for example, by using an inner product of a feature vector of each material.
  • a “feature vector” is a vector whose element is a value indicating the characteristic of the material content.For example, a vector whose element is the number of occurrences of keywords contained in the material is standardized to a size of “1”. It can be converted into a feature vector.
  • the technical theme extraction unit 15a selects a set of materials having the highest similarity based on the similarity calculation result (step S502). Then, it is determined whether or not the similarity “s” of the selected set of materials is equal to or greater than a predetermined threshold “h” (step S503). (503 No)) On the other hand, if the processing is terminated, but is equal to or more than the threshold value “h” (Yes at Step S503), the processing from Step S504 is continued.
  • the set of selected materials (the set of materials having the highest similarity) is merged (step S503). Four ) . Then, the similarity is recalculated for the merged data set (step S505), and the process is repeated from step S501.
  • the characteristic vector of the material group as a result of the merger shall be the center of gravity of the characteristic vector of the material in the material group.
  • Fig. 6 and Fig. 7 are diagrams showing a specific example of technology theme extraction.
  • the ellipses correspond to the extracted technical themes, and materials related to the technical themes are shown in the ellipses.
  • the “underlined character string attached to the ellipse” is a character string used as a technical theme name in the subsequent processing (each processing described later).
  • a character string created by concatenating the leading author names Is used as the technical theme name.
  • the specific example shown in FIG. 6 is a result of processing the data set shown in FIG. 4 (a) by omitting the clustering process (step S308 in FIG. 3). It is a fruit.
  • the specific example shown in Fig. 7 is the result when the clustering process is executed, and the data set on the technical theme of Author-lJ is “Author-1.1” and “Au or -1.2 ”is divided into technical themes.
  • the progress analysis section 15b is a processing section that analyzes the progress of each technical theme along the same time axis based on the technical data corresponding to each technical theme. Specifically, referring to the technical documents grouped for each technical theme extracted by the technical theme extractor 15a, the vitality of each technical theme is analyzed for each technical document issuance time. I do.
  • any analysis method can be adopted as long as it can show the vitality of each technical theme in a time series, but here, (1) The number of issued technical documents (2) Analysis methods based on the number of occurrences of keywords, and (3) Analysis methods based on the number of issued reference materials and reference materials I will tell.
  • the progress analysis unit 15b aggregates the number of documents issued for each technical theme by issue time for each technical theme, and according to the number of materials issued for each issue time, Analyze progress.
  • the number of technical documents (technical documents grouped for each theme) corresponding to each technical theme is totaled for each issue date, and the results can be output as an indicator of the progress of R & D on each technical theme. .
  • the progress analysis section 15b sums up the number of occurrences of keys associated with each technology theme by issue time for each technology theme, and according to the number of occurrences of keys at each issue time. To analyze the progress of each theme.
  • words that appear characteristically in each technical document are extracted as keywords from the technical documents corresponding to each technical theme. Then, the number of occurrences of the extracted keywords in the set of materials to be analyzed or the set of related materials is tabulated by the publication date of the documents, and the results are normalized. Enable output as an indicator of development progress.
  • the collection of materials for which the frequency of occurrence of keywords is to be counted may be the collection of materials corresponding to the technical theme itself, or may be another collection of materials issued during the analysis period.
  • a data set is acquired from the technical data DB 14a via the management unit (not shown) that manages the technical data DB 14a, and the frequency of occurrence of the keyword is counted or Alternatively, if the management unit provides a function of counting the frequency of occurrence of a keyword, the function may be used to count.
  • the activity at each development stage is analyzed by examining at which development stage the number of appearances of keywords related to each technical theme is increasing or decreasing. As a result, it is possible to easily and concretely compare R & D progress patterns on multiple technology themes.
  • the purpose of such an analysis method is to estimate the progress of research and development, based on keywords that represent technical aspects related to the technical theme.
  • the technical theme can have various technical aspects, so it is preferable to select keywords that are appropriate for the user's purpose. For example, if a user wants a comprehensive overview of the progress, the progress (the number of occurrences) is calculated based on the frequency of appearance of many keywords, and the progress is grasped from a specific technical aspect. If it is desired, the user may be prompted to select a keyword to be counted, and the progress (number of appearances) may be calculated only for the selected keyword.
  • the progress analysis section 15b calculates the number of issued reference materials that refer to the referenced material and / or the material corresponding to each theme by the material corresponding to each technical theme.
  • Each issue is compiled by issue time, and the progress of each theme is analyzed according to the number of issuance of the referenced material and / or reference material by issue time.
  • materials that are referred to by the technical data on each technical theme referenced materials
  • materials that refer to the technical data on each technical theme reference materials
  • the number of issued reference materials and referenced materials will be tabulated for each issue date, and the tabulated results can be output as an indicator of the progress of R & D on technology themes.
  • the progress visualization unit 15c outputs the progress of each technical theme analyzed by the progress analysis unit 15b at the output unit 12 so that they can be compared with each other on the same time axis. This is a processing unit.
  • a screen as shown in FIG. 8 is output to the output unit 12.
  • the left pane shows the technical themes
  • the right pane shows the progress of each technical theme.
  • the character strings in the left pane are the technical theme names.
  • the technical theme names are indicated by concatenating the leading author names.
  • “+”, “one” and “ ⁇ ” on the left end indicate the display state of the subdivision theme.
  • “+” indicates that the technical theme can be subdivided into smaller technical themes, and the user specifies this part with a pointing device (input unit 11) as necessary.
  • the output unit 12 can be instructed to display the subdivision theme.
  • “ ⁇ ” indicates that the theme is the most subdivided theme.
  • each senor in the right pane shows the progress of each technology theme at each time in chronological order.
  • the denser the cells the larger the research at this time. Show that development is progressing (high activity) I have.
  • the number of publications related to technical themes the number of appearances of keywords related to technical themes, and the number of publications of reference materials and referenced materials The higher the number, the higher the density in the cell at that time is displayed.
  • the progress patterns of R & D on multiple technology themes.
  • the element-related analysis unit 15d associates a predetermined element (for example, a technical aspect specified by the user) with each progress stage in the progress status of each theme analyzed by the progress status analysis unit 15. This is a processing unit that analyzes the association. Then, as shown in Fig. 9, the above-mentioned progress status visualization unit 15c, together with the progress status of each technology theme, and the predetermined elements at each development stage analyzed by the element relation analysis unit 15d Outputs the relation of.
  • a predetermined element for example, a technical aspect specified by the user
  • the screen shown in Fig. 9 illustrates the relationship between the technical aspect (Feature) of the user's attention and each development stage.
  • the user This is the state after inputting an instruction to display the appearance of the technical aspects of “Feature-l” and “Feature-2”.
  • ⁇ (circle) in the figure corresponds to the side of “Feature-1”, and “ ⁇ ” (star) corresponds to the side of “Fuature-2”.
  • the display position of the figure corresponds to the development stage of the technical theme in which the aspect appeared, and the size corresponds to the strength of appearance (the degree of association between the element specified by the user and the development stage).
  • any analysis method can be adopted as long as it can show the degree of association between the element and the development stage in a time series.
  • the following describes (1) an analysis method based on the number of technical materials issued, (2) an analysis method based on the number of appearances of keywords, and (3) an analysis method based on the number of published materials involving the author.
  • the element-related analysis unit 15d collects the number of documents that correspond to each technical theme and also corresponds to the element specified by the user by issue time for each theme, and Analyze the relationship with the factors at each stage of development according to the number of issues.
  • technical data related to the technical aspects specified by the user is obtained from the technical data DB 14a, and based on the distribution of the issuance time, for example, the higher the number of issuance, the more relevant Analyze that the sex is strong. Then, by using the issuance status of technical materials related to the technical aspect of the user's attention as an index, it is possible to output the relationship between the users in a form that can be listed over each technical theme.
  • the element-related analysis unit 15d aggregates the number of occurrences of keywords related to a given element in the material corresponding to each theme for each issue at the issuance time, and The relationship with the elements at each stage of development To analyze.
  • the relationship between the two can be output in a form that can be listed over each technical theme.
  • the element-related analysis unit 15d compiles, for each material corresponding to each technical theme, the number of materials issued by the subject (author) related to a given element for each theme at the time of publication. Then, the relationship with the elements at each development stage is analyzed according to the number of issuances for each issuance period.
  • the number of publications is large Analyze that the more advanced the stage, the stronger the relevance. Then, by using the issuance status of technical documents related to the research subject related to the technical aspect of the user's focus as an index, the relationship between the two can be output in a form that can be listed over each technical theme. Therefore, according to the powerful analysis method, it is necessary to examine the power at which the number of technical documents related to the technical aspect of the user's attention is increasing or decreasing at which stage the number of technical publications is increasing. It will also be possible to specifically analyze the relationship between aspects and progress patterns of each technical theme.
  • This progress stage similarity analysis section 15 e Based on the progress of each theme analyzed in 15b, it is a processing unit that analyzes the similarity between each progress stage.
  • the progress visualization unit 15c described above shows the progress status of each technology theme and the similarity between the development stages analyzed by the development stage similarity analysis unit 15e. Is output.
  • the screen shown in Fig. 10 highlights similar development stages according to the user's designation, and in the screen state shown in Fig. 9, the user operates the pointing device. This is the state after specifying the cell in the lower right corner. More specifically, in the powerful screen, “ ⁇ (double circle)” indicates a cell specified by the user, and the arrowhead points to a development stage similar to the R & D corresponding to the specified cell. It indicates a set of “technical theme—time”, and the thickness of each arrow indicates the degree of similarity.
  • a value indicating the progress status compiled by the progress stage analysis unit 15b (for example,
  • the similarity matching algorithm is then used to determine the similarity between technical themes and the appearance time of similar progress patterns.
  • a similar character string matching algorithm a known method can be used.For example, it is called ⁇ BLAST '' or ⁇ FASTA '' used for partial matching of genome and amino acid sequences in the field of life science. The method should be used.
  • the similar partial sequence may be obtained by using “BLAST” or “FAS TA” based on the part where the index (value) of the discretized progress status completely matches. It is desirable to calculate the similar partial sequence while allowing the deviation.
  • the technical theme similarity analysis unit 15f is a processing unit that analyzes the similarity between the technical themes to be analyzed by the progress analysis unit 15b.
  • the progress visualization section 15c described above was analyzed by the technical theme similarity analysis section 15f along with the progress of each technical theme, as shown in Figs. 11 and 12.
  • the similarity between each technical theme is output.
  • the screen shown in Fig. 11 is a display in which the technical themes having similar technical aspects are distinguished from each other. This is a state after an instruction to display the images in different colors has been given. This screen shows that the technical themes “Author-1.2” and “Author-2” include many similar technical aspects.
  • the screen shown in FIG. 12 emphasizes and displays a technical theme having a similar aspect to the technical theme that the user is paying attention to.
  • any analysis method from any viewpoint can be adopted as long as it is a method of analyzing the similarity between them.
  • (1) Document contents The following describes the analysis method based on the information, (2) the angle analysis method based on the reference information, and (3) the analysis method based on the author information.
  • the technical theme similarity analysis unit 15f analyzes the similarity relationship between the technical themes based on the contents of the technical data corresponding to each technical theme.
  • the similarity of the contents of the data set corresponding to the technical themes is calculated.
  • the “similarity” is a value that becomes larger as the content sets have similar contents.
  • the inner product of the feature vectors of each data set may be used.
  • a “feature vector” is a vector whose elements are values that indicate the characteristics of the contents of a material set.For example, a vector whose elements are the number of occurrences of keywords contained in each material in the material set has a size of After setting the standard to “1”, the feature vector of each material is used. Then, for each set of materials, the feature vector of each material can be obtained by calculating the center of gravity of the feature vector of the material included in the set.
  • the technical theme similarity analysis section 15f analyzes the similarity between the technical themes based on the reference information of the technical data corresponding to the technical themes.
  • the materials referred to by the technical materials on each technical theme (referenced materials) Or, extract materials (reference materials) that refer to technical materials on each technical theme.
  • the relevance between technical themes is determined based on the similarity between the sets of reference materials and referenced materials.
  • the calculation of the similarity may be performed in the same procedure as that based on the similarity of the contents of the materials.
  • the comparison of the reference information of the technical materials narrows the target of the technical theme, so that the comparison can be performed more efficiently. And analysis can be performed.
  • the technical theme similarity analysis unit 15f analyzes the similarity relationship between technical themes based on the author information (information on the involvement of the research subject) of the technical material corresponding to each technical theme.
  • a set of R & D developers (authors) involved in the collection of technical materials on each technical theme is obtained. Then, based on the similarity of the R & D set, the relevance between technical themes is determined.
  • the calculation of the similarity may be performed in the same procedure as that based on the similarity of the contents of the materials.
  • the feature vector of each R & D set can be obtained.
  • the value of the vector element may be adjusted in consideration of the hierarchical relationship between the R & D developers extracted in the technical theme extraction processing (assuming the technical theme hierarchical relationship as the relationship between the leading authors).
  • the technical theme analysis apparatus 10 it is possible to automatically extract a technical theme relating to a data set to be analyzed and analyze the progress of a plurality of technical themes while comparing them. Output to the user in the form. by this, Users will be able to easily compare R & D progress patterns on multiple technology themes. Then, based on the progress pattern, another technical theme with a technical aspect similar to the technical theme of interest is found, and at some point it is stagnant, but it is being used by another technical theme Applying elemental technologies makes it possible to discover potential technology themes that can be expected to make progress.
  • the present invention is not limited to this. It is also possible to group the technical materials according to the technical theme before processing.
  • the technical theme is extracted based on the author information of the technical material.
  • the present invention is not limited to this.
  • the technical theme is assigned to the technical material. The same can be applied when extracting technical themes based on other information that can be obtained from technical documents, such as classification codes.
  • the present invention is not limited to this. For example, for all themes such as advertising, merchandise, fashion, magazines, etc. However, it can be applied in a similar way to encourage the discovery of another theme that has similar aspects to the theme of interest.
  • the technical theme analyzer 10 performs the analysis processing in a stand-alone form has been described.
  • the present invention is not limited to this, and the present invention is not limited to this. It may be configured as a “technical theme analysis server device” that provides analysis services to users of client devices that are connected via a connection.
  • each component of each device illustrated is a functional concept and does not necessarily need to be physically configured as illustrated.
  • the specific form of distribution / integration of each device is not limited to the one shown in the figure, and all or a part of it is distributed functionally or physically in arbitrary units according to various loads and usage conditions.
  • Can be integrated and configured.
  • all or any part of each processing function performed by each device can be realized by a CPU and a program analyzed and executed by the CPU, or can be realized as hardware by wired logic.
  • FIG. 13 is a system configuration diagram showing a configuration of a computer system according to another embodiment
  • FIG. 14 is a block diagram showing a configuration of a main body in the computer system.
  • this computer system 1 Reference numeral 00 denotes a main unit 101, a display 102 for displaying information such as images on a display screen 102a in accordance with an instruction from the main unit 101, and a keyboard 103 for inputting various information to the computer system 100. And a mouse 104 for designating an arbitrary position on the display screen 102a of the display 102.
  • the main unit 101 of the computer system 100 includes a CPU 121, a RAMI 22, a ROM 123, a hard disk drive (HDD) 124, and a CD-ROM drive 125 for receiving a CD-ROM 109.
  • an FD drive 126 that accepts a flexible disk (FD) 108, an I / O interface 127 that connects the display 102, keyboard 103 and mouse 104, and a local or wide area network (LAN / WAN) 106 It has a LAN interface 128 for connection.
  • FD flexible disk
  • I / O interface 127 that connects the display 102, keyboard 103 and mouse 104
  • LAN / WAN local or wide area network
  • a modem 105 for connecting to a public line 107 such as the Internet is connected to the computer system 100, and another computer system (PC) is connected via a LAN interface 128 and a LAN / WAN 106. ) 11 1, server 1 12 and printer 113 are connected.
  • the computer system 100 realizes functions similar to those of the above-described embodiment by reading and executing a program recorded on a predetermined recording medium.
  • the predetermined recording medium is a “portable physical medium” such as a flexible disk (FD) 108, a CD-ROM109, an MO disk, a DVD disk, a magneto-optical disk, an IC card, and a computer system.
  • the program referred to in the other embodiments is a computer-readable recording medium such as the “portable physical medium”, “fixed physical medium”, and “communication medium”.
  • the computer system 100 realizes the same functions as those of the above-described embodiment by reading and executing a program from such a recording medium.
  • the program referred to in the other embodiments is not limited to being executed by the computer system 100, but may be executed by another computer system 111 or server 112. The present invention can be similarly applied to a case where the programs are executed in cooperation with each other.
  • the present invention for example, it is possible to easily compare the progress patterns of research and development on a plurality of technical themes. As a result, using the progress pattern as a clue, another technology theme with similar technical aspects to the technology theme of interest (technical development is stagnant at the time of analysis of the theme, but is being used for another technology theme) By applying the elemental technologies that have been developed, it is possible to find a technology theme for which progress can be expected, and to use the technical data on that technical theme as a reference for technology development, thereby enabling the discovery of blur-through technology. .
  • the vitality of each development stage is analyzed.
  • the vitality at each development stage can be analyzed for various aspects.
  • the present invention for example, by examining at what stage of development the number of issuances of referenced and / or reference materials in the material related to each technical theme increases or decreases, etc. It is possible to analyze the activity of each stage, and as a result, it is possible to easily and concretely compare the R & D progress patterns of multiple technology themes.
  • the theme analysis device, the theme analysis method, and the theme analysis program according to the present invention are suitable, for example, for easily comparing the progress patterns of research and development on a plurality of technical themes.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

技術テーマ分析装置(10)は、利用者から、分析対象とする技術資料を選別するための選別条件の入力を受け付ける。そして、選別条件に合致する技術資料を技術資料DB(14a)から取得し、取得した技術資料を解析して同一ないし関連する技術テーマを抽出する。続いて、技術テーマごとにグループ化された技術資料に基づいて、各技術テーマの進展状況を同一の時間軸に沿って解析する(例えば、各技術テーマに対応する技術資料の発行数をテーマごと発行時期別に集計する)。そして、かかる解析結果を可視化して、各技術テーマの進展状況を同一の時間軸上で相互に比較可能に出力する。

Description

明 細 書
テーマ分析装置
技術分野
この発明は、 テーマの進展状況を資料に基づいて分析するテーマ分析装置、 テ 一マ分析方法およびその方法をコンピュータに実行させるテーマ分析プログラム に関し、 特に、 複数のテーマの進展パタンを容易に比較することができるテーマ 分析装置、 テーマ分析方法およびテーマ'分析プログラムに関するものである。 背景技術
従来から、 技術資料に基づく技術動向分析を支援する技術としては、 第 1に、 技術資料に付与された分類コードゃ、 技術資料に特徴的に現れる単語等によって 技術資料を分類し、 分類別の資料数の多寡や経時的な増減傾向を示す技術などが 知られている。
例えば、 特許文献 1 (特開平 8 _ 2 2 1 4 3 5号公報) では、 最新の特許出願 の情報を取得し、 「出願日一分野」 を軸とするマップの形で出願特許の分布を図 示し、 あるいは、 年度単位の.出願件数を出願人別にグラフ表示する技術が開示さ れている。
また、 特許文献 2 (特開 2 0 0 1— 9 2 8 2 5号公報) では、 「目的 '効果」 や 「構成要素」 のような 2つの観点から特許を分類し、 特許件数の多寡および経 時的な増減傾向を分類別に図形表示してパテントマップを生成する技術が開示さ れている。
なお、 これらの技術によって、 利用者は、 ある時点における、 ある分野の技術 の開発状況を概観し、 特許戦略の策定の参考とすることなどが可能になる。 さらに、 技術資料に基づく技術動向分析を支援する第 2の技術として、 文献資 料に特徴的に出現する単語の経時的な出現状況を手がかりに、 トレンドを分析す る技術も知られている。
例えば、 特許文献 3 (特開平 7— 325832号公報) では、 分野別に整理し たテキスト情報を時系列に沿って分析して、 特定の分野 ·期間において話題とな つた単語を検出し、 検出した単語おょぴそれらの単語を含むテキストを提示する ことによって、 トレンド分析 ·動向分析を支援する技術が開示されている。 また、 特許文献 4 (特開 2001— 216311号公報) では、 イベントと関 係付けられた文書、 あるいは、 イベントと時期的に関連のある文書に含まれる単 語の出現数の経時的変化を、 ィベントの発生時期と対応づけて表示することによ つて、 イベントとトレンドの関連の分析を支援する技術が開示されている。 また、 特許文献 5 (特開 2002-251590号公報) では、 時系列データ セットおよびそれと対応づけられた文書セットを分析し、 時系列データの変動と 相関して特徴的に現れるテーマ情報 (特徴的な事象の種類等) を統計的に検出す る技術が開示されている。
なお、 これらの技術によって、 利用者は、 技術開発とトレンドとの関係を分析 し、 技術の背景となるような話題や環境要因の抽出や、 有用な関連情報の発見の 手がかりを得ることができる。
特許文献 1
特開平 8— 221435号公報
特許文献 2
特開 2001— 92825号公報
特許文献 3
特開平 7— 325832号公報
特許文献 4
特開 2001— 216311号公報
特許文献 5
特開 2002— 251590号公報 しかしながら、 上記した従来技術は、 基本的に、 特定の時点における技術の開 発状況や背景情報の発見を促すものであり、 関連する技術側面を持つ別の研究開 発テーマの発見を直接的に支援するものではないという問題があった。
これを具体的に説明すると、 技術の研究開発は、 一般に、 その時点で利用可能 な技術や知見に基づいて行われるので、 異なるテーマの研究開発であっても、 同 じょうな進展パタン,を示すことがあり得る。 例えば、 異なるテーマの研究開発で あっても、 「微量な物質の検出ができない」 といった共通の理由で、 同時期に研 究開発が行き詰まってしまうような場合が考えられる。
このような場合に、 研究開発者は、 研究開発の進展パタンを手がかりにするこ とができれば、 関淳する技術側面を持つ別の研究開発テーマであって、 自己の研 究開発と同様の進展段階を経て発展しつつあるテーマを発見できる可能性がある 。 そして、 このようにして発見した研究開発テーマにおける知見や要素技術によ つて、 自己の研究開発の行き詰まりを打破できる可能性がある。 すなわち、 例え ば、 あるテーマに関して開発された 「微量物質の検出技術」 を利用することによ つて、 別のテーマの研究開発に飛躍的進展をもたらすことなどが考えられる。 このようなブレークスルー技術発見の可能性に対して、 上記した従来技術は、 進展パタンの類似した研究開発テーマの発見を直接的には支援していないという 点で不十分である。 つまり、 第 1の従来技術では、 特定の時期における技術資料 数の多寡や経時的な増減傾向や、 特定の分野の技術資料数の増減パタンの把握を 支援することはできるが、 資料数の増減パタンが類似する分野の発見は、 利用者 側の能力に委ねられることになる。 同様に、 第 2の従来技術では、 注目する技術 に関する研究開発の進展パタンと相関のある環境要因の抽出を支援することはで きるが、 進展パタンの類似した別の研究開発テーマの発見を直接的には支援でき なレ、。
さらに、 上記した従来技術は、 利用者が注目している特徴的な要素 (例えば、 特定の要素技術) と、 研究開発テーマの進展パタンとの関係 (例えば、 特徴的な 要素が、 どのような進展パタンをもたらし得るのか、 あるいは、 どのような進展 段階において、 特徴的な要素が有効に働き得るかといつた関係) を分析すること が困難であるという問題もあった。
すなわち、 第 1の従来技術では、 利用者が着目している研究開発テーマや技術 側面に関して、 特定の時期の進展状況を把握することはできるが、 出現時期は異 なるが進展段階としては同じような状況にあるテーマを見出すことは困難である 。 このため、 例えば、 「ある進展段階において、 強く現れる可能性が高い技術側 面は何か」 といった観点からの分析は困難であり、 また、 例えば、 「ある時期に 特定の技術側面が強く働レ、た研究テーマにおレ、て、 次にどのような技術側面が現 れる可能性が高いか」 といったように、 時系列に沿って技術側面間の関係を分析 することも困難である。
同様に、 第 2の従来技術では、 特定のテーマについて、 「各進展段階でどのよ うな技術側面 (話題や環境要因) が強く働くのか」 といった観点の分析は容易に 行うことができるが、 「特定の進展段階において、 複数テーマで共通に強く働く ことが多い技体于側面は何カ 、 あるいは、 「特定の進展段階において、 特定の技 術側面が強く働くテーマにはどのようなものがあるのか」 といった観点からの分 析は困難である。
上述してきたように、 論文や特許広報等の技術資料に基づく技術動向分析を支 接する技術 (一般的には、 テーマの進展状況を資料に基づいて分析する技術) に おいては、 技術資料を、 複数の技術テーマの進展状況を対比分析できる形で如何 にして提示するか、 さらには、 着目している技術側面と各進展段階との関係を、 複数の技術テーマにわたって一覧できる形で如何にして提示するかが課題になつ ている。
そこで、 この発明は、 上述した従来技術による課題を解消するためになされた ものであり、 複数の技術テーマに関する研究開発の進展パタンを容易に比較する ことができ、 利用者が注目している技術テーマと類似した技術側面を持つ別の技 術テーマ (テーマの分析時点では技術開発が停滞しているが、 別の技術テーマで 利用されている要素技術を適用すれば、 進展が期待できるような技術テーマの候 補) の発見を促すことができるテーマ分析装置、 テーマ分析方法おょぴテーマ分 析プログラムを提供することを目的とする。
なお、 この発明は、 上記の 「技術テーマ」 だけでなく、 広告、 商品、 フアツシ ヨン、 雑誌などのあらゆるテーマに関して、 複数のテーマに関する研究開発の進 展パタンを容易に比較することができ、 利用者が注目しているテーマと類似した 側面を持つ別のテーマ (テーマの分析時点では研究開発が停滞しているが、 別の テーマで利用されているアイデアを適用すれば、 進展が期待できるようなテーマ の候補) の発見を促すことができるテーマ分析装置、 テーマ分析方法およびテー マ分析プロダラムを提供することも目的とする。 発明の開示
本発明は、 テーマの進展状況を資料に基づいて分析するテーマ分析装置であつ て、 各テーマに対応する資料に基づき、 各テーマの進展状況を同一の時間軸に沿 つて解析する進展状況解析手段と、 前記進展状況解析手段によつて解析された各 テーマの進展状況を前記同一の時間軸上で相互に比較可能に出力する進展状況出 力手段と、 を備えたことを特徴とする。
この発明によれば、 各テーマに対応する資料に基づき、 各テーマの進展状況を 同一の時間軸に沿って解析し、 解析された各テーマの進展状況を同一の時間軸上 で相互に比較可能に出力する。 したがって、 例えば、 複数の技術テーマに関する 研究開発の進展パタンを容易に比較することが可能になる。 その結果、 進展パタ ンを手がかりに、 注目している技術テーマと類似した技術側面を持つ別の技術テ 一マ (テーマの分析時点では技術開発が停滞しているが、 別の技術テーマで利用 されている要素技術を適用すれば、 進展が期待できるような技術テーマ) を見つ け、 その技術テーマに関する技術資料を技術開発の参考とすることによって、 ブ レークスルー技術を発見することなどが可能になる。
また、 本発明は、 上記の発明において、 前記進展状況解析手段は、 各テーマに 対応する資料の発行数をテーマごと発行時期別に集計し、 当該発行時期別の資料 発行数に応じて各テーマの進展状況を解析することを特徴とする。
この発明によれば、 各テーマに対応する資料の発行数をテーマごと発行時期別 に集計し、 当該発行時期別の資料発行数に応じて各テーマの進展状況を解析する 。 したがって、 例えば、 各技術テーマに対応する資料の発行数がどの進展段階で 増減しているか等を検討することによって、 各進展段階の活気度 (ァクティビテ ィ) を分析することが可能になり、 その結果、 複数の技術テーマに関する研究開 発の進展パタンを容易かつ具体的に比較することが可能になる。
また、 本発明は、 上記の発明において、 前記進展状況解析手段は、 各テーマに 対応する資料における各テーマに関連するキーワードの出現数をテーマごと発行 時期別に集計し、 当該発行時期別のキーワード出現数に応じて各テーマの進展状 況を解析することを特徴とする。
この発明によれば、 各テーマに対応する資料における各テーマに関連するキー ヮードの出現数をテーマごと発行時期別に集計し、 当該発行時期別のキーヮード 出現数に応じて各テーマの進展状況を解析する。 したがって、 例えば、 各技術テ 一マの特定の側面に関連するキーヮードの出現数がどの進展段階で増減している 力等を検討することによって、 各進展段階の活気度 (アクティビティ) を色々な 側面ごとに分析することが可能になる。 その結果、 複数の技術テーマに関する研 究開発の進展パタンを容易かつ具体的に比較し、 また、 特定の技術分野に焦点を 当てて分析することが可能になる。
また、 本発明は、 上記の発明において、 前記進展状況解析手段は、 各テーマに 対応する資料が参照している被参照資料および Zまたは各テーマに対応する資料 を参照している参照資料の発行数をテーマごと発行時期別に集計し、 当該被参照 資料および Zまたは参照資料の発行時期別の発行数に応じて各テーマの進展状況 を解析することを特 ί敷とする。
この発明によれば、 各テーマに対応する資料が参照している被参照資料おょぴ /または各テーマに対応する資料を参照している参照資料の発行数をテーマごと 発行時期別に集計し、 当該被参照資料および/または参照資料の発行時期別の発 行数に応じて各テーマの進展状況を解析する。 したがって、 例えば、 各技術テー マに関連する資料における被参照資料および Zまたは参照資料の発行数がどの進 展段階で増減しているか等を検討することによって、 各進展段階の活気度 (ァク テイビティ) を分析することが可能になり、 その結果、 複数の技術テーマに関す る研究開発の進展パタンを容易かつ具体的 jこ比較することが可能になる。
また、 本発明は、 上記の発明において、 前記進展状況解析手段によって解析さ れた各テーマの進展状況における各進展段階に対して、 所定の要素との関連を解 析する要素関連解析手段をさらに備え、 前記進展状況出力手段は、 各テーマの進 展状況とともに、 前記要素関連解析手段によって解析された各進展段階における 前記所定の要素との関連を出力することを特徴とする。
この発明によれば、 解析された各テーマの進展状況における各進展段階に対し て、 所定の要素との関連を解析し、 各テーマの進展状況とともに、 解析された各 進展段階における所定の要素との関連を出力する。 したがって、 例えば、 利用者 が注目する技術側面が各技術テーマの進展状況におけるどの進展段階で有用であ るのか、 また、 そのような技術側面がどのような進展パタンをもたらし得るのか 等を分析することも可能になり、 これによつて、 複数の技術テーマに関する研究 開発の進展パタンを一層効果的に比較することが可能になる。
また、 本発明は、 上記の発明において、 前記進展状況解析手段によって解析さ れた各テーマの進展状況に基づいて、 各進展段階間の類似関係を解析する進展段 階類似解析手段をさらに備え、 前記進展状況'出力手段は、 各テーマの進展状況と ともに、 前記進展段階類似解析手段によって解析された各進展段階間の類似関係 を出力することを特徴とする。
この発明によれば、 解析された各テーマの進展状況に基づいて、 各進展段階間 の類似関係を解析し、 各テーマの進展状況とともに、 解析された各進展段階間の 類似関係を出力する。 したがって、 例えば、 進展状況が類似する技術テーマ同士 に対象を絞って、 より効率的に比較および分析を行うことも可能になり、 これに よって、 複数の技術テーマに関する研究開発の進展パタンを一層効果的に比較す ることが可能になる。
また、 本発明は、 上記の発明において、 前記進展状況解析手段による解析対象 である各テーマ間の類似関係を解析するテーマ類似解析手段をさらに備え、 前記 進展状況出力手段は、 各テーマの進展状況とともに、 前記テーマ類似解析手段に よって解析された各テーマ間の類似関係を出力することを特徴とする。
この発明によれば、 解析対象である各テーマ間の類似関係を解析し、 各テーマ の進展状況とともに、 解析された各テーマ間の類似関係を出力する。 したがって 、 例えば、 技術側面が類似する技術テーマ同士に対象を絞って、 より効率的に比 較および分析を行うことも可能になり、 これによつて、 複数の技術テーマに関す る研究開発の進展パタンを一層効果的に比較することが可能になる。
また、 本発明は、 上記の発明において、 前記資料を解析してテーマを抽出する テーマ抽出手段をさらに備え、 前記進展状況解析手段は、 前記テーマ抽出手段に よって抽出されたテーマごとに、 各テーマの進展状況を解析することを特^ [とす る。
この発明によれば、 資料を解析してテーマを抽出し、 抽出されたテーマごとに 、 各テーマの進展状況を解析する。 したがって、 例えば、 利用者自らが技術テー マを抽出するまでもなく、 複数の技術資料を整理する形で各技術テーマを抽出す ることが可能になり、 これによつて、 各技術テーマに関する研究開発の進展パタ ンを容易かつ簡便に比較することも可能になる。
また、 本発明は、 テーマの進展状況を資料に基づいて分析するテーマ分析方法 ' であって、 各テーマに対応する資料に基づき、 各テーマの進展状況を同一の時間 軸に沿って解析する進展状況解析工程と、 前記進展状況解析工程によつて解析さ れた各テ一マの進展状況を前記同一の時間軸上で相互に比較可能に出力する進展 状況出力工程と、 を含んだことを特徴とする。
この発明によれば、 各テーマに対応する資料に基づき、 各テーマの進展状況を 同一の時間軸に沿つて解析し、 角?析された各テーマの進展状況を同一の時間軸上 で相互に比較可能に出力する。 したがって、 例えば、 複数の技術テーマに関する 研究開発の進展パタンを容易に比較することが可能になる。 その結果、 進展パタ ンを手がかりに、 注目している技術テーマと類似した技術側面を持つ別の技術テ 一マを見つけ、 その技術テーマに関する技術資料を技術開発の参考とすることに よって、 ブレークスルー技術を発見することなどが可能になる。
また、 本発明は、 上記の発明において、 前記進展状況解析工程によって解析さ れた各テーマの進展状況における各進展段階に対して、 所定の要素との関連を解 析する要素関連解析工程をさらに含み、 前記進展状況出力工程は、 各テーマの進 展状況とともに、 前記要素関連解析工程によって解析された各進展段階における 前記所定の要素との関連を出力することを特徴とする。
この発明によれば、 解析された各テーマの進展状況における各進展段階に対し て、 所定の要素との関連を解析し、 各テーマの進展状況とともに、 解析された各 進展段階における所定の要素との関連を出力する。 したがって、 例えば、 利用者 が注目する技術側面が各技術テーマの進展状況におけるどの進展段階で有用であ るのか、 また、 そのような技術側面がどのような進展パタンをもたらし得るのか 等を分析することも可能になり、 これによつて、 複数の技術テーマに関する研究 開発の進展バタンを一層効果的に比較することが可能になる。
また、 本発明は、 上記の発明において、 前記進展状況解析工程によって解析さ れた各テーマの進展状況に基づいて、 各進展段階間の類似関係を解析する進展段 階類似解析工程をさらに含み、 前記進展状況出力工程は、 各テーマの進展状況と ともに、 前記進展段階類似解析工程によって解析された各進展段階間の類似関係 を出力することを特徴とする。
この発明によれば、 解析された各テーマの進展状況に基づいて、 各進展段階間 の類似関係を解析し、 各テーマの進展状況とともに、 解析された各進展段階間の 類似関係を出力する。 したがって、 例えば、 進展状況が類似する技術テーマ同士 に対象を絞って、 より効率的に比較および分析を行うことも可能になり、 これに よって、 複数の技術テーマに関する研究開発の進展パタンを一層効果的に比較す ることが可能になる。 また、 本発明は、 上記の発明において、 前記進展状況解析工程による解析対象 である各テーマ間の類似関係を解析するテーマ類似解析工程をさらに含み、 前記 進展状況出力工程は、 各テーマの進展状況とともに、 前記テーマ類似解析手段に よって解析された各テーマ間の類似関係を出力することを特徴とする。
この発明によれば、 解析対象である各テーマ間の類似関係を解析し、 各テーマ の進展状況とともに、 解析された各テーマ間の類似関係を出力する。 したがって 、 例えば、 技術側面が類似する技術テーマ同士に対象を絞って、 より効率的に比 較および分析を行うことも可能になり、 これによつて、 複数の技術テーマに関す る研究開発の進展パタンを一層効果的に比較することが可能になる。
また、 本発明は、 上記の発明において、 前記資料を解析してテーマを抽出する テーマ抽出工程をさらに含み、 前記進展状況解析工程は、 前記テーマ抽出手段に よって抽出されだテ マごとに、 各テーマの進展状況を解析することを特徴とす る。
この発明によれば、 資料を解析してテーマを抽出し、 抽出されたテーマごとに 、 各テーマの進展状況を解析する。 したがって、 例えば、 利用者自らが技術テー マを抽出するまでもなく、 複数の技術資料を整理する形で各技術テーマを抽出す ることが可能になり、 これによつて、 各技術テーマに関する研究開発の進展パタ ンを容易かつ簡便に比較することも可能になる。
また、 本発明は、 テーマの進展状況を資料に基づいて分析する方法をコンビュ ータに実行させるテーマ分析プログラムであって、 各テーマに対応する資料に基 づき、 各テーマの進展状況を同一の時間軸に沿って解析する進展状況解析手順と 、 前記進展状況解析手順によつて解析された各テーマの進展状況を前記同一の時 間軸上で相互に比較可能に出力する進展状況出力手順と、 をコンピュータに実行 させることを特敷とする。
この発明によれば、 各テーマに対応する資料に基づき、 各テーマの進展状況を 同一の時間軸に沿って解析し、 解析された各テーマの進展状況を同一の時間軸上 で相互に比較可能に出力する。 したがって、 例えば、 複数の技術テーマに関する 研究開発の進展パタンを容易に比較することが可能になる。 その結果、 進展パタ ンを手がかりに、 注目している技術テーマと類似した技術側面を持つ別の技術テ 一マを見つけ、 その技術テーマに関する技術資料を技術開発の参考とすることに よって、 プレータスルー技術を発見することなどが可能になる。
また、 本発明は、 上記の発明において、 前記進展状況解析手順によって解析さ れた各テーマの進展状況における各進展段階に対して、 所定の要素との関連を解 析する要素関連解析手順をさらにコンピュータに実行させ、 前記進展状況出力手 順は、 各テーマの進展状況とともに、 前記要素関連解析手順によって解析された 各進展段階における前記所定の要素との関連を出力することを特徴とする。 この発明によれば、 解析された各テーマの進展状況における各進展段階に対し て、 所定の要素との関連を解析し、 各テーマの進展状況とともに、 解析された各 進展段階における所定の要素との関連を出力する。 したがって、 例えば、 利用者 が注目する技体テ側面が各技術テーマの進展状況におけるどの進展段階で有用であ るのか、 また、 そのような技術側面がどのような進展パタンをもたらし得るのか 等を分析することも可能になり、 これによつて、 複数の技術テーマに関する研究 開発の進展バタンを一層効果的に比較することが可能になる。
また、 本発明は、 上記の発明において、 前記進展状況解析手順によって解析さ れた各テーマの進展状況に基づいて、 各進展段階間の類似関係を解析する進展段 階類似解析手順をさらにコンピュータに実行させ、 前記進展状況出力手順は、 各 テーマの進展状況とともに、 前記進展段階類似解析手順によって解析された各進 展段階間の類似関係を出力することを特徴とする。
この発明によれば、 解析された各テーマの進展状況に基づいて、 各進展段階間 の類似関係を解析し、 各テーマの進展状況とともに、 解析された各進展段階間の 類似関係を出力する。 したがって、 例えば、 進展状況が類似する技術テーマ同士 に対象を絞って、 より効率的に比較および分析を行うことも可能になり、 これに よって、 複数の技術テーマに関する研究開発の進展パタンを一層効果的に比較す ることが可能になる。 また、 本発明は、 上記の発明において、 前記進展状況解析手順による解析対象 である各テーマ間の類似関係を解析するテーマ類似解析手順をさらにコンビユー タに実行させ、 前記進展状況出力手順は、 各テーマの進展状況とともに、 前記テ 一マ類似解析手段によって解析された各テーマ間の類似関係を出力することを特 徴とする。
この発明によれば、 解析対象である各テーマ間の類似関係を解析し、 各テーマ ( の進展状況とともに、 解析された各テーマ間の類似関係を出力する。 したがって 、 例えば、 技術側面が類似する技術テーマ同士に対象を絞って、 より効率的に比 較および分析を行うことも可能になり、 これによつて、 複数の技術テーマに関す る研究開発の進展パタンを一層効果的に比較することが可能になる。
また、 本発明は、 上記の発明において、 前記資料を解析してテーマを抽出する テーマ抽出手順をさらにコンピュータに実行させ、 前記進展状況解析手順は、 前 記テーマ抽出手段によって抽出されたテーマごとに、 各テーマの進展状況を解析 することを特徴とする。
この発明によれば、 資料を解析してテーマを抽出し、 抽出されたテーマごとに 、 各テーマの進展状況を解析する。 したがって、 例えば、 利用者自らが技術テー マを抽出するまでもなく、 複数の技術資料を整理する形で各技術テーマを抽出す ることが可能になり、 これによつて、 各技術テーマに関する研究開発の進展パタ ンを容易かつ簡便に比較することも可能になる。 図面の簡単な説明
第 1図は、 本実施の形態に係る技術テーマ分析装置の構成を示すプロック図で あり、 第 2図は、 技術テーマ分析装置による全体処理の流れを示すフローチヤ一 トであり、 第 3図は、 技術テーマ抽出処理の流れを示すフローチャートであり、 第 4図は、 権威スコアの計算を説明するための図であり、 第 5図は、 クラスタリ ング処理の流れを示すフローチャートであり、 第 6図は、 技術テーマ抽出の具体 例を示す図 (その 1 ) であり、 第 7図は、 技術テーマ抽出の具体例を示す図 (そ の 2 ) であり、 第 8図は、 出力部の表示例を示す図 (その 1 ) であり、 第 9図は 、 出力部の表示例を示す図 (その 2 ) であり、 第 1 0図は、 出力部の表示例を示 す図 (その 3 ) であり、 第 1 1図は、 出力部の表示例を示す図 (その 4 ) であり 、 第 1 2図は、 出力部の表示例を示す図 (その 5 ) であり、 第 1 3図は、 他の実 施の形態に係るコンピュータシステムの構成を示すシステム構成図であり、 第 1 4図は、 第 1 3図に示したコンピュータシステムにおける本体部の構成を示すプ ロック図である。 発明を実施するための最良の形態
以下、 添付図面を参照して、 この発明に係るテーマ分析装置、 テーマ分析方法 およびその方法をコンピュータに実行させるテーマ分析プログラムの好適な実施 の形態を詳細に説明する。
なお、 以下では、 本実施の形態で用いる主要な用語の意味 (0 :用語の説明) 、 本実施の形態に係る技術テーマ分析装置の概要および特徴 ( 1 :技術テーマ分 析装置の概要および特徴) 、 技術テーマ分析装置の構成 ( 2 :技術テーマ分析装 置の構成) 、 技術テーマ分析装置の主要部による処理 (2—1 :技術テーマ抽出 部、 2— 2 :進展状況解析部、 2 - 3 :進展状況可視化部、 2— 4 :要素関連解 析部、 2— 5 :進展段階類似解析部、 2— 6 :技術テーマ類似解析部) 、 本実施 の形態に対する種々の変形例 ( 3 :他の実施の形態) を順に説明し、 最後に本発 明による効果 (4 :発明の効果) を説明する。
[ 0 :用語の説明]
まず最初に、 本実施の形態で用いる主要な用語の意味を説明する。 本実施の形 態で用いる 「技術テーマ (特許請求の範囲に記載の 「テーマ」 に対応する。 ) 」 とは、 技術論文や特許公報などの技術資料から抽出可能な技術主題のことを指し 、 例えば、 「動物を対象とした遺伝子解析」 や 「植物を対象とした遺伝子解析」 などがこれに該当する。
ただし、 かかる 「技術テーマ」 は、 必ずしも、 上記のように文言で定義される 明確なテーマである必要はなく、 例えば、 遺伝子解析の分野における技術論文が 所定の観点から複数のグループに分けられたような場合に、 各グループに対して 明確な技術テーマを対応付けるのではなく、 各グループそれぞれを抽象的な技術 テーマの一つとして捉えて処理するようにしてもよレ、。
また、 本実施の形態で用いる 「技術テーマの進展状況 (特許請求の範囲に記載 の 「テーマの進展状況」 に対応する。 :) 」 とは、 技術テーマの活気度や活発度 ( アクティビティ) を時系列で捉えた場合の状況のことを指し、 具体的には、 第 2 図などに示すように、 技術テーマの研究開発が発達または停滞している進展段階 や、 その発達が飛躍的である進展段階などによって示される。
[ 1 :技術テーマ分析装置の概要おょぴ特徴]
次に、 第 1図および第 2図を用いて、 本実施の形態に係る技術テーマ分析装置 の概要および特徴を説明する。 第 1図は、 本実施の形態に係る技術テーマ分析装 置の構成を示すブロック図であり、 第 2図は、 かかる技術テーマ分析装置による 全体処理の流れを示すフローチヤ一トである。
第 1図に示す技術テーマ分析装置 1 0は、 概略的には、 技術資料に基づく技術 動向分析を支援するために、 技術テーマの進展状況を技術資料に基づいて分析す. る装置であり、 複数の技術テーマに関する研究開発の進展パタンを容易に比較す ることを可能にしている点に主たる特徴がある。
以下に、 これらの概要および特徴を簡単に説明すると、 第 2図に示すように、 技術テーマ分析装置 1 0は、 まずは利用者から、 分析対象とする技術資料を選別 するための選別条件の入力を受け付ける (ステップ S 2 0 1 ) 。 つまり、 大量の 技術資料が格納されている技術資料 D B 1 4 aから分析対象を選別する趣旨であ り、 指定する条件としては、 例えば、 対象分野を限定するためのキーワードや、 対象とする技術資料の発行時期などが該当する。
カゝかる選別条件が入力されると、 技術テーマ分析装置 1 0は、 選別条件に合致 する技術資料を技術資料 D B 1 4 aカゝら取得し、 取得した技術資料を解析して同 一ないし関連する技術テーマを抽出する (ステップ S 2 0 2 ) 。 具体的には、 技 術資料の著者情報と技術資料の内容の類似性に基づいて、 第 2図に示すように、 技術テーマごとに技術資料をグループィヒ (整理'体系化) した形で各技術テーマ を抽出する。
これに続いて、 技術テーマ分析装置 1 0は、 技術テーマごとにグループィ匕され た技術資料に基づいて、 各技術テーマの進展状況を同一の時間軸に沿って解析す る (ステップ S 2 0 3 ) 。 具体的に例を挙げれば、 各技術テーマに対応する技術 資料の発行数をテーマごと発行時期別に集計し、 当該発行時期別の資料発行数に 応じて (発行数が多レ、時期ほど研究開発がァクティビティであると判定して) 各 技術テ一マの進展状況を解析する。
このようにして、 各技術テーマの進展状況が解析されると、 技術テーマ分析装 置 1 0は、 力かる解析結果を可視ィ匕して、 各技術テーマの進展状況を同一の時間 軸上で相互に比較可能に出力する (ステップ S 2 0 4 ) 。 具体的には、 第 2図に 示すように、 各技術テーマの進展状況 (活気度、 アクティビティ) を年度別に表 示出力する。
したがって、 本実施の形態に係る技術テーマ分析装置 1 0によれば、 かかる表 示出力の提供を受けた利用者は、 上記した主たる特徴の如く、 複数の技術テーマ に関する研究開発の進展パタンを容易に比較することが可能になる。 その結果、 進展パタンを手がかりに、 注目している技術テーマと類似した技術側面を持つ別 の技術テーマ (テーマの分析時点では技術開発が停滞している力 別の技術テー マで利用されている要素技術を適用すれば、 進展が期待できるような技術テ^"マ ) を見つけ、 その技術テーマに関する技術資料を技術開発の参考とすることによ つて、 ブレークスルー技術を発見することなどが可能になる。
なお、 本実施の形態に係る技術テーマ分析装置 1 0では、 上記した主たる特徴 に関連して、 利用者が注目する技術側面が各技術テーマの進展状況におけるどの 進展段階で有用であるの力等の分析も可能にする点や、 進展状況が類似する技術 テーマ同士や技術側面が類似する技術テーマ同士に対象を絞って、 より効率的に 比較おょぴ分析を行うことも可能にする点、 さらには、 利用者自らが技術テーマ を抽出するのではなく、 複数の技術資料を整理する形で各技術テーマを抽出する 点や、 技術分野における研究主体 (技術論文の著者) の寄与度の観点から適切に 技術テーマを抽出する点にも特徴があるが、 これらについては後述する。
[ 2 :技術テーマ分析装置の構成]
次に、 第 1図を用いて、 本実施の形態に係る技術テーマ分析装置 1 0の構成を 説明する。 同図に示すように、 この技術テーマ分析装置 1 0は、 入力部 1 1と、 出力部 1 2と、 入出力制御 I F部 1 3と、 記憶部 1 4と、 制御部 1 5とから構成 される。
このうち、 入力部 1 1は、 各種の情報の入力を受付ける入力手段であり、 キー ボードやマウス (ポインティングデバイス) 、 マイクを備えて構成され、 例えば 、 上記したような技術資料の選別条件などを利用者から受け付けて入力する。 また、 出力部 1 2は、 各種の情報を出力する出力手段であり、 モニタ (若しく はディスプレイ、 タツチパネル) やスピーカを備えて構成され、 例えば、 上記し たような技術テーマの進展状況などを利用者に対して出力する。
そして、 入出力制御 I F部 1 3は、 これら入力部 1 1および出力部 1 2による データの入出力を制御する手段である。
記憶部 1 4は、 制御部 1 5による各種処理に必要なデータおよびプログラムを 格納する格納手段 (記憶手段) であり、 特に本発明に密接に関連するものとして は、 機能概念的に、 各種の大量の技術文献を記憶した技術文献 D B (データべ一 ス) 1 4 aを備える。
制御部 1 5は、 O S (Operating System) などの制御プログラム、 各種の処理 手順などを規定したプログラムおよび所要データを格納するための内部メモリを 有し、 これらによって種々の処理を実行する処理部であり、 特に本発明に密接に 関連するものとしては、 機能概念的に、 技術テーマ抽出部 1 5 aと、 進展状況解 析部 1 5 bと、 進展状況可視化部 1 5 cと、 要素関連解析部 1 5 dと、 進展段階 類似解析部 1 5 eと、 技術テーマ類似解析部 1 5 f とを備える。 これらの各部の 処理内容については後述する。 なお、 上記した技術テーマ分析装置 1 0は、 既知のパーソナルコンピュータ、 ワークステーション、 さらには、 携帯電話、 P H S端末、 移動体通信端末または P D Aなどの情報処理装置に、 上記した各部の各機能を搭載することによって実 現することもできる。
[ 2 - 1 :技術テーマ抽出部]
次に、 技術テーマ分析装置 1 0の制御部 1 5における技術テーマ抽出部 1 5 a の処理について説明する。 この技術テーマ抽出部 1 5 aは、 利用者から入力され た選別条件 (対象分野を限定するためのキーワードや、 対象とする技術資料の発 行時期など) に合致する技術資料を技術資料 D B 1 4 aから取得し、 取得した技 術資料を解析して同一ないし関連する技術テーマを抽出する処理部である。 なお、 このように、 資料を解析してテーマを抽出することによって、 利用者自 らが技術テーマを抽出するまでもなく、 複数の技術資料を整理する形で各技術テ 一マを抽出することが可能になり、 これによつて、 各技術テーマに関する研究開 発の進展パタンを容易かつ簡便に比較することも可能になる。
具体的には、 技術テーマ抽出部 1 5 aは、 資料の集合に対する各著者の寄与度 に応じて各著者を階層的にグループ化し、 各グループに対応してテーマを抽出す る。 すなわち、 その詳細は第 3図等を用いて後述するが、 概略的には、 技術資料 と研究開発者との対応関係に基づき、 各研究者の技術資料集合への貢献の範囲を 推定する。 そして、 貢献範囲の広い研究開発者の関与した資料集合を、 大きな技 術テーマに関する資料集合として抽出し、 抽出した資料集合に対して、 同様の手 順で再帰的に技術テーマを抽出することで、 階層的な技術テーマのグループを求 める。
なお、 このような技術テーマの抽出を行うことによって、 ある技術分野におい てどの研究主体 (著者) が権威であるか等を利用者自らが調べるまでもなく、 そ の技術分野における寄与度の観点からグループィ匕された各研究主体に対応付けて 、 適切に技術テーマを抽出することが可能になる。
また、 技術テーマ抽出部 1 5 aは、 さらに、 各技術テーマを内容の類似関係に 基づいてクラスタリングし、 各クラスタに対応してテーマを抽出することもでき る。 すなわち、 一且抽出した技術テーマをその内容の類似性に応じてクラスタリ ングする趣旨であり、 これによつて、 より適切に技術テーマを抽出することも可 能になる。 なお、 この処理の詳細も第 5図等を用いて後述する。
また、 技術テーマ抽出部 1 5 aは、 さらに、 各技術テーマに対応する資料にお ける内容の類似関係、 参照関係 (各技術テーマに対応する資料を参照している参 照資料との関係) および/または被参照関係 (各技術テーマに対応する資料が参 照している被参照資料との関係) に基づいて、 各技術テーマを統合および Zまた は細分して抽出することもできる。 すなわち、 ー且抽出した技術テーマを種々の 観点から銃合や細分する趣旨であり、 これによつて、 より適切に技術テーマを抽 出することも可能になる。
以下に、 上記の説明を踏まえて、 技術テーマ抽出部 1 5 aによる処理の流れお ょぴ具体例を、 (1 ) 技術テーマ抽出処理、 (2 ) クラスタリング処理、 ( 3 ) 技術テーマ抽出の具体例に区分けして説明する。
( 1 ) 技術テーマ抽出処理
第 3図は、 技術テーマ抽出処理の流れを示すフローチャートである。 同図に示 すように、 技術テーマ抽出部 1 5 aは、 まずは技術資料集合キューを初期化する (ステップ S 3 0 1 ) 。 すなわち、 技術資料集合キューをクリアし、 技術資料 D B 1 4 a力 ら選別して取得した技術資料集合を第 1の処理対象として追加する。 これに続いて、 技術テーマ抽出部 1 5 aは、 技術資料集合キューが空であるか を判定し (ステップ S 3 0 2 ) 、 空である場合には (ステップ S 3 0 2肯定) 、 技術テーマの抽出処理を終了し、 空でない場合には (ステップ S 3 0 2否定) 、 ステップ S 3 0 3以降の処理を継続する。
つまり、 技術資料集合キューが空でない場合には (ステップ S 3 0 2否定) 、 技術集合キューの先頭にある技術資料集合を取り出し (ステップ S 3 0 3 ) 、 取 り出した技術資料集合に基づいて 「有力著者リスト」 を作成する (ステップ S 3 0 4 ) 。 ここで、 第4図を用いて 「有力著者リスト」 の作成を説明する。 この 「有力著 者リスト」 とは、 同図 (c ) に示すように、 権威スコア(authority score)が高 い著者からなるリストであり、 例えば、 権威スコアが 0 . 2以上の著者を有力著 者として選択し、 有力著者リストを構成する。
また、 ここで言う 「権威スコア」 とは、 資料集合に関する技術テーマの研究開 発を強力に主導している著者ほど高くなるようなスコアであり、 ここでは、 同図 ( b ) に示すように、 「その著者が最有力著者である資料数」 を 「対象資料集合 中の資料数」 で除算することによって算出する。 なお、 ここで、 「最有力著者」 とは、 ある資料の有効著者で、 資料集合における発行資料数が最大の著者のこと を指し、 さらに、 「有効著者」 とは、 それ以前の処理で、 処理対象資料集合作成 において、 有力著者として選定された以外の著者のことである。
具体的には、 同図 (a ) に示すように、 資料集合が資料 1 (doc-l) 〜資料 5 (doc-5) の 5資料からなり、 資料 doc - 1と doc -2の著者が著者 1 (author - 1) お ょぴ著者 2 (author- 2) の 2名であり、 資料 doc- 3の著者が著者 1 (author- 1) および著者 3 (author-3) 、 資料 doc- 4の著者が著者 1 (author- 1) 、 資料 5 (d oc-5) の著者力 S 者 (author - 2) であるとすると、 権威スコアは、 author - 1では 4 / 5 , author - 2では 1 / 5、 author - 3では 0となる。
また、 author-Ιが発行した資料に限定して author-1以外を有効著者とした場合 の権威スコアは、 author- 2では 2 Z 4 (同図の 「author- 1- autho;r_2」 参照)とな り、 author- 3では 1 Z 4となる (同図の 「author - 1 - author- 3」 参照)。 このよう にして、 同図 (c ) に示すような 「有力著者リスト」 が作成される。
第 3図の説明に戻ると、 技術テーマ抽出部 1 5 aは、 「有力著者リスト」 を作 成した後、 有力著者リストが空であるかを判定し (ステップ S 3 0 5 ) 、 空であ る場合には (ステップ S 3 0 5肯定) 、 ステップ S 3 0 1から処理を繰り返し、 空でない場合には (ステップ S 3 0 5否定) 、 ステップ S 3 0 6以降の処理を継 続する。
つまり、 有力著者リストが空でない場合には (ステップ S 3 0 5否定) 、 有力 著者リストから、 先頭の著者を取り出し (ステップ S 3 0 6 ) 、 取り出した著者 が発行した資料を、 対象技術資料集合から検索する (ステップ S 3 0 7 ) 。 続いて、 技術テーマ抽出部 1 5 aは、 取り出した資料集合を資料内容の類似性 に基づきクラスタリングする (ステップ S 3 0 8 ) 。 ここで、 クラスタリングの 手法としては、 様々な公知の手法を利用する.ことができるが、 本実施の形態で利 用する手法については、 第 5図を用いて後述する。
そして、 第 5図に示すようなクラスタリングが行われた後、 技術テーマ抽出部 1 5 aは、 クラスタリングの結果として得られた資料クラスタを、 技術資料集合 キューに追加して、 S 3 0 2から処理を繰り返す。
( 2 ) クラスタリング処理 (第 3図のステップ S 3 0 8に対応する処理) 第 5図は、 クラスタリング処理の手順を示すフローチャートである。 同図に示 すように、 技術テーマ抽出部 1 5 aは、 まずは全ての資料の組み合わせについて 類似度を算出する (ステップ S 5 0 1 ) 。
ここで、 「類似度」 とは、 内容が似ている資料同士の組合せほど大きい値とな るパラメータ値であり、 例えば、 各資料の特徴ベクトルの内積を用いることなど によって求められる。 なお、 「特徴ベクトル」 とは、 資料内容の特徴を示す値を 要素とするベクトルのことであり、 例えば、 資料に含まれるキーワードの出現数 を要素とするベクトルを、 大きさ 「1」 に規格化して、 特徴ベクトルとすればよ レ、。
続いて、 技術テーマ抽出部 1 5 aは、 類似の算出結果に基づいて、 類似度が最 大の資料の組を選択する (ステップ S 5 0 2 ) 。 そして、 選択した資料の組の類 似度 「s」 が所定の閾値 「h」 以上であるか否かを判定し (ステップ S 5 0 3 ) 、 閾値 「h」 以上でない場合には (ステップ S 5 0 3否定) 、 処理を終了する一 方で、 閾値 「h」 以上である場合には (ステップ S 5 0 3肯定) 、 ステップ S 5 0 4以降の処理を継続する。
つまり、 判定の結果、 閾値 「h」 以上である場合には (ステップ S 5 0 3肯定 ) 、 選択した資料の組 (類似度が最大の資料の組) を併合する (ステップ S 5 0 4 ) 。 そして、 併合した資料の組に関して、 類似度を再計算して (ステップ S 5 0 5 ) 、 ステップ S 5 0 1から処理を繰り返す。 なお、 ここでは、 併合結果の資 料グループの特徴べクトルは、 資料グループ中の資料の特徴べクトルの重心をと るものとする。
( 3 ) 技術テーマ抽出の具体例
第 6図おょぴ第 7図は、 技術テーマ抽出の具体例を示す図である。 各図におい て、 「楕円」 が抽出した技術テーマに対応し、 技術テーマに関連する資料が楕円 の中に示されている。 また、 「楕円に添えた下線付きの文字列」 は、 以降の処理 (後述する各処理) において技術テーマ名として用いる文字列であり、 ここでは 、 最有力著者名を連結して作成した文字列を技術テーマ名として用いている。 より詳細には、 第 6図に示した具体例は、 第 4図 (a ) に示した資料集合を、 クラスタリング処理 (第 3図のステップ S 3 0 8 ) を省略して処理した場合の結 果である。 一方、 第 7図に示した具体例は、 クラスタリング処理を実行した場合 の結果であり、 「Author-lJ の技術テーマに関する資料集合が、 クラスタリング 処理によって、 「Author - 1. 1」 と 「Au or- 1. 2」 の技術テーマに分割されている 様子を示している。
[ 2 - 2 :進展状況解析部]
次に、 技術テーマ分析装置 1 0の制御部 1 5における進展状況解析部 1 5 bの 処理について説明する。 この進展状況解析部 1 5 bは、 各技術テーマに対応する 技術資料に基づき、 各技術テーマの進展状況を同一の時間軸に沿って解析する処 理部である。 具体的には、 技術テーマ抽出部 1 5 aによって抽出された技術テー マごとにグループ化された技術資料を参照して、 各技術テーマの活気度 (ァクテ イビティ) を技術資料の発行時期別に解析する。
かかる進展状況の解析手法としては、 各技術テーマの活気度を時系列で示すこ とができる手法であれば如何なる解析手法を採用することもできるが、 ここでは 、 ( 1 ) 技術資料の発行数に基づく解析手法、 (2 ) キーワードの出現数に基づ く解析手法、 ( 3 ) 被参照資料や参照資料の発行数に基づく解析手法を以下に説 明する。
( 1 ) 技術資料の発行数に基づく解析手法
この解決手法では、 進展状況解析部 1 5 bは、 各技術テーマに対応する資料の 発行数を技術テーマごと発行時期別に集計し、 当該発行時期別の資料発行数に応 じて各技術テーマの進展状況を解析する。 つまり、 各技術テーマに対応する技術 資料 (各テーマごとにグループィヒされた技術資料) の発行数を発行時期別に集計 し、 集計結果を各技術テーマに関する研究開発の進展状況の指標として出力可能 にする。
これについて例を用いて説明すれば、 第 8図に示すように、 4つの技術テーマ が抽出された場合を想定すると、 1 9 8 0年〜 8 5年、 1 9 8 5年〜9 0年' ' • という 5つの時期別に、 各技術テーマに対応する技術資料の発行数を集計する 。 そして、 時期別の発行数を技術テーマごとに正規化することによって、 ァクテ ィビティの高低を 4段階で表示可能にする。
このように、 上記の解析手法によれば、 各技術テーマに対応する資料の発行数 がどの進展段階で増減している力、等を検討することによって、 各進展段階の活気 度 (アクティビティ) を分析することが可能になり、 その結果、 複数の技術テー マに関する研究開発の進展パタンを容易かつ具体的に比較することが可能になる 。 なお、 この解析手法は、 計算コストが小さいので、 利用者が各技術テーマの進 展状況の概要をすばやく把握することを希望するような場合に特に有効である。
( 2 ) キーワードの出現数に基づく解析手法
この解析手法では、 進展状況解析部 1 5 bは、 各技術テーマに関連するキーヮ 一ドの出現数を技術テーマごと発行時期別に集計し、 当該発行時期別のキ一ヮ一 ド出現数に応じて各テーマの進展状況を解析する。
より具体的には、 まずは、 各技術テーマに対応する技術資料から各技術資料に 特徴的に出現する語をキーワードとして抽出する。 そして、 抽出されたキーヮー ドが、 分析対象の資料集合または関連資料の集合において出現した数を、 資料の 発行時期別に集計してから、 その集計結果を正規ィ匕し、 技術テーマに関する研究 開発の進展状況の指標として出力可能にする。
なお、 キーワードの出現度数の集計対象とする資料集合は、 技術テーマに対応 する資料集合そのものでもよいし、 分析対象期間に発行された別の資料集合であ つてもよい。 後者の場合には、 技術資料 D B 1 4 aを管理する管理部 (図示せず ) を介して、 技術資料 D B 1 4 aから資料集合を取得して、 キーワードの出現度 数を集計するか、 あるいは、 かかる管理部が、 キーワードの出現度数を集計する 機能を提供している場合には、 それを利用して集計するようにしてもよい。 このように、 上記の解析手法によれば、 各技術テーマに関連するキーワードの 出現数がどの進展段階で増減しているか等を検討することによって、 各進展段階 の活気度 (アクティビティ) を分析することが可能になり、 その結果、 複数の技 術テーマに関する研究開発の進展パタンを容易かつ具体的に比較することが可能 になる。
なお、 かかる解析手法の趣旨は、 技術テーマに関連する技術側面を表すキーヮ ードを手がかりに、 研究開発の進展状況を推定することにある。 一般的に、 技術 テーマには、 様々な技術側面があり得るので、 利用者の目的にあったキーワード を選択することが好ましい。 例えば、 利用者が総合的に進展状況を概観すること を希望する場合には、 多くのキーワードの出現度数を手がかりに進展状況 (出現 数) を計算し、 特定の技術側面からみた進展状況の把握を希望する場合には、 利 用者に集計対象とするキーヮードの選択を促し、 選択されたキーヮードのみを対 象に進展状況 (出現数) を計算するようにすればよい。
( 3 ) 被参照資料や参照資料の発行数に基づく解析手法
この解析手法では、 進展状況解析部 1 5 bは、 各技術テーマに対応する資料が 参照している被参照資料および/または各テーマに対応する資料を参照している 参照資料の発行数をテーマごと発行時期別に集計し、 当該被参照資料および/ま たは参照資料の発行時期別の発行数に応じて各テ一マの進展状況を解析する。 つまり、 各技術テーマに関する技術資料が参照している資料 (被参照資料)や、 各技術テーマに関する技術資料を参照している資料 (参照資料) を抽出する。 そ して、 力かる参照資料や被参照資料の発行数を発行時期別に集計し、 集計結果を 技術テーマに関する研究開発の進展状況の指標として出力可能にする。
このように、 上記した解析手法によれば、 各技術テーマに関連する資料におけ る被参照資料および Zまたは参照資料の発行数がどの進展段階で増減しているか 等を検討することによって、 各進展段階の活気度 (アクティビティ) を分析する ことが可能になり、 その結果、 複数の技術テーマに関する研究開発の進展パタン を容易かつ具体的に比較することが可能になる。
[ 2 - 3 :進展状況可視化部]
次に、 技術テーマ分析装置 1 0の制御部 1 5における進展状況可視化部 1 5 c の処理について説明する。 この進展状況可視化部 1 5 cは、 進展状況解析部 1 5 bによって解析された各技術テ^"マの進展状況を、 同一の時間軸上で相互に比較 可能に出力部 1 2にて出力する処理部である。
具体的には、 第 8図に示すような画面を出力部 1 2に出力する。 この画面にお いては、 左ペインに技術テーマを示し、 右ペインに各技術テーマの進展状況を示 している。 つまり、 左ペイン中の文字列は、 技術テーマ名であり、 ここでは、 第 7図と同様、 最有力著者名を連結することで技術テーマ名を示している。
また、 第 8図に示した画面において、 左端の 「+」 「一」 「 ·」 は、 細分テー マの表示状態を示している。 つまり、 「+」 は、 その技術テーマがより小さい技 術テーマに細分可能なことを示しており、 利用者は、 必要に応じてこの部分をポ インティングデバイス (入力部 1 1 ) により指定することによって、 細分テーマ の表示を出力部 1 2に指示することができる。 また、 「一」 をポインティングデ バイス (入力部 1 1 ) により指定することによって、 その下にある技術テーマの 細分の表示を省略することができる。 なお、 「 ·」 はそのテーマが最細分テーマ であることを示している。
さらに、 第 8図に示した画面において、 右ペイン中の各セノレは、 各時期の各技 術テーマの進展状況を時期順に並べたものであり、 密度の濃いセルほど、 この時 期に大きく研究開発が進展していること (アクティビティが高いこと) を示して いる。 つまり、 上記の進展状況解析部 1 5 b'で説明した例を用いれば、 技術テー マに関連する資料の発行数、 技術テーマに関連するキーワード出現数、 参照資料 や被参照資料の発行数が多いほど、 その時期のセル内の濃度が濃く表示される。 このように、 各テーマの進展状況を同一の時間軸上で相互に比較可能に出力す ることによって、 複数の技術テーマに関する研究開発の進展パタンを容易に比較 することが可能になる。 その結果、 進展パタンを手がかりに、 注目している技術 テーマと類似した技術側面を持つ別の技術テーマを見つけ、 その技術テーマに関 する技術資料を技術開発の参考とすることによって、 ブレークスルー技術を発見 することなどが可能になる。
[ 2 - 4 :要素関連解析部]
次に、 技術テーマ分析装置 1 0の制御部 1 5における要素関連解析部 1 5 dの 処理について説明する。 この要素関連解析部 1 5 dは、 進展状況解析部 1 5 に よって解析された各テーマの進展状況における各進展段階に対して、 所定の要素 (例えば、 利用者が指定した技術側面) との関連を解析する処理部である。 そして、 上記した進展状況可視化部 1 5 cは、 第 9図に示すように、 各技術テ 一マの進展状況とともに、 要素関連解析部 1 5 dによって解析された各進展段階 における所定の要素との関連を出力する。
すなわち、 第 9図に示す画面は、 利用者の着目している技術側面 (Feature) と各進展段階との関係を図示したものであり、 第 8図に示した画面状態で、 利用 者が 「Feature-l」 および 「Feature- 2」 という技術側面の出現状況を表示するよ うに指示入力した後の状態である。
より詳細には、 かかる画面において、 図中の 「〇 (丸印) 」 は 「Feature - 1」 の側面に対応し、 「☆ (星印) 」 は 「Fuature - 2」 の側面に対応する。 そして、 図形の表示位置は、 その側面が現れた技術テーマの進展段階に対応し、 その大き さは、 現れ方の強さ (利用者が指定した要素と進展段階との関連度) に対応する このように、 各技術テーマの進展状況とともに、 各進展段階における所定の要 素 (利用者が注目する技術側面) との関連を出力することによって、 利用者が注 目する技術側面が各技術テーマの進展状況におけるどの進展段階で有用であるの か、 また、 そのような技術側面がどのような進展パタンをもたらし得るのか等を 分析することも可能になり、 これによつて、 複数の技術テーマに関する研究開発 の進展パタンを一層効果的に比較することが可能になる。
上記したような関連 (要素と進展段階との関連) の解析手法としては、 要素と 進展段階との関連度を時系列で示すことができる手法であれば如何なる解析手法 を採用することもできるが、 ここでは、 (1 ) 技術資料の発行数に基づく解析手 法、 (2 ) キーワードの出現数に基づく解析手法、 (3 ) 著者の関与資料の発行 数に基づく解析手法を以下に説明する。
( 1 ) 技術資料の発行数に基づく解析手法
この解析手法では、 要素関連解析部 1 5 dは、 各技術テーマに対応するととも に利用者が指定した要素にも対応する資料の発行数をテーマごと発行時期別に集 計し、 当該発行時期別の発行数に応じて各進展段階における要素との関連を解析 する。
具体的には、 利用者が指定した技術側面と関連する技術資料を技術資料 D B 1 4 aカゝら取得し、 その発行時期の分布に基づいて、 例えば、 発行数が多い進展段 階ほど関連性が強いと解析する。 そして、 利用者の着目している技術側面と関連 する技術資料の発行状況を指標にして、 两者の関係を各技術テーマにわたって一 覧できる形で出力可能にする。
したがって、 力かる解析手法によれば、 利用者が注目する技術側面に関連する 技術文献の発行数がどの進展段階で増減しているか等を検討して、 特定の技術側 面と各技術テーマの進展パタンとの関係を具体的に分析することも可能になる。
( 2 ) キーワードの出現数に基づく解析手法
この解析手法では、 要素関連解析部 1 5 dは、 各テーマに対応する資料におけ る所定の要素に関連するキーワードの出現数をテーマごと発行時期別に集計し、 当該発行時期別のキーワード出現数に応じて各進展段階における要素との関連を 解析する。
具体的には、 利用者がキーワードの形で指定した技術側面について、 指定キー ワードの各技術テーマに関する資料集合における出現数に基づいて、 例えば、 出 現数が多い進展段階ほど関連性が強いと解析する。 そして、 利用者の着目してい る技術側面と関連するキーヮ ドの出現状況を指標にして、 両者の関係を各技術 テーマにわたって一覧できる形で出力可能にする。
したがって、 力かる解析手法によれば、 利用者が注目する技術側面に関連する キーヮードの出現数がどの進展段階で増減している力ゝ等を検討して、 特定の技術 側面と各技術テーマの進展パタンとの関係を具体的に分析することも可能になる 。
( 3 ) 著者の関与資料の発行数に基づく解析手法
この解析手法では、 要素関連解析部 1 5 dは、 各技術テーマに対応する資料に 対して、 所定の要素に関連する主体 (著者) が関与した資料の発行数をテーマご と発行時期別に集計し、 当該発行時期別の発行数に応じて各進展段階における要 素との関連を解析する。
具体的には、 利用者が指定した技術側面と関連する研究主体を手がかりに、 か 力る研究主体が著者として関与している技術資料の発行時期の分布に基づいて、 例えば、 発行数が多い進展段階ほど関連性が強いと解析する。 そして、 利用者の 着目している技術側面に関連する研究主体が関与する技術資料の発行状況を指標 にして、 両者の関係を各技術テーマにわたって一覧できる形で出力可能にする。 したがって、 力かる解析手法によれば、 利用者が注目する技術側面に関連する 研究主体が関与した技術文献の発行数がどの進展段階で増減している力、等を検討 して、 特定の技術側面と各技術テーマの進展パタンとの関係を具体的に分析する ことも可能になる。
[ 2 - 5 :進展段階類似解析部]
次に、 技術テーマ分析装置 1 0の制御部 1 5における進展段階類似解析部 1 5 eの処理について説明する。 この進展段階類似解析部 1 5 eは、 進展状況解析部 1 5 bによって解析された各テーマの進展状況に基づいて、 各進展段階間の類似 関係を解析する処理部である。
そして、 上記した進展状況可視化部 1 5 cは、 第 1 0図に示すように、 各技術 テーマの進展状況とともに、 進展段階類似解析部 1 5 eによって解析された各進 展段階間の類似関係を出力する。
すなわち、 第 1 0図に示す画面は、 利用者の指定に応じて、 類似した進展段階 を強調して表示したものであり、 第 9図に示した画面状態で、 利用者がポインテ ィングデバイスにより、 右下隅のセルを指定した後の状態である。 より詳細には 、 力かる画面において、 「◎ (二重丸) 」 は、 利用者が指定したセルを示し、 矢 印の先は、 指定されたセルに対応する研究開発と類似した進展段階にある 「技術 テーマ—時期」 の組を示し、 さらに、 各矢印の太さは、 類似の度合いを示してい る。
このように、 各技術テーマの進展状況とともに、 各進展段階間の類似関係を出 力することによって、 進展状況が類似する技術テーマ同士に対象を絞って、 より 効率的に比較おょぴ分析を行うことも可能になり、 これによつて、 複数の技術テ 一マに関する研究開発の進展パタンを一層効果的に比較することが可能になる。 なお、 各進展段階間の類似関係は、 異なる技術テーマ間に生じるだけでなく、 同一の技術テーマ内においても生じる (いわゆるリバイバル) ので、 類似関係の 解析は、 同一の技術テーマ内においても行われる。
ここで、 力、かる類似関係の解析は、 各技術テーマに関する進展や停滞のパタン の類似性に基づいて解析されるが、 力かる解析手法としては、 例えば、 以下に述 ベるような手法を採用することができる。
すなわち、 進展段階解析部 1 5 bによって集計した進展状況を示す値 (例えば
、 発行時期別の発行数やキーワード出現数など) それぞれについて、 一つ前の時 期の値に対する比率を求め、 その結果を適切な粒度で離散ィ匕する。 そして、 類似 文字列の照合アルゴリズムにより、 技術テーマ間の類似性と、 類似した進展パタ ンの出現時期を求める。 なお、 類似文字列の照合アルゴリズムとしては、 公知の手法を用いることがで きるが、 例えば、 ライフサイエンス分野においてゲノムやアミノ酸配列の部分照 合に用いられている 「B L A S T」 や 「F A S T A」 と呼ばれる手法を援用すれ ばよい。 この場合、 「B L A S T」 や 「F A S TA」 により、 離散化した進展状 況の指標 (値) が完全に一致する部分を手がかりに、 類似部分配列を求めてもよ いが、 ある範囲の値のずれは許容して、 類似部分配列を求めることが望ましい。
[ 2— 6 :技術テーマ類似解析部]
次に、 技術テーマ分析装置 1 0の制御部 1 5における技術テーマ類似解析部 1 5 f の処理について説明する。 この技術テーマ類似解析部 1 5 f は、 進展状況解 析部 1 5 bによる解析対象である各技術テーマ間の類似関係を解析する処理部で ある。
そして、 上記した進展状況可視化部 1 5 cは、 第 1 1図および第 1 2図に示す ように、 各技術テーマの進展状況とともに、 技術テーマ類似解析部 1 5 f によつ て解析された各技術テーマ間の類似関係を出力する。
すなわち、 第 1 1図に示す画面は、 類似の技術側面を持つ技術テーマ同士を区 別して表示したものであり、 第 1 0図に示した画面状態で、 利用者が類似側面を 持つ技術テーマを色分けして表示するように指示した後の状態である。 なお、 こ の画面においては、 技術テーマ 「Author-1. 2」 と 「Author-2」 が類似の技術側面 を多く含むことが示されている。
また、 第 1 2図に示す画面は、 利用者が注目している技術テーマと類似の側面 を持つ技術テーマを強調して表示したものであり、 第 1 1図に示した画面状態で 、 利用者がポインティングデバイスによって技術テーマ 「Author_2」 を指定した 後の状態である。 より詳細には、 力かる画面において、 左端の 「矢印」 記号は、 利用者が指定した技術テーマを示し、 「三日月型」 の円状記号は、 利用者が注目 したテーマとの関連度合いを示し、 三日月が欠けているほど、 注目技術テーマと の類似†生が高レ、ことを示している。
このように、 各技術テーマの進展状況とともに、 各進展段階間の類似関係を出 力することによって、 各技術テーマ間の類似関係を出力することによって、 技術 側面が類似する技術テーマ同士に対象を絞って、 より効率的に比較および分析を 行うことも可能になり、 これによつて、 複数の技術テーマに関する研究開発の進 展パタンを一層効果的に比較することが可能になる。
上記したような技術テーマ間の類似の解析手法としては、 両者の類似性を解析 する手法であれば如何なる観点からの解析手法であっても採用することもできる 力 ここでは、 (1 ) 資料内容に基づく解析手法、 (2 ) 参照情報に基づく角军析 手法、 (3 ) 著者情報に基づく解析手法を以下に説明する。
( 1 ) 資料内容に基づく解析手法
この解析手法では、 技術テーマ類似解析部 1 5 f は、 各技術テーマに対応する 技術資料の内容に基づレヽて各技術テーマ間の類似関係を解析する。
具体的には、 全ての技術テーマの組み合わせについて、 技術テーマに対応する 資料集合の内容の類似度を求める。 ここで、 「類似度」 とは、 内容が似ている資 料集合ほど大きい値となる値であり、 例えば、 各資料集合の特徴ベクトルの内積 を用いればよい。
また、 「特徴ベクトル」 とは、 資料集合内容の特徴を示す値を要素とするベタ トルであり、 例えば、 資料集合中の各資料に含まれるキーワードの出現数を要素 とするベタトルを、 大きさ 「1」 に規格ィ匕してから、 各資料の特徴べクトルとす る。 そして、 各資料集合について、 それに含まれる資料の特徴べクトルの重心を 求めることで、 各資料の特徴べクトルを求めればよい。
したがって、 かかる解析手法によれば、 技術資料の内容面の類似性から技術テ 一マの対象を絞ることによって、 より効率的に比較おょぴ分析を行うことも可能 になる。
( 2 ) 参照情報に基づく解析手法
この解析手法では、 技術テーマ類似解析部 1 5 f は、 各技術テーマに対応する 技術資料の参照情報に基づいて各技術テーマ間の類似関係を解析する。
具体的には、 各技術テーマに関する技術資料が参照している資料 (被参照資料) 、 あるいは、 各技術テーマに関する技術資料を参照している資料 (参照資料) を 抽出する。 そして、 参照資料や被参照資料の集合間め類似度に基づき、 技術テー マ間の関連性を判定する。 なお、 類似度の計算に関しては、 資料内容の類似性に 基づく場合と同様の手順で行えばよい。
したがって、 力かる解析手法によれば、 技術資料の参照情報の類似性 (例えば 、 被参照資料や参照資料の共通性など) から技術テーマの対象を絞ることによつ て、 より効率的に比較および分析を行うことも可能になる。
( 3 ) 著者情報に基づく解析手法
この解析手法では、 技術テーマ類似解析部 1 5 f は、 各技術テーマに対応する 技術資料の著者情報 (研究主体の関与情報) に基づいて各技術テーマ間の類似関 係を解析する。
具体的には、 各技術テーマに関する技術資料集合に関与した研究開発者 (著者 ) の集合を求める。 そして、 研究開発者集合の類似度に基づき、 技術テーマ間の 関連性を判定する。 ここで、 類似度の計算に関しては、 資料内容の類似性に基づ く場合と同様の手順で行えばよい。
すなわち、 この場合には、 例えば、 研究開発者集合に各研究者が含まれる場合 を 「1」 、 そうでない場合を 「0」 とする要素とするベクトルを、 大きさ 「1」 に規格化することで、 各研究開発集合の特徴ベクトルを求めればよい。 あるいは 、 技術テーマ抽出処理において抽出された研究開発者の階層的関係 (技術テーマ 階層関係を最有力著者間の関係とみなしたもの) を考慮して、 ベクトル要素の値 を調整してもよい。
したがって、 カゝかる解析手法によれば、 技術資料の著者情報の類似性 (例えば 、 著者集合のオーバーラップなど) 力ら技術テーマの対象を絞ることによって、 より効率的に比較および分析を行うことも可能になる。
上述してきたように、 本実施の形態に係る技術テーマ分析装置 1 0によれば、 分析対象の資料集合に関する技術テーマを自動的に抽出し、 複数の技術テーマの 進展状況を対比しながら分析できる形で利用者に表示出力する。 これによって、 利用者は、 複数の技術テーマに関する研究開発の進展パタンを容易に比較できる ようになる。 そして、 進展パタンを手がかりに、 注目している技術テーマと類似 した技術側面を持つ別の技術テーマが見つけ、 ある時点にぉレ、て停滞しているが 、 別の技術テーマで利用されている要素技術を適用すれば進展が期待できる技術 テーマの候補を発見することなどが可能になる。
[ 3 :他の実施の形態]
さて、 これまで本発明の実施の形態について説明したが、 本発明は上述した実 施の形態以外にも、 上記特許請求の範囲に記載した技術的思想の範囲内にぉレ、て 種々の異なる実施の形態にて実施されてもよいものである。 そこで、 以下に示す ように、 (1 ) 技術テーマ抽出、. (2 ) テーマ、 (3 ) システム構成等、 (4 ) プログラム、 にそれぞれ区分けして異なる実施の形態を説明する。
( 1 ) 技術テーマ抽出
例えば、 本実施の形態では、 技術資料に基づいて技術テーマを自動抽出する場 合を説明したが、 本発明はこれに限定されるものではなく、 利用者が技術テーマ を入力し、 入力された技術テーマに沿って技術資料をグループィ匕してから処理を 行うようにしてもよレ、。
また、 本実施の形態では、 技術資料の著者情報に基づいて技術テーマを抽出す る場合を説明したが、 本発明はこれに限定されるものではなく、 例えば、 技術資 料に付与されている分類コードなど、 技術資料から取得可能な他の情報に基づい て技術テーマを抽出する場合にも同様に適用することができる。
( 2 ) テーマ
また、 本実施の形態では、 「技術テーマ」 の分析を支援する場合を説明したが, 、 本発明はこれに限定されるものではなく、 例えば、 広告、 商品、 ファッション 、 雑誌などのあらゆるテーマに関して、 注目しているテーマと類似した側面を持 つ別のテーマの発見を促すような場合に同様に適用することができる。
( 3 ) システム構成等 また、 本実施の形態では、 技術テーマ分析装置 1 0がスタンドアローンの形で 分析処理を行う場合を説明したが、 本発明はこれに限定されるものではなく、 ィ ンターネットなどのネットワークを介して接続されるクライアント装置の利用者 に対して分析サービスを提供する 「技術テーマ分析サーバ装置」 として構成して もよい。
また、 本実施の形態において説明した各処理のうち、 自動的におこなわれるも のとして説明した処理の全部または一部を手動的におこなうこともでき、 あるい は、 手動的におこなわれるものとして説明した処理の全部または一部を公知の方 法で自動的におこなうこともできる。 この他、 上記文書中や図面中で示した処理 手順、 制御手順、 具体的名称、 各種のデータやパラメータを含む情報については 、 特記する場合を除いて任意に変更することができる。
また、 図示した各装置の各構成要素は機能概念的なものであり、 必ずしも物理 的に図示の如く構成されていることを要しない。 すなわち、 各装置の分散 ·統合 の具体的形態は図示のものに限られず、 その全部または一部を、 各種の負荷や使 用状況などに応じて、 任意の単位で機能的または物理的に分散 ·統合して構成す ることができる。 さらに、 各装置にて行なわれる各処理機能は、 その全部または 任意の一部が、 C P Uおよび当該 C P Uにて解析実行されるプログラムにて実現 され、 あるいは、 ワイヤードロジックによるハードウェアとして実現され得る。
( 4 ) プログラム
ところで、 上記の本実施の形態で説明した各種の処理は、 あらかじめ用意され たプログラムをパーソナルコンピュータやワークステーションなどのコンビユー タシステムで実行することによって実現することができる。 そこで、 以下では、 本実施の形態と同様の機能を有するプログラムを実行するコンピュータシステム について説明する。
第 1 3図は、 他の実施の形態に係るコンピュータシステムの構成を示すシステ ム構成図であり、 第 1 4図は、 このコンピュータシステムにおける本体部の構成 を示すブロック図である。 第 1 3図に示すように、 このコンピュータシステム 1 00は、 本体部 101と、 本体部 101からの指示によって表示画面 102 aに 画像などの情報を表示するためのディスプレイ 102と、 このコンピュータシス テム 100に種々の情報を入力するためのキーボード 103と、 ディスプレイ 1 02の表示画面 102 a上の任意の位置を指定するためのマウス 104とを備え る。
また、 このコンピュータシステム 100における本体部 101は、 第 14図に 示すように、 C PU 121と、 RAMI 22と、 ROM123と、 ハードデイス クドライプ (HDD) 124と、 CD— ROM109を受け入れる CD— ROM ドライブ 125と、 フレキシブルディスク (FD) 108を受け入れる FDドラ イブ 126と、 ディスプレイ 102、 キーボード 103並びにマウス 104を接 続する I/Oインターフェース 127と、 ローカルエリアネットワークまたは広 域エリアネットワーク (LAN/WAN) 106に接続する LANインターフエ ース 128とを備える。
さらに、 このコンピュータシステム 100には、 インターネットなどの公衆回 線 107に接続するためのモデム 105が接続されるとともに、 LANインター フェース 128および L A N/WA N 106を介して、 他のコンピュータシステ ム (PC) 11 1、 サーバ 1 12並びにプリンタ 113などが接続される。 そして、 このコンピュータシステム 100は、 所定の記録媒体に記録されたプ 口グラムを読み出して実行することで上記した本実施の形態と同様の機能を実現 する。 ここで、 所定の記録媒体とは、 フレキシブルディスク (FD) 108、 C D-ROM109, MOディスク、 DVDディスク、 光磁気ディスク、 I Cカー ドなどの 「可搬用の物理媒体」 の他に、 コンピュータシステム 100の内外に備 えられるハードディスクドライブ (HDD) 124や、 RAMI 22、 ROM1 23などの 「固定用の物理媒体」 、 さらに、 モデム 105を介して接続される公 衆回線 107や、 他のコンピュータシステム 1 11並びにサーバ 1 12が接続さ れる LAN/WAN 106などのように、 プログラムの送信に際して短期にプロ グラムを保持する 「通信媒体」 など、 コンピュータシステム 100によって読み 取り可能なプログラムを記録する、 あらゆる記録媒体を含むものである。
すなわち、 この他の実施の形態でいうプログラムは、 上記した 「可搬用の物理 媒体」 、 「固定用の物理媒体」 、 「通信媒体」 などの記録媒体に、 コンピュータ 読み取り可能に記録されるものであり、 コンピュータシステム 1 0 0は、 このよ うな記録媒体からプログラムを読み出して実行することで上記した本実施の形態 と同様の機能を実現する。 なお、 この他の実施の形態でいうプログラムは、 コン ピュータシステム 1 0 0によって実行されることに限定されるものではなく、 他 のコンピュータシステム 1 1 1またはサーバ 1 1 2がプログラムを実行する場合 や、 これらが協働してプログラムを実行するような場合にも、 本発明を同様に適 用することができる。
[ 4 :発明の効果]
以上説明したように、 本発明によれば、 例えば、 複数の技術テーマに関する研 究開発の進展パタンを容易に比較することが可能になる。 その結果、 進展パタン を手がかりに、 注目している技術テーマと類似した技術側面を持つ別の技術テー マ (テーマの分析時点では技術開発が停滞しているが、 別の技術テーマで利用さ れている要素技術を適用すれば、 進展が期待できるような技術テーマ) を見つけ 、 その技術テーマに関する技術資料を技術開発の参考とすることによって、 ブレ →スルー技術を発見することなどが可能になる。
また、 本発明によれば、 例えば、 各技術テーマに対応する資料の発行数がどの 進展段階で増減している力等を検討することによって、 各進展段階の活気度 (ァ クテイビティ) を分析することが可能になり、 その結果、 複数の技術テーマに関 する研究開発の進展パタンを容易力つ具体的に比較することが可能になる。 また、 本発明によれば、 例えば、 各技術テーマの特定の側面に関連するキーヮ 一ドの出現数がどの進展段階で増減しているか等を検討することによって、 各進 展段階の活気度 (アクティビティ) を色々な側面ごとに分析することが可能にな る。 その結果、 複数の技術テーマに関する研究開発の進展パタンを容易かつ具体 的に比較し、 また、 特定の技術分野に焦点を当てて分析することが可能になる。 また、 本発明によれば、 例えば、 各技術テーマに関違する資料における被参照 資料および/または参照資料の発行数がどの進展段階で増減して 、るか等を検討 することによって、 各進展段階の活気度 (アクティビティ) を分析することが可 能になり、 その結果、 複数の技術テーマに関する研究開発の進展パタンを容易か つ具体的に比較することが可能になる。
また、 本発明によれば、 例えば、 利用者が注目する技術側面が各技術テーマの 進展状況におけるどの進展段階で有用であるのか、 また、 そのような技術側面が どのような進展パタンをもたらし得るの力等を分析することも可能になり、 これ によって、 複数の技術テーマに関する研究開発の進展パタンを一層効果的に比較 することが可能になる。
また、 本発明によれば、 例えば、 進展状況が類似する技術テーマ同士に対象を 絞って、 より効率的に比較および分析を行うことも可能になり、 これによつて、 複数の技術テーマに関する研究開発の進展パタンを一層効果的に比較することが 可能になる。
また、 本発明によれば、 例えば、 技術側面が類似する技術テーマ同士に対象を 絞って、 より効率的に比較および分析を行うことも可能になり、 これによつて、 複数の技術テーマに関する研究開発の進展パタンを一層効果的に比較することが 可能になる。
また、 本発明によれば、 例えば、 利用者自らが技術テーマを抽出するまでもな く、 複数の技術資料を整理する形で各技術テーマを抽出することが可能になり、 これによつて、 各技術テーマに関する研究開発の進展パタンを容易かつ簡便に比 較することも可能になる。 産業上の利用可能性
以上のように、 本発明に係るテーマ分析装置、 テーマ分析方法およびテーマ分 析プログラムは、 例えば、 複数の技術テーマに関する研究開発の進展パタンを容 易に比較することに適している。

Claims

請 求 の 範 囲
1 - テーマの進展状況を資料に基づいて分析するテーマ分析装置であって、 各テーマに対応する資料に基づき、 各テーマの進展状況を同一の時間軸に沿つ て解析する進展状況解析手段と、
前記進展状況解析手段によつて解析された各テーマの進展状況を前記同一の時 間軸上で相互に比較可能に出力する進展状況出力手段と、
を備えたことを特徴とするテーマ分析装置。
2 . 前記進展状況解析手段は、 各テーマに対応する資料の発行数をテーマごと 発行時期別に集計し、 当該発行時期別の資料発行数に応じて各テーマの進展状況 を解析することを特徴とする請求の範囲第 1項に記載のテーマ分析装置。
3 . 前記進展状況解析手段は、 各テーマに対応する資料における各テーマに関 連するキーワードの出現数をテーマごと発行時期別に集計し、 当該発行時期別の キーヮード出現数に応じて各テーマの進展状況を解析することを特徴とする請求 の範囲第 1項に記載のテーマ分析装置。
4 . 前記進展状況解析手段は、 各テーマに対応する資料が参照している被参照 資料および/または各テーマに対応する資料を参照している参照資料の発行数を テーマごと発行時期別に集計し、 当該被参照資料および Zまたは参照資料の発行 時期別の発行数に応じて各テーマの進展状況を解析することを特徴とする請求の 範囲第 1項に記載のテーマ分析装置。
5 . 前記進展状況解析手段によって解析された各テーマの進展状況における各 進展段階に対して、 所定の要素との関連を解析する要素関連解析手段をさらに備 え、 前記進展状況出力手段は、 各テーマの進展状況とともに、 前記要素関連解析手 段によって解析された各進展段階における前記所定の要素との関連を出力するこ とを特徴とする請求の範囲第 1項に記載のテーマ分析装置。
6 . 前記進展状況解析手段によって解析された各テーマの進展状況に基づいて 、 各進展段階間の類似関係を解析する進展段階類似解析手段をさらに備え、 前記進展状況出力手段は、 各テーマの進展状況とともに、 前記進展段階類似解 析手段によって解析された各進展段階間の類似関係を出力することを特徴とする 請求の範囲第 1項に記載のテーマ分析装置。
7 . 前記進展状況解析手段による解析対象である各テーマ間の類似関係を解析 するテーマ類似解析手段をさらに備え、
前記進展状況出力手段は、 各テーマの進展状況とともに、 前記テーマ類似解析 手段によって解析された各テーマ間の類似関係を出力することを特徴とする請求 の範囲第 1項に記載のテーマ分析装置。
8 . 前記資料を解析してテーマを抽出するテーマ抽出手段をさらに備え、 前記進展状況解析手段は、 前記テーマ抽出手段によって抽出されたテーマごと に、 各テーマの進展状況を解析することを特徴とする請求の範囲第 1項に記載の テーマ分析装置。
9 . テーマの進展状況を資料に基づいて分析するテーマ分析方法であって、 各テーマに対応する資料に基づき、 各テーマの進展状況を同一の時間軸に沿つ て解析する進展状況解析工程と、
前記進展状況解析工程によつて解析された各テーマの進展状況を前記同—の時 間軸上で相互に比較可能に出力する進展状況出力工程と、
を含んだことを特徴とするテーマ分析方法。
1 0 . 前記進展状況解析工程によって解析された各テーマの進展状況における 各進展段階に対して、 所定の要素との関連を解析する要素関連解析工程をさらに 含み、
前記進展状況出力工程は、 各テーマの進展状況とともに、 前記要素関連解析ェ 程によつて解析された各進展段階における前記所定の要素との関連を出力するこ とを特徴とする請求の範囲第 9項に記載のテーマ分析方法。
1 1 . 前記進展状況解析工程によって解析された各テーマの進展状況に基づい て、 各進展段階間の類似関係を解析する進展段階類似解析工程をさらに含み、 前記進展状況出力工程は、 各テーマの進展状況とともに、 前記進展段階類似解 析工程によって解析された各進展段階間の類似関係を出力することを特徴とする 請求の範囲第 9項に記載のテーマ分析方法。
1 2 . 前記進展状況解析工程による解析対象である各テーマ間の類似関係を解 析するテーマ類似解析工程をさらに含み、
前記進展状況出力工程は、 各テーマの進展状況とともに、 前記テーマ類似解析 手段によって解析された各テーマ間の類似関係を出力することを特徴とする請求 の範囲第 9項に記載のテーマ分析方法。
1 3 . 前記資料を解析してテーマを抽出するテーマ抽出工程をさらに含み、 前記進展状況解析工程は、 前記テーマ抽出手段によって抽出されたテーマごと に、 各テーマの進展状況を解析することを特徴とする請求の範囲第 9項に記載の テーマ分析方法。
1 4. テーマの進展状況を資料に基づいて分析する方法をコンピュータに実行 させるテーマ分析プログラムであって、 各テーマに対応する資料に基づき、 各テーマの進展状況を同一の時間軸に沿つ て解析する進展状況解析手順と、
前記進展状況解析手順によつて解析された各テーマの進展状況を前記同一の時 間軸上で相互に比較可能に出力する進展状況出力手順と、
をコンピュータに実行させることを特徴とするテーマ分析プログラム。
1 5 . 前記進展状況解析手順によって解析された各テーマの進展状況における 各進展段階に対して、 所定の要素との関連を解析する要素関連解析手順をさらに コンピュータに実行させ、
前記進展状況出力手順は、 各テーマの進展状況とともに、 前記要素関連解析手 順によつて解析された各進展段階における前記所定の要素との関連を出力するこ とを特徴とする請求の範囲第 1 4項に記載のテーマ分析プログラム。
1 6 . 前記進展状況解析手順によって解析された各テーマの進展状況に基づい て、 各進展段階間の類似関係を解析する進展段階類似解析手順をさらにコンビュ ータに実行させ、
前記進展状況出力手順は、 各テーマの進展状況とともに、 前記進展段階類似解 析手順によって解析された各進展段階間の類似関係を出力することを特徴とする 請求の範囲第 1 4項に記載のテーマ分析プログラム。
1 7 . 前記進展状況解析手順による解析対象である各テーマ間の類似関係を解 析するテーマ類似解析手順をさらにコンピュータに実行させ、
前記進展状況出力手順は、 各テーマの進展状況とともに、 前記テーマ類似解析 手段によって解析された各テーマ間の類似関係を出力することを特徴とする請求 の範囲第 1 4項に記載のテーマ分析プログラム。
1 8 . 前記資料を解析してテーマを抽出するテーマ抽出手 をさらにコンビュ ータに実行させ、
前記進展状況解析手順は、 前記テーマ抽出手段によつて抽出されたテーマごと に、 各テーマの進展状況を解析することを特徴とする請求の範囲第 1 4項に記載 のテーマ分析プログラム。
PCT/JP2003/006395 2003-05-22 2003-05-22 テーマ分析装置 WO2004104859A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2003/006395 WO2004104859A1 (ja) 2003-05-22 2003-05-22 テーマ分析装置
JP2004572108A JPWO2004104859A1 (ja) 2003-05-22 2003-05-22 テーマ分析装置、テーマ分析方法およびその方法をコンピュータに実行させるテーマ分析プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2003/006395 WO2004104859A1 (ja) 2003-05-22 2003-05-22 テーマ分析装置

Publications (1)

Publication Number Publication Date
WO2004104859A1 true WO2004104859A1 (ja) 2004-12-02

Family

ID=33463144

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2003/006395 WO2004104859A1 (ja) 2003-05-22 2003-05-22 テーマ分析装置

Country Status (2)

Country Link
JP (1) JPWO2004104859A1 (ja)
WO (1) WO2004104859A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007034598A (ja) * 2005-07-26 2007-02-08 Mitsubishi Electric Corp 情報調査装置、情報調査方法、記録媒体
JP2011128955A (ja) * 2009-12-18 2011-06-30 Toppan Printing Co Ltd 電子チラシ情報検索装置
WO2012046436A1 (ja) * 2010-10-05 2012-04-12 旭化成株式会社 文書分析装置、文書分析方法および文書分析プログラム
JP2012198809A (ja) * 2011-03-22 2012-10-18 Toshiba Corp 文書分析装置およびプログラム
JP2013073621A (ja) * 2011-09-26 2013-04-22 Korea Institute Of Science & Technology Infomation 研究連関度サービス提供方法及び装置
JP2013073619A (ja) * 2011-09-26 2013-04-22 Korea Institute Of Science & Technology Infomation 技術生命周期グラフを用いた技術推移の提供方法及び装置とその提供システム並びに技術推移情報データベース構築装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07319905A (ja) * 1994-05-25 1995-12-08 Fujitsu Ltd 情報検索装置
JPH0877178A (ja) * 1994-09-01 1996-03-22 Ibm Japan Ltd 情報検索システム及び方法
JP2000148789A (ja) * 1998-11-05 2000-05-30 Inpatekku Kk 特許情報等の引用文献分析方法及び引用文献分析装置
JP2001092851A (ja) * 1999-09-08 2001-04-06 Koto Gijutsu Kenkyuin Kenkyu Kumiai 特許分析用データ加工および特許マップ自動生成方法とこれのためのプログラムを貯蔵するための記録媒体
JP2002163275A (ja) * 2000-11-29 2002-06-07 Matsushita Electric Ind Co Ltd 技術文書検索装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000258789A (ja) * 1999-03-08 2000-09-22 Matsushita Electric Ind Co Ltd 液晶表示装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07319905A (ja) * 1994-05-25 1995-12-08 Fujitsu Ltd 情報検索装置
JPH0877178A (ja) * 1994-09-01 1996-03-22 Ibm Japan Ltd 情報検索システム及び方法
JP2000148789A (ja) * 1998-11-05 2000-05-30 Inpatekku Kk 特許情報等の引用文献分析方法及び引用文献分析装置
JP2001092851A (ja) * 1999-09-08 2001-04-06 Koto Gijutsu Kenkyuin Kenkyu Kumiai 特許分析用データ加工および特許マップ自動生成方法とこれのためのプログラムを貯蔵するための記録媒体
JP2002163275A (ja) * 2000-11-29 2002-06-07 Matsushita Electric Ind Co Ltd 技術文書検索装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ARAI, "Tokkyo Joho Bunseki to Patent Map", The Journal of Information Science and Technology Association, Vol. 53, No. 1, 01 January 2003, pages 16-21 *
ARAI, "Tokkyo Joho Kaiseki ni yoru Gijutsu no Doko Bunpu Chosa", The Journal of Information Science and Technology Association, Vol. 43, No. 8, 01 August 1993, pages 728-739 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007034598A (ja) * 2005-07-26 2007-02-08 Mitsubishi Electric Corp 情報調査装置、情報調査方法、記録媒体
JP2011128955A (ja) * 2009-12-18 2011-06-30 Toppan Printing Co Ltd 電子チラシ情報検索装置
WO2012046436A1 (ja) * 2010-10-05 2012-04-12 旭化成株式会社 文書分析装置、文書分析方法および文書分析プログラム
JP2012198809A (ja) * 2011-03-22 2012-10-18 Toshiba Corp 文書分析装置およびプログラム
JP2013073621A (ja) * 2011-09-26 2013-04-22 Korea Institute Of Science & Technology Infomation 研究連関度サービス提供方法及び装置
JP2013073619A (ja) * 2011-09-26 2013-04-22 Korea Institute Of Science & Technology Infomation 技術生命周期グラフを用いた技術推移の提供方法及び装置とその提供システム並びに技術推移情報データベース構築装置

Also Published As

Publication number Publication date
JPWO2004104859A1 (ja) 2006-07-20

Similar Documents

Publication Publication Date Title
Leroy et al. A shallow parser based on closed-class words to capture relations in biomedical text
Wiwie et al. Comparing the performance of biomedical clustering methods
Zhao et al. BRB-ArrayTools Data Archive for human cancer gene expression: a unique and efficient data sharing resource
Petersen et al. Systematic mapping studies in software engineering
Cohen et al. Reducing workload in systematic review preparation using automated citation classification
Korhonen et al. Text mining for literature review and knowledge discovery in cancer risk assessment and research
JP4966546B2 (ja) 電子テキストに概念的強調を自動的に施す方法
KR101118454B1 (ko) 문서 데이터베이스에서 문서들의 도메인 식별방법
Nguyen et al. Supervised machine learning and active learning in classification of radiology reports
JP2019512795A (ja) 類似するプロファイルを持つ患者を共に分類する分類モデルの性能を改善するための適合性フィードバック
Torres et al. PARTIE: a partition engine to separate metagenomic and amplicon projects in the Sequence Read Archive
Dalle Lucca Tosi et al. Understanding the evolution of a scientific field by clustering and visualizing knowledge graphs
JP2011513810A (ja) 用語識別方法および装置
Fu et al. Supporting the annotation of chronic obstructive pulmonary disease (COPD) phenotypes with text mining workflows
JP2021114057A (ja) 文書表示支援システム及び文書表示支援方法並びに該方法を実行するためのプログラム
Duong et al. Neural networks for classification and image generation of aging in genetic syndromes
Griffiths et al. A multi-genre model for music emotion recognition using linear regressors
Kim et al. A mutation profile for top-k patient search exploiting Gene-Ontology and orthogonal non-negative matrix factorization
Wijewickrema et al. Selecting a text similarity measure for a content-based recommender system: A comparison in two corpora
WO2004104859A1 (ja) テーマ分析装置
Malik et al. Combination of text-mining algorithms increases the performance
Yeganova et al. Retro: concept-based clustering of biomedical topical sets
Kim et al. Prioritizing PubMed articles for the Comparative Toxicogenomic Database utilizing semantic information
JP2020102021A (ja) 文書検索プログラム、文書検索方法および文書検索システム
Rohajawati et al. Unveiling Insights: A Knowledge Discovery Approach to Comparing Topic Modeling Techniques in Digital Health Research

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): JP US

WWE Wipo information: entry into national phase

Ref document number: 2004572108

Country of ref document: JP