KR101247739B1 - Apparatus and method for predicting technology recognition change - Google Patents
Apparatus and method for predicting technology recognition change Download PDFInfo
- Publication number
- KR101247739B1 KR101247739B1 KR1020120077376A KR20120077376A KR101247739B1 KR 101247739 B1 KR101247739 B1 KR 101247739B1 KR 1020120077376 A KR1020120077376 A KR 1020120077376A KR 20120077376 A KR20120077376 A KR 20120077376A KR 101247739 B1 KR101247739 B1 KR 101247739B1
- Authority
- KR
- South Korea
- Prior art keywords
- document
- technology
- value
- recognition
- specific technology
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Algebra (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
본 발명은 기술 인지도 변화 예측 장치 및 방법에 관한 것으로, 보다 상세하게는 특정 기술에 대한 통계 정보를 기반으로 특정 기술의 인지도 값을 문서별로 각각 구하고, 문서별로 구해진 인지도 값들을 연도별로 수집 및 평균값을 구한 후, 연도별 평균값을 기반으로 상기 특정 기술의 인지도 변화 속도를 예측하는 기술 인지도 변화 예측 장치 및 방법에 관한 것이다.
The present invention relates to an apparatus and method for predicting technology awareness, and more particularly, to obtain recognition values of specific technologies for each document based on statistical information on specific technologies, and to collect and average recognition values obtained for each document by year. The present invention relates to an apparatus and method for predicting technology awareness for predicting a rate of awareness change of the specific technology based on a yearly average value.
지식과 정보가 그 국가의 경쟁력을 좌우하는 지식기반 산업사회로 전환되고, 특히 국가과학기술경쟁력이 국가경쟁력의 원천으로 인식되고 있는 실정이다.Knowledge and information are transformed into a knowledge-based industrial society that determines the competitiveness of the country, and national science and technology competitiveness is recognized as a source of national competitiveness.
이에 세계 각국들은 미래의 경쟁에 살아남기 위한 핵심기술 및 연구과제를 미리 도출하고 선정하여 집중적인 연구개발을 추진해 나가고자 하고 있다.In this regard, countries around the world are seeking to develop and select core technologies and research projects to survive in future competition.
이러한 이유로 각국들은 미래 국가 과학기술을 주도할 유망한 연구영역을 찾아내어 기술 라이프 사이클을 제공하고 있다. For this reason, countries are looking for promising research areas that will lead future national science and technology, providing a technology life cycle.
그러나, 종래의 기술 라이프 사이클은 각 단계에 속하는 기술만을 제시할 뿐 각 기술의 인지도, 인지도의 변화 속도 및 변화 방향에 대한 정보를 제공하지 못하는 단점이 있다.
However, the conventional technology life cycle only presents the technologies belonging to each step, and has a disadvantage in that it cannot provide information on the recognition, the speed of change, and the change direction of each technology.
본 발명은 상기한 문제점을 해결하기 위하여 안출된 것으로, 기술에 대한 인지도, 그 인지도의 변화 속도 및 변화 방향에 대한 정보를 제공할 수 있는 기술 인지도 변화 예측 장치 및 방법을 제공하는데 있다. SUMMARY OF THE INVENTION The present invention has been made to solve the above problems, and provides an apparatus and method for predicting technology awareness change that can provide information on technology awareness, the speed of change, and the direction of change.
본 발명의 다른 목적은 기술에 대한 시장에서의 인지도, 관심도 등을 기반으로 기술에 대한 전문가뿐만 아니라 일반인의 기대를 추정하고, 그 추정의 변화를 감지하여 기술의 인지도/기대치에 대한 미래 예측을 가능하게 하는 기술 인지도 변화 예측 장치 및 방법을 제공하는데 있다. Another object of the present invention is to estimate the expectations of the public as well as experts on the technology based on the market awareness, interest in the technology, and to detect the change in the estimation, it is possible to predict the future of the technology's awareness / expectation The present invention provides an apparatus and method for predicting change in awareness.
상기 목적들을 달성하기 위하여 본 발명의 일 측면에 따르면, 다중 문헌 제공 장치에 저장된 문서들을 분석하여, 특정 기술에 대한 통계 정보를 추출하는 기술 통계 정보 추출부, 상기 통계 정보를 기반으로 상기 특정 기술의 인지도 값을 문서별로 각각 구하는 기술 인지도 계산부, 상기 문서별로 구해진 인지도 값들을 연도별로 수집 및 평균값을 구하고, 연도별 평균값을 기반으로 상기 특정 기술의 인지도 변화 속도를 예측하는 인지도 변화 예측부를 포함하는 기술 인지도 변화 예측 장치가 제공된다. According to an aspect of the present invention in order to achieve the above object, a technical statistics information extraction unit for analyzing the documents stored in the multi-document providing apparatus, extracting statistical information for a specific technology, based on the statistical information of the specific technology A technology recognition calculation unit for obtaining recognition values for each document, a technology including a recognition change prediction unit for collecting and averaging the recognition values obtained for each document for each year, and predicting the rate of change of the specific technology based on the average value for each year. A recognition change prediction apparatus is provided.
상기 기술 통계정보 추출부는 상기 다중 문헌 제공 장치에 저장된 문서들을 분석하여 상기 특정 기술을 포함하는 문서들을 획득하고, 상기 획득된 문서들을 분석하여, 상기 특정 기술에 대한 문서내 빈도수, 문서 내에 포함된 전체 기술명 빈도수, 문서내 위치 및 위치별 빈도수, 문서 종류별 빈도수, 문헌의 연도 중 적어도 하나를 포함하는 통계정보를 추출할 수 있다. The descriptive statistical information extracting unit analyzes the documents stored in the multi-document providing apparatus to obtain documents including the specific technology, and analyzes the obtained documents, the frequency in the document for the specific technology, the whole contained in the document. Statistical information including at least one of a technical name frequency, a location in a document, a frequency for each location, a frequency for each document type, and a document year may be extracted.
상기 기술 인지도 계산부는 상기 통계 정보를 기반으로 특정 기술이 추출된 문서의 신뢰도 값, 문서내에서 특정 기술이 추출된 위치정보 값, 특정 기술의 문서내 중요도 값, 특정 기술의 문서 전체 내 중요도 값을 각각 구하고, 그 구해진 값들을 이용하여 상기 특정 기술의 인지도 값을 구할 수 있다. The technology recognition calculator calculates a reliability value of a document from which a specific technology is extracted based on the statistical information, a location information value from which a specific technology is extracted from a document, an importance value in a document of a specific technology, and an importance value in the entire document of a specific technology. Each can be obtained, and the obtained values can be used to obtain the recognition value of the specific technology.
상기 기술 인지도 계산부는 하기의 수학식을 이용하여 상기 특정 기술의 인지도 값을 구할 수 있다. The technology recognition calculator may obtain a recognition value of the specific technology by using the following equation.
[수학식][Mathematical Expression]
여기서, 는 문서의 신뢰도 값, 는 문서내에서 특정 기술이 추출된 위치 정보 값,는 특정 기술의 문서 내 중요도 값,은 특정 기술의 문서 전체 내 중요도 값, I, J, K, L은 , , , 각각의 비중을 의미함.here, Is the confidence value of the document, Is the location information value from which a particular technology is extracted from the document, Is the importance value in the document for a particular technology, Is the importance value within the entire document of a particular technology, I, J, K, L , , , Meaning of each specific gravity.
상기 문서의 신뢰도 값은 사용자에 의해 설정된 가중치 또는 웹 검색 통계 정보를 기반으로 구해진 가중치를 이용하여 구해진 값일 수 있다. The confidence value of the document may be a value obtained by using a weight obtained based on a weight set by a user or web search statistical information.
상기 특정 기술의 문서내 중요도 값은 문서내에 포함된 전체 기술명 빈도수(TF) 중에 상기 특정 기술의 빈도수(AF)를 통해 구해진다. The importance value in a document of the specific description is obtained through the frequency AF of the specific description among the total description frequency TF included in the document.
상기 특정 기술의 문서 전체내 중요도 값은 전체 문서수(N)에서 특정 기술이 포함된 문서수(d)의 역(Inverse) 비율 값으로 구해진다. The importance value in the entire document of the specific technology is obtained as an inverse ratio value of the total number of documents N to the number of documents d containing the specific technology.
상기 인지도 변화 예측부는 상기 특정 기술에 대해 문서별로 구해진 인지도 값을 연도별로 수집하고, 그 수집된 인지도 값들의 연도별 평균을 구한 후, 상기 연도별 평균값을 기반으로 예측 연도의 인지도 값을 예측하고, 그 예측된 인지도 값을 이용하여 인지도의 변화 속도를 구할 수 있다. The recognition change prediction unit collects the recognition values obtained for each specific document for each year, obtains the average of the collected recognition values by year, and predicts the recognition value of the predicted year based on the average value for each year, The predicted recognition value can be used to determine the rate of change of recognition.
상기 인지도 변화 예측부는 회귀분석 방법, 이동평균분석 방법, 상기 두 방법을 혼합한 방법(ARMA) 중 적어도 하나의 방법을 이용하여 예측 연도의 인지도 값을 예측할 수 있다. The recognition change prediction unit may predict the recognition value of the predicted year by using at least one of a regression analysis method, a moving average analysis method, and a combination of the two methods (ARMA).
또한, 상기 인지도 변화 예측부는 상기 예측된 변화 속도를 기 설정된 변화 방향 단계와 비교하고, 그 비교결과에 따라 인지도 변화 방향을 결정할 수 있다. The recognition change predicting unit may compare the predicted change rate with a preset change direction step, and determine a change in recognition rate according to the comparison result.
본 발명의 다른 측면에 따르면, 기술 인지도 변화 예측 장치가 특정 기술의 인지도 변화를 예측하는 방법에 있어서, (a) 다중 문헌 제공 장치에 저장된 문서들을 분석하여, 특정 기술에 대한 통계 정보를 추출하는 단계, (b) 상기 통계 정보를 기반으로 상기 특정 기술의 인지도 값을 문서별로 각각 구하는 단계, (c) 상기 문서별로 구해진 인지도 값들을 연도별로 수집 및 평균값을 구하고, 연도별 평균값을 기반으로 상기 특정 기술의 인지도 변화 속도를 예측하는 단계를 포함하는 기술 인지도 변화 예측 방법이 제공된다. According to another aspect of the present invention, a method for predicting a change in recognition of a specific technology by the technology awareness change prediction apparatus, the method comprising: (a) analyzing statistical documents stored in a multi-document providing apparatus, and extracting statistical information about a specific technology; (b) obtaining recognition values of the specific technology for each document based on the statistical information, and (c) collecting and averaging the recognition values obtained for each document by year, and calculating the specific technology based on the average value for each year. A technology awareness change prediction method comprising predicting a rate of change of awareness is provided.
상기 (a) 단계는, 상기 다중 문헌 제공 장치에 저장된 문서들을 분석하여 상기 특정 기술을 포함하는 문서들을 획득하고, 상기 획득된 문서들을 분석하여, 상기 특정 기술에 대한 문서내 빈도수, 문서 내에 포함된 전체 기술명 빈도수, 문서내 위치 및 위치별 빈도수, 문서 종류별 빈도수, 문헌의 연도 중 적어도 하나를 포함하는 통계정보를 추출하는 것을 특징으로 할 수 있다. In the step (a), the documents stored in the multi-document providing apparatus may be acquired to obtain documents including the specific technology, and the obtained documents may be analyzed to include the frequency in the document for the specific technology and included in the document. Statistical information including at least one of the overall technical name frequency, the frequency within the document and the location-specific frequency, the frequency of each document type, the year of the document may be extracted.
상기 (b) 단계는, 상기 통계 정보를 기반으로 특정 기술이 추출된 문서의 신뢰도 값, 문서내에서 특정 기술이 추출된 위치정보 값, 특정 기술의 문서내 중요도 값, 특정 기술의 문서 전체 내 중요도 값을 각각 구하고, 그 구해진 값들을 이용하여 상기 특정 기술의 인지도 값을 구하는 것을 특징으로 할 수 있다. In the step (b), the reliability value of the document from which the specific technology is extracted based on the statistical information, the location information value from which the specific technology is extracted from the document, the importance value in the document of the specific technology, and the importance in the entire document of the specific technology Each value may be obtained and the recognition values of the specific technology may be obtained using the obtained values.
상기 특정 기술의 인지도 값은 하기의 수학식을 이용하여 상기 특정 기술의 인지도 값을 구할 수 있다. Recognition value of the specific technology can be obtained by using the following equation.
[수학식][Mathematical Expression]
여기서, 는 문서의 신뢰도 값, 는 문서내에서 특정 기술이 추출된 위치 정보 값,는 특정 기술의 문서 내 중요도 값,은 특정 기술의 문서 전체 내 중요도 값, I, J, K, L은 , , , 각각의 비중을 의미함.here, Is the confidence value of the document, Is the location information value from which a particular technology is extracted from the document, Is the importance value in the document for a particular technology, Is the importance value within the entire document of a particular technology, I, J, K, L , , , Meaning of each specific gravity.
상기 문서의 신뢰도 값은 사용자에 의해 설정된 가중치 또는 웹 검색 통계 정보를 기반으로 구해진 가중치를 이용하여 구해진 값일 수 있다. The confidence value of the document may be a value obtained by using a weight obtained based on a weight set by a user or web search statistical information.
상기 특정 기술의 문서내 중요도 값은 문서내에 포함된 전체 기술명 빈도수(TF) 중에 상기 특정 기술의 빈도수(AF)를 통해 구해지는 것을 특징으로 할 수 있다. The importance value in the document of the specific technology may be obtained through the frequency AF of the specific technology among all the technology name frequency TF included in the document.
상기 특정 기술의 문서 전체내 중요도 값은 전체 문서수(N)에서 특정 기술이 포함된 문서수(d)의 역(Inverse) 비율 값으로 구해질 수 있다. The importance value in the entire document of the specific technology may be obtained as an inverse ratio value of the total number of documents N to the number of documents d containing the specific technology.
상기 (c) 단계는, 상기 특정 기술에 대해 문서별로 구해진 인지도 값을 연도별로 수집하고, 그 수집된 인지도 값들의 연도별 평균을 구하는 단계, 상기 연도별 평균값을 기반으로 예측 연도의 인지도 값을 예측하는 단계, 상기 예측된 인지도 값을 이용하여 인지도의 변화 속도를 구하는 단계를 포함할 수 있다. In the step (c), the recognition value obtained for each document for the specific technology is collected for each year, and the average of the collected recognition values is calculated for each year. The prediction value of the predicted year is predicted based on the average value for each year. The method may include obtaining a rate of change of the recognition using the predicted recognition value.
상기 기술 인지도 변화 예측 방법은 상기 예측된 변화 속도를 기 설정된 변화 방향 단계와 비교하고, 그 비교결과에 따라 인지도 변화 방향을 결정하는 단계를 더 포함할 수 있다. The technology awareness change prediction method may further include comparing the predicted change rate with a preset change direction step, and determining the change in recognition degree according to the comparison result.
본 발명의 또 다른 측면에 따르면, 다중 문헌 제공 장치에 저장된 문서들을 분석하여, 특정 기술에 대한 통계 정보를 추출하는 단계, 상기 통계 정보를 기반으로 상기 특정 기술의 인지도 값을 문서별로 각각 구하는 단계, 상기 문서별로 구해진 인지도 값들을 연도별로 수집 및 평균값을 구하고, 연도별 평균값을 기반으로 상기 특정 기술의 인지도 변화 속도를 예측하는 단계를 포함하는 기술 인지도 변화 예측 방법이 컴퓨터로 판독 가능한 기록매체가 제공된다.
According to another aspect of the present invention, by analyzing the documents stored in the multi-document providing apparatus, extracting statistical information for a specific technology, obtaining each recognition value for each specific document based on the statistical information, There is provided a computer-readable recording medium having a technology awareness change prediction method comprising collecting and averaging the recognition values obtained for each document for each year, and predicting the rate of change of the recognition of the specific technology based on the yearly average value. .
본 발명에 따르면, 기술에 대한 인지도, 그 인지도의 변화 속도 및 변화 방향에 대한 정보를 제공할 수 있다. According to the present invention, it is possible to provide information on the recognition of the technology, the speed of change and the direction of change of the recognition.
또한, 기술에 대한 시장에서의 인지도, 관심도 등을 기반으로 기술에 대한 전문가뿐만 아니라 일반인의 기대를 추정하고, 그 추정의 변화를 감지하여 기술의 인지도/기대치에 대한 미래 예측을 가능하게 한다. In addition, it is possible to estimate the expectation of not only experts on the technology but also the general public based on the market awareness and interest in technology, and to detect the change of the estimation to enable future prediction of the technology's awareness / expectation.
또한, 기술·산업·시장·정책 등에 대한 글로벌 모니터링 체제를 구축하고, 이를 기반으로 이머징 시그널 및 미래기술 전후방 정보를 제공함으로써 혁신형 중소기업의 기술사업화 성공률 및 기술경쟁력 제고, 연구자/혁신형 중소기업의 사전 글로벌 연구동향 파악이 가능하여 중복연구방지 및 연구개발 시행착오를 최소화시킴으로써 핵심역량의 선택과 집중이 가능하여 효율성을 높이고, 이에 따른 기술사업의 성공 가능성 증대시킬 수 있다.
In addition, by establishing a global monitoring system for technology, industry, market, and policy, and providing emerging signals and forward and backward information based on this, enhancing the success rate of technology commercialization and technological competitiveness of innovative SMEs, and advancement of researchers and innovative SMEs. Global research trends can be grasped to prevent duplicate research and minimize R & D trials and errors, which enables the selection and concentration of core competencies, increasing efficiency and increasing the likelihood of success in technology projects.
도 1은 본 발명에 따른 기술 인지도 변화 예측 장치의 구성을 개략적으로 나타낸 도면이다.
도 2는 본 발명에 따른 기술 인지도 변화 예측 장치가 기술 인지도의 변화를 예측하는 방법을 나타낸 흐름도이다. 1 is a view schematically showing the configuration of the technology awareness change prediction apparatus according to the present invention.
2 is a flowchart illustrating a method of predicting a change in technology awareness by the apparatus for predicting change in technology awareness according to the present invention.
본 발명의 전술한 목적과 기술적 구성 및 그에 따른 작용 효과에 관한 자세한 사항은 본 발명의 명세서에 첨부된 도면에 의거한 이하 상세한 설명에 의해 보다 명확하게 이해될 것이다.
The foregoing and other objects, features, and advantages of the present invention will become more apparent from the following detailed description taken in conjunction with the accompanying drawings, in which: FIG.
도 1은 본 발명에 따른 기술 인지도 변화 예측 장치의 구성을 개략적으로 나타낸 도면이다.1 is a view schematically showing the configuration of the technology awareness change prediction apparatus according to the present invention.
도 1을 참조하면, 기술 인지도 변화 예측 장치(100)는 기술 통계정보 추출부(110), 기술 인지도 계산부(120), 인지도 변화 예측부(130)를 포함한다.Referring to FIG. 1, the technology awareness
기술 통계 정보 추출부(110)는 문서들을 분석하여 기술명에 대한 통계 정보를 추출한다. 여기서, 문서는 논문, 특허, 보고서, 웹 문서 등을 포함한다. 통계 정보는 문서내에서 추출된 기술명, 문서내 기술명의 빈도수, 문서내에 포함된 전체 기술명 빈도수, 기술명이 추출된 문서내의 위치 및 위치별 빈도수, 문서 종류별 빈도수, 문서내 개별 기술의 통계, 기술명이 추출된 문서의 연도 등을 포함한다. The descriptive statistical
기술 통계 정보 추출부(110)는 다중 문헌 제공 장치에 저장된 문서들을 분석하여 기술용어 사전에 정의된 기술명을 포함하는 문서들을 획득하고, 그 문서들로부터 기술명을 추출한다. 기술용어 사전에는 의학, 공학, 자연과학 등 다양한 분야의 기술용어들이 저장되어 있고, 다중문헌제공 장치에는 논문, 특허, 보고서 등의 문서가 저장되어 있다. The descriptive statistics
즉, 기술 통계정보 추출부(110)는 문서에 대해 형태소 분석, 구문 분석, 의미 분석을 수행하여 용어를 인식하고, 인식된 용어가 기술 용어 사전에 등록된 경우, 기술명으로 인식한다. 이때, 기술 통계 정보 추출부(110)는 각 기술명이 추출된 위치를 판단하고, 각 기술명과 위치를 함께 저장한다. 위치는 제목, 부제, 중간 제목, 내용, 초록 등을 포함한다. 또한, 기술 통계 정보 추출부(110)는 기술명이 추출된 문서의 위치별 빈도수를 함께 저장한다. That is, the descriptive statistical
또한, 기술 통계정보 추출부(110)는 각 문서에서 기술명이 추출된 빈도수를 누적하고, 각 기술명이 추출된 문서들의 연도를 함께 저장한다. In addition, the descriptive statistical
또한, 기술 통계 정보 추출부(110)는 기 저장된 문맥 패턴 정보를 근거로 추출된 기술명 사이의 문맥을 추출하고, 구비된 정규화 사전 데이터베이스를 근거로 추출된 문맥을 정규화하는 방식으로 기술명간의 관계를 인식한다.In addition, the descriptive statistics
기술 통계 정보 추출부(110)는 2개 이상의 기술명이 인식된 경우, 문맥 패턴 정보를 근거로 그 기술명 사이의 문맥을 추출하고, 정규화 사전 데이터베이스를 근거로 추출된 문맥을 정규화하는 방식으로 기술명의 관계를 생성한다.When two or more description names are recognized, the descriptive statistics
예를 들어, "notebook consists of monitor, SSD, and mobile processor" 문장의 경우, 기술 통계 정보 추출부(110)는 notebook, monitor, SSD, mobile processor의 기술명을 인식하게 된다. For example, in the case of the phrase "notebook consists of monitor, SSD, and mobile processor", the descriptive
이때, 2개 이상의 기술명이 인식되었으므로, 기술 통계 정보 추출부(110)는 기 저장된 문맥 패턴 정보 예를 들면, "Be동사 + 과거분사형 + 전치사"에 부합하는 문맥만을 추출한다.In this case, since two or more descriptive names are recognized, the descriptive statistics
그런 다음 기술 통계 정보 추출부(110)는 정규화 사전을 근거로 해당 문맥의 시제 예를 들면 "was"를 "be"로 통일하고, 유사표현 예를 들면, “similar to"와 "similar with"를 "similar to"로 통일하는 등의 문맥 정규화를 수행하여 기술명간의 관계를 생성한다.Then, the descriptive statistics
기술 인지도 계산부(120)는 기술 통계 정보 추출부(110)에서 추출된 통계 정보를 기반으로 각 기술의 인지도 값을 구한다. 기술 인지도는 특정 기술이 전문가, 일반인 등에게 얼마만큼 중요하게 인식되고 있는지에 대한 정보를 수치화한 값이다. 이때, 기술 인지도 계산부(120)는 각 기술에 대한 인지도 값을 개별 문서별로 각각 구한다. The
기술 인지도 계산부(120)는 통계 정보를 기반으로 특정 기술이 추출된 문서의 신뢰도 값, 문서내에서 특정 기술이 추출된 위치정보 값, 특정 기술의 문서내 중요도 값, 특정 기술의 문서 전체 내 중요도 값을 각각 구하고, 그 구해진 값들을 이용하여 특정 기술의 인지도 값을 구한다.The technology
즉, 기술 인지도 계산부(120)는 수학식 1을 이용하여 각 기술에 대한 인지도()를 문서별로 구한다. That is, the
여기서, 는 기술명이 추출된 소스 문서의 신뢰도 값, 는 문서내에서 기술명이 추출된 위치 정보 값,는 기술명의 문서 내 중요도 값,은 기술명의 문서 전체 내 중요도 값을 의미한다. I, J, K, L은 , , , 각각의 비중을 의미하는 값으로, 그 값들은 미리 설정되어 있다. here, Is the confidence value of the source document from which the technical name was extracted, Is the location information value extracted from the technical name in the document, Is the importance value in the document of the technical name, Means the importance value in the entire document of the technical name. I, J, K, L , , , A value representing each specific gravity, the values of which are preset.
기술명이 추출된 소스 문서의 신뢰도()는 문서가 작성된 사이트 또는 데이터베이스의 신뢰도를 의미하고, 뉴욕 타임즈, CNN 등 다양한 사이트별 신뢰도를 가중치로 표현한 수치이다. 가 큰 값을 갖게 되는 경우 소스의 신뢰도는 높은 것이고, 반대로 낮은 값을 갖게 되는 경우 신뢰도가 낮은 것을 의미한다. Reliability of the source document from which the technical name was extracted ) Refers to the reliability of the site or database where the document is written, and is a numerical expression representing the reliability of various sites such as the New York Times and CNN. When the value is large, the reliability of the source is high. On the contrary, when the value is low, the reliability is low.
는 수학식 2를 이용하여 구해진다. Is obtained using equation (2).
여기서, 은 사람의 직관과 경험을 통해 수동적으로 계산된 가중치로, 미리 테이블 형태로 정의된다. 는 웹 검색 통계 정보를 기반으로 자동으로 얻어진 가중치로, 전처리를 통해 미리 또는 주기적으로 계산된 값일 수 있다. 는 의 에서의 비중, 는 의 에서의 비중을 의미한다.here, Is a weight manually calculated through human intuition and experience, and is defined in the form of a table in advance. Is a weight automatically obtained based on web search statistical information, and may be a value calculated in advance or periodically through preprocessing. The of Specific gravity, The of It means the specific gravity in.
이하, wIA 를 구하는 방법에 대해 살펴보기로 한다. Hereinafter, a method of obtaining w IA will be described.
각 리소스에 대한 가중치는 기본적으로 검색엔진의 검색 결과로 얻는다. 특정 리소스, 예를 들어 cnn.com에 대한 가중치(사람들의 선호도/인지도)는 웹 문서 내에서 cnn.com을 포함하는 문서 빈도수의 비율(wIAT)에 기반한다. 이 문서 빈도수는 기술명 또는 (기술명+관계명)을 질의어로 검색엔진을 통해 검색했을 때 나오는 검색 결과 문서 중 cnn사이트의 문서수(g), cnn사이트의 문서가 아닌 문서 중 cnn을 참조(링크)하는 문서수(h)를 합쳐서 계산한다. 이때 효율을 위해 상위 n개의 문서에서만 해당 문서 빈도수를 계산한다. The weight for each resource is basically obtained from the search engine's search results. The weight (people's preference / awareness) for a particular resource, for example cnn.com, is based on the ratio of document frequency (w IAT ) including cnn.com within the web document. The frequency of this document refers to the number of documents on the cnn site (g) in the search results document when the technical name or (technical name + relation name) is searched through the search engine as a query, and cnn in the non-documents of the cnn site (link) Calculate by adding the number of documents (h). For efficiency, the document frequency is calculated only for the top n documents.
즉, 각 질의(기술명 또는 기술명+관계명)에 대해 cnn.com을 포함하는 문서 빈도수의 비율(wIAT)은 수학식 3을 이용하여 구한다. That is, the ratio (w IAT ) of document frequency including cnn.com for each query (descriptive name or descriptive name + relation name) is calculated using Equation 3.
여기서, a,b는 g와 h의 비중을 고려한 계수로 이들의 값을 조절함으로써 g와 h의 상대적 중요도를 반영한다. wIAT는 각 질의어에 대해 한번씩 계산되므로, 전체 또는 일부 질의어 집합의 검색 결과로부터 추출한 후 이를 평균하여 얻는다. Here, a and b reflect the relative importance of g and h by adjusting their values by considering the specific gravity of g and h. Since w IAT is calculated once for each query, it is extracted from the search results of all or some query sets and averaged.
즉, 각 질의어 검색을 수행하면 각 리소스(cnn, abc, bbc 등)에 대한 wIAT가 얻어지고, 질의어를 바꿔 검색을 반복하면서 wIAT의 값을 수집하여 평균함으로써 모든 질의(기술명 또는 기술명+관계명)에 대한 리소스(cnn)의 wIAT의 평균값, 즉 선호도/인지도(wIA)를 얻게 된다.That is, performing each query search results in w IAT for each resource (cnn, abc, bbc, etc.), and repeats the search by changing the query terms to collect and average the values of w IAT while retrieving all queries (technical name or technical name + relation The average value of the w IAT of the resource cnn, i.e., the preference / perception (w IA ).
문서 내에서 기술명이 추출된 위치 정보 값()은 기술 통계정보 추출부에서 추출된 기술명의 위치에 따라 가중치를 부여한 값일 수 있다. 위치는 제목, 부제, 중간 제목, 문단 등으로 구분할 수 있고, 는 기술명이 추출된 위치별로 값이 미리 정의되어 있다. 예를 들면, 제목은 10, 부제는 8,중간제목은 5 등과 같이 위치별로 값이 정해져 있다. 기술 인지도 계산부는 기술명이 추출된 위치가 다를 때, 각 추출된 문서내의 위치별로 서로 다른 가중치를 부여하여 위치 정보 값()을 구한다. Geolocation value from which the technical name is extracted within the document ( ) May be a weighted value according to the position of the description name extracted by the description statistical information extractor. Locations can be divided into headings, subtitles, middle headings, paragraphs, and so on. The value is predefined for each location where the technical name is extracted. For example, the title is 10, the subtitle is 8, the middle title is 5, and so on. When the technology name extraction position is different, the technology recognition calculation unit assigns different weights to the positions in each extracted document, thereby providing location information values ( ).
기술명의 문서내 중요도()는 문서내의 빈도수 기반 중요도를 의미하는 것으로, 문서내에 포함된 전체 기술명 빈도수(TF) 중에 해당 기술명의 출현 빈도수(AF)를 통해 계산된다. Importance of document in technical name ( ) Refers to the frequency-based importance in the document, and is calculated from the frequency of appearance of the technology name (AF) among the entire technology name frequency (TF) included in the document.
즉, 기술인지도 계산부(120)는 수학식 4을 이용하여 기술명의 문서내 중요도를 구한다. That is, the technical
기술명의 문서 전체내 중요도()는 문서내의 역문헌 빈도수를 기반으로 한 중요도 값으로, 전체 문헌수(N)에서 특정 기술명이 포함된 문서수(d)의 역(Inverse) 비율 값을 통해 계산된다. Importance of the entire document in the technical name ( ) Is an importance value based on the inverse document frequency in the document, and is calculated through an inverse ratio value of the number of documents (d) including a specific technical name in the total number of documents (N).
즉, 기술 인지도 계산부(120)는 수학식 5를 이용하여 기술명의 문서 전체 내 중요도를 구한다. That is, the
많은 문서에서 출현하는 기술명은 wL이 작아지고, 일부 문서에서만 출현하는 wL이 커지는 경향이 있다.Technical names appearing in this document are much smaller w L, w L tends to emerge only some of the documents increases.
상기와 같이 기술 인지도 계산부(120)는 기술이 추출된 문서의 신뢰도, 문서내에서 기술이 추출된 위치정보, 기술의 문서내 중요도, 기술의 문서 전체 내 중요도를 이용하여 각 기술에 대한 인지도를 구한다. 이때, 기술 인지도 계산부(120)는 각 기술에 대한 인지도를 문서별로 구한다. 예를 들어, 특정 기술이 포함된 문서가 10개인 경우, 기술 인지도 계산부(120)는 특정 기술에 대한 인지도를 10개 구하게 된다. As described above, the technology
인지도 변화 예측부(130)는 각 기술에 대해, 문서별로 구해진 기술 인지도 값을 수집하고, 그 수집된 기술 인지도값을 연도별로 평균을 구한 후, 그 연도별 평균값을 기반으로 각 기술의 인지도 변화 속도 및 변화 방향을 예측한다. 이때, 기술 통계정보 추출부에서 추출된 통계 정보에는 연도가 포함되어 있으므로, 인지도 변화 예측부(130)는 문서의 연도를 확인하고, 그 연도를 기초로 기술 인지도값을 연도별로 분리할 수 있다. The recognition
즉, 인지도 변화 예측부(130)는 특정 기술에 대해 개별 문서별로 구해진 인지도 값을 연도별로 수집하고, 그 수집된 인지도 값들의 연도별 평균을 구한다. 그런 후, 인지도 변화 예측부(130)는 연도별 평균값을 기반으로 예측 연도의 인지도 값을 예측하고, 그 예측된 인지도 값을 이용하여 인지도의 변화 속도를 구한다. 이때, 인지도 변화 예측부(130)는 회귀분석 방법, 이동평균분석 방법, 또는 이 두 방법을 혼합한 방법(ARMA) 등을 이용하여 예측 연도의 인지도 값을 예측할 수 있다. 여기서, 예측 연도는 인지도 값을 예측하고자 하는 연도(year)를 의미한다. 또한, 인지도의 변화 속도는 전년도 인지도 평균값 대비 예측 연도 인지도 예측값의 기울기를 이용하여 구할 수 있다. 여기서, 전년도는 예측 연도의 이전 연도를 의미하고, 예측 연도의 인지도 값은 연도별 평균값을 기반으로 예측한 인지도 값을 의미한다. That is, the recognition
예를 들어, 특정 기술에 대해 2001년부터 2011년까지 개별 문서별로 구해진 인지도 값을 연도별로 각각 수집하고, 2001년, 2002년, ..., 2011년 각 연도별로 인지도 값의 평균을 구한다. 그런 후, 회귀분석 방법, 이동평균분석 방법, 이 두 방법을 혼합한 방법(ARMA) 등을 이용하여 2012년의 인지도 값을 예측하고, 2011년의 인지도 평균값 대비 2012년의 인지도 예측값에 대한 기울기를 구한다. 그 구해진 기술기가 특정 기술에 대한 인지도 변화속도 일 수 있다. 예를 들어, 2011년의 인지도 평균값이 4, 2012년의 인지도 예측값이 6인 경우, 기울기는 (6-4)/1=2가 되므로, 기술 인지도 변화 속도는 '2'일 수 있다.For example, for each technology, the recognition values obtained for individual documents from 2001 to 2011 are collected for each year, and the average of the recognition values for each year in 2001, 2002, ..., 2011 is obtained. Then, using the regression analysis method, moving average analysis method, and a combination of the two methods (ARMA), the 2012 awareness value is predicted, and the slope of the 2012 awareness estimate is compared to the 2011 awareness average value. Obtain The obtained technology may be the rate of change of awareness of a specific technology. For example, when the recognition average value in 2011 is 4 and the prediction predicted value in 2012 is 6, the slope becomes (6-4) / 1 = 2, and thus the speed of technology awareness change may be '2'.
상기와 같이 특정 기술에 대한 인지도 변화 속도가 계산되면, 인지도 변화 예측부(130)는 그 계산된 변화 속도가 속하는 단계를 판단하여 변화 방향을 결정한다. 이때, 인지도 변화 속도에 따른 단계 및 변화방향은 미리 설정되어 있고, 인지도 변화 예측부는 변화속도가 해당하는 단계를 판단하여 변화 방향을 결정할 수 있다.When the awareness change rate for a particular technology is calculated as described above, the awareness
예를 들어, 0~1 범위에 해당하는 변화속도는 1단계, 1~3 범위에 해당하는 변화속도는 2단계, 3이상에 해당하는 변화속도는 3단계로 변화속도에 따른 단계를 나누고, 1단계는 완만상승, 2단계는 상승, 3단계는 급상승으로 변화 방향을 설정할 수 있다. 기술 인지도 변화 속도가 '2'이면, 2단계에 해당하므로, 상승으로 변화방향을 결정할 수 있다. For example, the rate of change corresponding to the range of 0 ~ 1 is 1 step, the rate of change corresponding to the range of 1 ~ 3 is 2 steps, the rate of change corresponding to 3 or more is divided into 3 steps, and 1 Steps can be set to change direction as slow rising, step 2 rising, and step 3 rising sharply. If the rate of change in technology awareness is '2', since it corresponds to step 2, the direction of change may be determined by rising.
또한, 0~-1 범위에 해당하는 변화속도는 1단계, -1~-3 범위에 해당하는 변화속도는 2단계, -3이하에 해당하는 변화속도는 3단계로 변화속도에 따른 단계를 나누고, 1단계는 완만하강, 2단계는 하강, 3단계는 급하강으로 변화 방향을 설정할 수 있다.
In addition, the change rate corresponding to the range of 0 ~ -1 is 1 step, the change rate corresponding to the range of -1 ~ -3 is 2 steps, and the change rate corresponding to -3 or less is divided into 3 steps. , The first stage is gentle descent, the second stage is falling, and the third stage is descent.
도 2는 본 발명에 따른 기술 인지도 변화 예측 장치가 기술 인지도의 변화를 예측하는 방법을 나타낸 흐름도이다. 2 is a flowchart illustrating a method of predicting a change in technology awareness by the apparatus for predicting change in technology awareness according to the present invention.
도 2를 참조하면, 기술 인지도 변화 예측 장치는 문서를 분석하여 기술명을 추출하고(S202), 추출된 기술명에 대한 통계 정보를 추출한다(S204). 즉, 기술 인지도 변화 예측 장치는 다중 문헌 제공 장치에 저장된 문서들을 분석하여 기술용어 사전에 정의된 기술명을 포함하는 문서들을 획득하고, 그 문서들로부터 기술명을 추출한다. 그런 다음 기술 인지도 변화 예측 장치는 각 기술명이 추출된 위치, 연도 등을 함께 추출하여, 문서내에서 추출된 기술명, 문서내 기술명의 빈도수, 문서내에 포함된 전체 기술명 빈도수, 기술명이 추출된 문서내의 위치 및 위치별 빈도수, 문서 종류별 빈도수, 문서내 개별 기술의 통계, 기술명이 추출된 문서의 연도 등을 포함하는 통계 정보를 생성하게 된다. Referring to FIG. 2, the technology recognition change prediction apparatus analyzes a document to extract a technical name (S202), and extracts statistical information about the extracted technical name (S204). That is, the technology recognition change prediction apparatus analyzes documents stored in the multi-document providing apparatus to obtain documents including the technical name defined in the technical term dictionary, and extracts the technical name from the documents. Then, the technology awareness change prediction apparatus extracts the location of each technology name, the year, etc., and extracts the technology name extracted from the document, the frequency of the technology name in the document, the frequency of the entire technology name contained in the document, and the location in the document from which the technology name is extracted. And statistical information including the frequency per location, the frequency per document type, the statistics of individual descriptions in the document, the year of the document from which the technical name is extracted, and the like.
단계 S204의 수행 후, 기술 인지도 변화 예측 장치는 통계 정보를 기반으로 기술의 인지도 값을 구한다(S206). 즉, 기술 인지도 변화 예측 장치는 각 기술의 통계정보를 기반으로 기술이 추출된 문서의 신뢰도 값, 문서내에서 기술이 추출된 위치정보값, 기술의 문서내 중요도 값, 기술의 문서 전체 내 중요도 값을 각각 구하고, 그 구해진 값들을 이용하여 각 기술에 대한 인지도 값을 개별 문서별로 구한다.After performing step S204, the technology awareness change prediction apparatus obtains a technology awareness value based on the statistical information (S206). That is, the technology awareness change prediction device is based on statistical information of each technology, the reliability value of the document from which the technology is extracted, the location information value from which the technology is extracted from the document, the importance value in the document of the technology, and the importance value in the entire document of the technology. We obtain each of them and use the obtained values to find the recognition value for each document by individual documents.
단계 S206의 수행 후, 기술 인지도 변화 예측 장치는 각 기술에 대해, 문서별로 구해진 기술 인지도 값들을 수집 및 평균값을 구하고(S208), 그 연도별 평균값을 기반으로 각 기술의 인지도 변화 속도 및 변화 방향을 예측한다(S210). 즉, 기술 인지도 변화 예측 장치는 특정 기술에 대해 개별 문서별로 구해진 인지도 값을 연도별로 수집하고, 그 수집된 인지도 값들의 연도별 평균을 구한다. 그런 후, 기술 인지도 변화 예측 장치는 연도별 평균값을 기반으로 예측 연도의 인지도 값을 예측하고, 그 예측된 인지도 값을 이용하여 인지도의 변화 속도를 구한다. 그런 후, 기술 인지도 변화 예측 장치는 그 구해진 변화 속도가 속하는 단계를 판단하여 변화 방향을 결정한다.
After performing step S206, the technology awareness change prediction device collects and averages technology recognition values obtained for each document for each technology (S208), and calculates the speed and direction of change in the recognition of each technology based on the average value for each year. Predict (S210). That is, the technology awareness change prediction device collects the recognition values obtained for each document for each specific technology for each year, and calculates the average of the collected recognition values for each year. Then, the technology awareness change prediction apparatus predicts the recognition value of the prediction year based on the average value for each year, and calculates the change rate of the awareness using the predicted recognition value. Then, the technology awareness change prediction device determines the change direction by determining the stage to which the obtained change rate belongs.
기술 인지도 변화 예측 방법은 프로그램으로 작성 가능하며, 프로그램을 구성하는 코드들 및 코드 세그먼트들은 당해 분야의 프로그래머에 의하여 용이하게 추론될 수 있다. The technology awareness change prediction method may be written by a program, and codes and code segments constituting the program may be easily inferred by a programmer in the art.
이와 같이, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
Thus, those skilled in the art will appreciate that the present invention may be embodied in other specific forms without departing from the spirit or essential characteristics thereof. It is therefore to be understood that the embodiments described above are to be considered in all respects only as illustrative and not restrictive. The scope of the present invention is defined by the appended claims rather than the detailed description and all changes or modifications derived from the meaning and scope of the claims and their equivalents are to be construed as being included within the scope of the present invention do.
100 : 기술 인지도 변화 예측 장치 110 : 기술 통계 정보 추출부
120 : 기술 인지도 계산부 130 : 인지도 변화 예측부100: technology recognition change prediction device 110: technology statistical information extraction unit
120: technology awareness calculation unit 130: awareness change prediction unit
Claims (20)
상기 통계 정보를 기반으로 특정 기술이 추출된 문서의 신뢰도 값, 문서내에서 특정 기술이 추출된 위치정보 값, 특정 기술의 문서내 중요도 값, 특정 기술의 문서 전체 내 중요도 값 중 적어도 하나를 구하고, 그 구해진 값들을 이용하여 상기 특정 기술의 인지도 값을 문서별로 각각 구하는 기술 인지도 계산부; 및
상기 문서별로 구해진 인지도 값들을 연도별로 수집 및 평균값을 구하고, 연도별 평균값을 기반으로 상기 특정 기술의 인지도 변화 속도를 예측하는 인지도 변화 예측부;를 포함하되,
상기 특정 기술의 문서내 중요도 값은 문서내에 포함된 전체 기술명 빈도수(TF) 중에 상기 특정 기술의 빈도수(AF)를 통해 구해지는 것을 특징으로 하는 기술 인지도 변화 예측 장치.
A descriptive statistics information extracting unit extracting statistical information on a specific technique by analyzing documents stored in the multi-document providing apparatus;
Obtaining at least one of a reliability value of a document from which a specific technology is extracted, a location information value from which a specific technology is extracted from a document, an importance value in a document of a specific technology, and an importance value in the entire document of a specific technology based on the statistical information; A technology recognition calculator for obtaining document recognition values of the specific technology for each document using the obtained values; And
Includes a recognition change prediction unit for obtaining the recognition value obtained by the document for each year and the average value, and predicting the rate of change of the specific technology based on the average value for each year;
And the importance value in the document of the specific technology is obtained through the frequency (AF) of the specific technology among all the technology name frequencies (TF) contained in the document .
상기 기술 통계정보 추출부는 상기 다중 문헌 제공 장치에 저장된 문서들을 분석하여 상기 특정 기술을 포함하는 문서들을 획득하고, 상기 획득된 문서들을 분석하여, 상기 특정 기술에 대한 문서내 빈도수, 문서 내에 포함된 전체 기술명 빈도수, 문서내 위치 및 위치별 빈도수, 문서 종류별 빈도수, 문헌의 연도 중 적어도 하나를 포함하는 통계정보를 추출하는 것을 특징으로 하는 기술 인지도 변화 예측 장치.
The method of claim 1,
The descriptive statistical information extracting unit analyzes the documents stored in the multi-document providing apparatus to obtain documents including the specific technology, and analyzes the obtained documents, the frequency in the document for the specific technology, the whole contained in the document. Technical recognition change prediction apparatus, characterized in that for extracting statistical information, including at least one of the technical name frequency, the location within the document and the frequency by location, frequency by document type, document year.
상기 기술 인지도 계산부는 문서의 신뢰도 값, 문서내에서 특정 기술이 추출된 위치정보 값, 특정 기술의 문서 내 중요도 값, 특정 기술의 문서 전체 내 중요도 값을 합하여 상기 특정 기술의 인지도 값을 구하는 것을 특징으로 하는 기술 인지도 변화 예측 장치.
The method of claim 1,
The technology recognition calculator calculates the recognition value of the specific technology by adding the reliability value of the document, the location information value of the specific technology extracted from the document, the importance value in the document of the specific technology, and the importance value in the entire document of the specific technology. A technology awareness change prediction device.
상기 문서의 신뢰도 값은 사용자에 의해 설정된 가중치 또는 웹 검색 통계 정보를 기반으로 구해진 가중치를 이용하여 구해진 값인 것을 특징으로 하는 기술 인지도 변화 예측 장치.
The method of claim 1,
And a reliability value of the document is a value obtained by using a weight obtained based on a weight set by a user or web search statistical information.
상기 특정 기술의 문서 전체내 중요도 값은 전체 문서수(N)에서 특정 기술이 포함된 문서수(d)의 역(Inverse) 비율 값으로 구해지는 것을 특징으로 하는 기술 인지도 변화 예측 장치.
The method of claim 1,
The importance value of the entire document of the specific technology is a technology awareness change prediction device, characterized in that it is obtained as an inverse ratio value of the number of documents (d) containing a specific technology in the total number of documents (N).
상기 인지도 변화 예측부는 상기 특정 기술에 대해 문서별로 구해진 인지도 값을 연도별로 수집하고, 그 수집된 인지도 값들의 연도별 평균을 구한 후, 상기 연도별 평균값을 기반으로 예측 연도의 인지도 값을 예측하고, 그 예측된 인지도 값을 이용하여 인지도의 변화 속도를 구하는 것을 특징으로 하는 기술 인지도 변화 예측 장치.
The method of claim 1,
The recognition change prediction unit collects the recognition values obtained for each specific document for each year, obtains the average of the collected recognition values by year, and predicts the recognition value of the predicted year based on the average value for each year, A technology awareness change prediction device, characterized in that the rate of change of recognition is calculated using the predicted recognition value.
상기 인지도 변화 예측부는 회귀분석 방법, 이동평균분석 방법, 상기 두 방법을 혼합한 방법(ARMA) 중 적어도 하나의 방법을 이용하여 예측 연도의 인지도 값을 예측하는 것을 특징으로 하는 기술 인지도 변화 예측 장치.
9. The method of claim 8,
The recognition change predicting unit predicts a recognition value of the predicted year using at least one of a regression analysis method, a moving average analysis method, and a method of mixing the two methods (ARMA).
상기 인지도 변화 예측부는 상기 예측된 변화 속도를 기 설정된 변화 방향 단계와 비교하고, 그 비교결과에 따라 인지도 변화 방향을 결정하는 것을 특징으로 하는 기술 인지도 변화 예측 장치.
The method of claim 1,
And the recognition change predicting unit compares the predicted change rate with a preset change direction step, and determines a change in recognition rate according to the comparison result.
(a) 다중 문헌 제공 장치에 저장된 문서들을 분석하여, 특정 기술에 대한 통계 정보를 추출하는 단계;
(b) 상기 통계 정보를 기반으로 특정 기술이 추출된 문서의 신뢰도 값, 문서내에서 특정 기술이 추출된 위치정보 값, 특정 기술의 문서내 중요도 값, 특정 기술의 문서 전체 내 중요도 값 중 적어도 하나를 구하고, 그 구해진 값들을 이용하여 상기 특정 기술의 인지도 값을 구하는 단계; 및
(c) 상기 문서별로 구해진 인지도 값들을 연도별로 수집 및 평균값을 구하고, 연도별 평균값을 기반으로 상기 특정 기술의 인지도 변화 속도를 예측하는 단계;를 포함하되,
상기 특정 기술의 문서내 중요도 값은 문서내에 포함된 전체 기술명 빈도수(TF) 중에 상기 특정 기술의 빈도수(AF)를 통해 구해지는 것을 특징으로 하는 기술 인지도 변화 예측 방법.
In the method of predicting the change in awareness of the technology recognition technology,
(a) analyzing the documents stored in the multi-document providing apparatus to extract statistical information on a specific technology;
(b) at least one of a reliability value of a document from which a specific technology is extracted based on the statistical information, a location information value from which a specific technology is extracted from a document, an importance value in a document of a specific technology, and an importance value in the entire document of a specific technology Obtaining a recognition value of the specific technology using the obtained values; And
(c) collecting and averaging the recognition values obtained for each document for each year, and predicting a recognition rate of change of the specific technology based on the yearly average value;
The importance value in the document of the specific technology is a technology recognition change prediction method, characterized in that is obtained through the frequency (AF) of the specific technology of the total technology name frequency (TF) contained in the document .
상기 (a) 단계는,
상기 다중 문헌 제공 장치에 저장된 문서들을 분석하여 상기 특정 기술을 포함하는 문서들을 획득하고, 상기 획득된 문서들을 분석하여, 상기 특정 기술에 대한 문서내 빈도수, 문서 내에 포함된 전체 기술명 빈도수, 문서내 위치 및 위치별 빈도수, 문서 종류별 빈도수, 문헌의 연도 중 적어도 하나를 포함하는 통계정보를 추출하는 것을 특징으로 하는 기술 인지도 변화 예측 방법.
The method of claim 11,
The step (a)
Analyze the documents stored in the multi-document providing apparatus to obtain documents containing the specific technology, and analyze the obtained documents, the frequency in the document for the specific technology, the frequency of the entire description name contained in the document, the location in the document And extracting statistical information including at least one of location frequency, document type frequency, and document year.
상기 특정 기술의 인지도 값은 상기 문서의 신뢰도 값, 문서내에서 특정 기술이 추출된 위치정보 값, 특정 기술의 문서 내 중요도 값, 특정 기술의 문서 전체 내 중요도 값을 합하여 구해진 값인 것을 특징으로 하는 기술 인지도 변화 예측 방법.
The method of claim 11,
The recognition value of the specific technology is a value obtained by adding the reliability value of the document, the location information value of the specific technology extracted from the document, the importance value in the document of the specific technology, and the importance value in the entire document of the specific technology. Awareness change prediction method.
상기 문서의 신뢰도 값은 사용자에 의해 설정된 가중치 또는 웹 검색 통계 정보를 기반으로 구해진 가중치를 이용하여 구해진 값인 것을 특징으로 하는 기술 인지도 변화 예측 방법.
The method of claim 11,
And a confidence value of the document is a value obtained by using a weight obtained based on a weight set by a user or web search statistical information.
상기 특정 기술의 문서 전체내 중요도 값은 전체 문서수(N)에서 특정 기술이 포함된 문서수(d)의 역(Inverse) 비율 값으로 구해지는 것을 특징으로 하는 기술 인지도 변화 예측 방법.
The method of claim 11,
The importance value of the entire document of the specific technology is a technology awareness change prediction method, characterized in that it is obtained as an inverse ratio value of the number of documents (d) including the specific technology in the total number of documents (N).
상기 (c) 단계는,
상기 특정 기술에 대해 문서별로 구해진 인지도 값을 연도별로 수집하고, 그 수집된 인지도 값들의 연도별 평균을 구하는 단계;
상기 연도별 평균값을 기반으로 예측 연도의 인지도 값을 예측하는 단계;
상기 예측된 인지도 값을 이용하여 인지도의 변화 속도를 구하는 단계를 포함하는 것을 특징으로 하는 기술 인지도 변화 예측 방법.
The method of claim 11,
The step (c)
Collecting recognition values obtained for each specific document by document for each year, and obtaining a yearly average of the collected recognition values;
Predicting a recognition value of a predicted year based on the average value for each year;
And obtaining a rate of change of the recognition rate using the predicted recognition value.
상기 예측된 인지도 변화 속도를 기 설정된 변화 방향 단계와 비교하고, 그 비교결과에 따라 인지도 변화 방향을 결정하는 단계를 더 포함하는 것을 특징으로 하는 기술 인지도 변화 예측 방법.
The method of claim 11,
And comparing the predicted recognition rate of change with a preset change direction step, and determining the recognition change direction according to the comparison result.
다중 문헌 제공 장치에 저장된 문서들을 분석하여, 특정 기술에 대한 통계 정보를 추출하는 단계;
상기 통계 정보를 기반으로 특정 기술이 추출된 문서의 신뢰도 값, 문서내에서 특정 기술이 추출된 위치정보 값, 특정 기술의 문서내 중요도 값, 특정 기술의 문서 전체 내 중요도 값 중 적어도 하나를 구하고, 그 구해진 값들을 이용하여 상기 특정 기술의 인지도 값을 구하는 단계; 및
(c) 상기 문서별로 구해진 인지도 값들을 연도별로 수집 및 평균값을 구하고, 연도별 평균값을 기반으로 상기 특정 기술의 인지도 변화 속도를 예측하는 단계;를 포함하되,
상기 특정 기술의 문서내 중요도 값은 문서내에 포함된 전체 기술명 빈도수(TF) 중에 상기 특정 기술의 빈도수(AF)를 통해 구해지는 것을 특징으로 하는 기술 인지도 변화 예측 방법이 프로그램으로 기록되고 컴퓨터에서 판독 가능한 기록매체. When executed by the technology awareness change prediction device,
Analyzing the documents stored in the multi-document providing apparatus, extracting statistical information on a specific technology;
Obtaining at least one of a reliability value of a document from which a specific technology is extracted, a location information value from which a specific technology is extracted from a document, an importance value in a document of a specific technology, and an importance value in the entire document of a specific technology based on the statistical information; Obtaining recognition values of the specific technique using the obtained values; And
(c) collecting and averaging the recognition values obtained for each document for each year, and predicting a recognition rate of change of the specific technology based on the yearly average value;
A technology recognition change prediction method is recorded by a program and read by a computer, characterized in that the importance value in the document of the specific technology is obtained through the frequency of the specific technology among the total technology name frequencies (TF) contained in the document. Possible recording media.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120077376A KR101247739B1 (en) | 2012-07-16 | 2012-07-16 | Apparatus and method for predicting technology recognition change |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120077376A KR101247739B1 (en) | 2012-07-16 | 2012-07-16 | Apparatus and method for predicting technology recognition change |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101247739B1 true KR101247739B1 (en) | 2013-03-26 |
Family
ID=48182603
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020120077376A KR101247739B1 (en) | 2012-07-16 | 2012-07-16 | Apparatus and method for predicting technology recognition change |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101247739B1 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101102468B1 (en) * | 2011-04-22 | 2012-01-05 | 한국과학기술정보연구원 | Apparatus and method for prediction development speed of technology |
-
2012
- 2012-07-16 KR KR1020120077376A patent/KR101247739B1/en active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101102468B1 (en) * | 2011-04-22 | 2012-01-05 | 한국과학기술정보연구원 | Apparatus and method for prediction development speed of technology |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10878004B2 (en) | Keyword extraction method, apparatus and server | |
CN106202561B (en) | Digitlization contingency management case base construction method and device based on text big data | |
KR100544514B1 (en) | Method and system for determining relation between search terms in the internet search system | |
JP4920023B2 (en) | Inter-object competition index calculation method and system | |
US20090204551A1 (en) | Learning-Based Method for Estimating Costs and Statistics of Complex Operators in Continuous Queries | |
US20150161517A1 (en) | Device and method for predicting popularity of social data | |
CN103853738A (en) | Identification method for webpage information related region | |
KR101544450B1 (en) | Method of generating a sentimental effect index through an analysis of a social data and system thereof | |
US20190340517A2 (en) | A method for detection and characterization of technical emergence and associated methods | |
KR20140081721A (en) | System and method for deducting imporant keyword using textmining, and a medium having computer readable program for executing the method | |
CN110825941A (en) | Content management system identification method, device and storage medium | |
Choi et al. | Using topic modeling and adversarial neural networks for fake news video detection | |
CN105512224A (en) | Search engine user satisfaction automatic assessment method based on cursor position sequence | |
Peng et al. | Trending sentiment-topic detection on twitter | |
KR20150019474A (en) | Professional field search supporting method and apparatus | |
CN117743564B (en) | Automatic extraction and recommendation method and system for technological policy information | |
Rahimi et al. | Service quality monitoring in confined spaces through mining Twitter data | |
KR101247739B1 (en) | Apparatus and method for predicting technology recognition change | |
CN116738979A (en) | Power grid data searching method and system based on core data identification and electronic equipment | |
KR20150077957A (en) | Method of determining a trend and a turning point of a stock price index using sentiment based indexes according to an analysis of social data and system thereof | |
CN113159363B (en) | Event trend prediction method based on historical news reports | |
Sabareesha et al. | Pattern Analysis of COVID-19 Based On Geotagged Social Media Data with Sociodemographic Factors | |
KR102180329B1 (en) | System for determining fake news | |
KR101511709B1 (en) | Method of predicting a composite stockrelated price index through an analysis of a social data and system applying the same | |
Nguyen et al. | Pagerank-based approach on ranking social events: a case study with flickr |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
A302 | Request for accelerated examination | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20160202 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20161228 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20180102 Year of fee payment: 6 |