KR20020046558A - System and method for realtime based automatic market relationship analysis using text type information - Google Patents
System and method for realtime based automatic market relationship analysis using text type information Download PDFInfo
- Publication number
- KR20020046558A KR20020046558A KR1020000076800A KR20000076800A KR20020046558A KR 20020046558 A KR20020046558 A KR 20020046558A KR 1020000076800 A KR1020000076800 A KR 1020000076800A KR 20000076800 A KR20000076800 A KR 20000076800A KR 20020046558 A KR20020046558 A KR 20020046558A
- Authority
- KR
- South Korea
- Prior art keywords
- document information
- word
- market
- script
- user terminal
- Prior art date
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 69
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000013515 script Methods 0.000 claims abstract description 41
- 238000004891 communication Methods 0.000 claims abstract description 22
- 230000010365 information processing Effects 0.000 claims abstract description 16
- 238000006243 chemical reaction Methods 0.000 claims abstract 4
- 230000000877 morphologic effect Effects 0.000 claims description 12
- 230000005540 biological transmission Effects 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 7
- 230000003068 static effect Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 14
- 238000013479 data entry Methods 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
Landscapes
- Machine Translation (AREA)
Abstract
Description
본 발명은 내부 및 외부의 자료입력시스템으로부터 수신받은 문서정보에 대해 상기 문서정보의 수신시점 또는 사용자 요청시점에서 실시간으로 문서정보에 대한 자연어처리(natural language process)를 실시하여 해당 문서정보의 내용에 가장 적합한 시장관계분석 정보(script)를 추출 또는 생성하고, 그 결과와 해당 문서정보의 원문을 동시에 제공하는 방법 및 장치에 관한 것으로서, 이를 통하여 사용자들은 수량적 정보가 아닌 정성적 정보에 대해서도 간단히 파급구조와 그에 따른 영향력의 정도를 사전평가할 수 있다는 장점이 있다.The present invention performs a natural language process on document information in real time at the time of receiving the document information or at the time of user request for the document information received from the internal and external data input system. The present invention relates to a method and apparatus for extracting or generating the most suitable script analysis information (script), and simultaneously providing the result and the original text of the document information, thereby allowing users to easily spread qualitative information, not quantitative information. The advantage is that the structure and the extent of its impact can be assessed in advance.
예를들어 현재 국내외적으로 다수의 정보서비스 업체들이 온라인으로 실시간 뉴스정보 서비스를 하고 있는데, 전송방법은 첫째 사용자가 서비스 홈페이지에 접속하여 직접 뉴스내용을 검색하도록 하는 방법, 둘째 사용자가 미리 설정해 놓은유형의 뉴스가 발생할 경우 사용자에게 전자우편이나 새로운 pop-up창을 통하여 실시간으로 전송하는 방법으로 분류된다. 또한 서비스 방법은 사용자가 특정뉴스의 헤드라인을 선택할 경우 선택한 내용의 본문과 동시에 관련된 과거의 뉴스기사를 일괄적으로 제공하는 것이 대부분이다. 그러나 이러한 서비스 방법에 따를 경우 뉴스의 양이 많아지고 보다 광범위한 범위의 뉴스가 전송될 경우 뉴스정보에 대한 사용자들의 집중력과 해석력이 낮게 된다. 이를 방지하기 위해 뉴스내용 작성단계에서 내용을 보다 자세히 정리하기도 하지만, 그 경우 문서의 용량(file size)이 증대됨에 따라 사용자들의 집중력을 저하시키게 된다는 단점이 있다.For example, a number of information service companies at home and abroad are currently providing real-time news information service online. In the transmission method, the first user accesses the service homepage and retrieves the news content directly. News is sent to the user via email or a new pop-up window. In addition, the service method is that when the user selects a headline of a particular news, most of the past provides a news article related to the body of the selected content at the same time. However, according to this service method, the amount of news increases, and when a wider range of news is transmitted, the concentration and interpretation power of users about news information is low. In order to prevent this, the contents of the news content may be organized in detail, but in this case, as the file size increases, the concentration of the users may be reduced.
이러한 문제점을 극복하기 위해 본 발명시스템에서는 문서정보의 전송방법은 기존의 체계를 유지하지만, 상기 문서정보에 대한 서비스 방법은 기존과 달리 본문내용 및 관련된 과거의 문서정보를 포함하여 해당 문서정보가 미칠 수 있는 관련시장내 파급구조 특성을 의미하는 시장관계분석 정보(script)가 추가된 것을 특징으로 하며, 이를 통하여 문서정보에 대한 사용자들의 실시간적 해석력과 집중력을 증대시키고자 한다.In order to overcome this problem, in the present invention, the document information transmission method maintains the existing system. However, the service method for the document information, unlike the existing method, includes the main document information and related document information. The market relation analysis information (script), which means the characteristics of the related ripple structure in the relevant market, is added, and through this, the user's real-time interpretation and concentration on the document information will be increased.
이에, 본 발명은 상기와 같은 종래의 문제점들을 해소하기 위해 안출된 것으로, 문서정보에 대해 수신받는 시점 또는 사용자 요청시점에서 실시간으로 형태소 분석 및 구문분석을 하고, 그에 따라 추출된 단어나 문장의 속성을 이용하여 해당뉴스 정보와 가장 잘 부합되는 시장관계분석 정보(script)를 제공한다. 이러한 정보 (script)의 추출방법에는 모든 유형의 문서정보 특성에 맞추어 서비스 제공자가 사전에 입력/저장해 놓은 정적 순서도(flow chart)를 추출하든지, 또는 상기 구문분석 모듈에 의해 추출된 중요단어를 이용한 동적 순서도(dynamic flow-chart)를 직접 생성하는 방법을 이용할 수 있다.Accordingly, the present invention has been made to solve the above-mentioned conventional problems, the morphological analysis and parsing in real time at the time of receiving the document information or at the time of the user request, the attribute of the word or sentence extracted accordingly Provide market relation analysis information (script) that best matches the news information. Such a method of extracting the script includes extracting a static flow chart previously input / stored by the service provider according to the characteristics of all types of document information, or dynamically using the important words extracted by the parsing module. A method of directly generating a dynamic flow chart can be used.
이를 위해서 본 발명시스템에서는 형태소분석 모듈과 구문분석 모듈을 이용하여 해당 문서정보의 헤드라인 또는 본문내용에 대한 핵심단어를 추출하고, 문서용어관리 모듈을 이용하여 추출된 단어에 대한 가중치를 부여한다. 이러한 단어별 가중치 부여을 위해 단어간의 거리 또는 단어의 발생빈도를 이용한다. 또한 시장구조분석 모듈을 통하여 상기 과정에서 선택된 가중치가 높은 단어와 최적으로 부합되는 시장관계분석 정보를 추출 및 생성한다. 이러한 절차는 문서정보를 수신받은 시점 또는 사용자가 본 서비스 초기화면에서 특정 문서정보의 헤드라인이나 일부 내용을 선택한 경우 실시간으로 수행되며, 그 결과는 본 서비스 화면에서 직접 확인하거나 또는 사용자 시스템에 직접 제공하는 pop-up 방식이 가능하다.To this end, the present invention uses the morpheme analysis module and the syntax analysis module to extract the key words for the headline or the text content of the document information, and to assign weights to the extracted words using the document term management module. In order to weight each word, the distance between words or the frequency of occurrence of words are used. In addition, the market structure analysis module extracts and generates market relationship analysis information that is optimally matched with the high weight words selected in the above process. This procedure is performed in real time when the document information is received or when the user selects a headline or a part of specific document information on the initial screen of the service, and the result is directly checked on the screen of the service or directly provided to the user's system. A pop-up approach is possible.
본 발명시스템을 통하여 사용자들은 관련시장에서 해당 문서정보가 어떤 영향을 미칠 것인지에 대한 분석을 실시간으로 할 수 있고, 그 결과 문서정보에 대한 실시간적 해석능력과 그에 따른 사전 대처능력을 증대시킬 수 있게 된다.Through the present invention system, users can analyze in real time how the document information will affect the relevant market in real time, and as a result, it is possible to increase the real-time interpretation ability of the document information and the corresponding proactive measures. .
도 1은 본 발명에 따른 지능형 문서정보처리 시스템이 별도의 장치로 추가되어 자료수신시점에서 지능형 실시간 시장관계분석을 할 수 있는 장치의 구성도,1 is a block diagram of a device capable of performing intelligent real-time market relationship analysis at the point of data reception by adding an intelligent document information processing system according to the present invention;
도 2는 본 발명에 따른 지능형 문서정보처리 시스템이 별도의 장치로 추가되어 사용자 요청시점에서 지능형 실시간 시장관계분석을 할 수 있는 장치의 구성도,2 is a block diagram of a device capable of performing intelligent real-time market relationship analysis at the time of user request by adding an intelligent document information processing system according to the present invention;
도 3은 상기 도 1과 도 2에서 제시된 지능형 문서정보처리 시스템에 대한 세부장치의 구성도,3 is a configuration diagram of a detailed apparatus for the intelligent document information processing system shown in FIGS. 1 and 2;
도 4는 사용자가 본 시스템에 접속하여 특정 문서정보를 선택할 경우, 그 결과를 수신받는 과정에 대한 순서도,4 is a flowchart illustrating a process of receiving a result when a user accesses the system and selects specific document information.
도 5는 상기 도 1의 장치구성도에 따라 문서정보가 수신되는 시점에서 실시간으로 지능형 시장관계분석을 수행하는 과정에 대한 순서도,FIG. 5 is a flowchart illustrating a process of performing an intelligent market relationship analysis in real time when document information is received according to the device configuration diagram of FIG. 1.
도 6은 상기 도 2의 장치구성도에 따라 사용자가 특정 단어나 문장을 선택 또는 입력하는 시점에서 실시간으로 지능형 시장관계분석을 수행하는 과정에 대한 순서도,FIG. 6 is a flowchart illustrating a process of performing intelligent market relationship analysis in real time when a user selects or inputs a specific word or sentence according to the device configuration of FIG.
도 7은 상기 도 1 또는 도 2의 장치구성도를 통하여 최종사용자에게 제공하게 되는 지능형 시장관계분석 정보(script)를 나타낸 화면구성도이다.7 is a screen configuration diagram showing the intelligent market relationship analysis information (script) provided to the end user through the device configuration diagram of FIG.
<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>
10 : 사용자 단말기 20 : 유무선 통신망10: user terminal 20: wired and wireless communication network
30 : 라우터 40 : 웹서버30: router 40: web server
50 : 데이터베이스 200 : 지능형 문서정보처리 시스템50: database 200: intelligent document information processing system
60 : 내부 및 외부의 자료입력시스템60: internal and external data entry system
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 설명한다.Hereinafter, exemplary embodiments of the present invention will be described with reference to the accompanying drawings.
도 1은 본 발명에 따른 지능형 문서정보처리 시스템(200)이 별도의 장치로추가되어 자료의 수신시점에서 실시간으로 지능형 시장관계분석을 할 수 있는 장치의 구성도로서, 사용자 단말기(10), 유무선 통신망(20), 라우터(30), 웹서버(40), 데이터베이스(50), 내부 및 외부의 자료입력시스템(60)을 포함하여, 문서정보의 수신시점에서 시장관계분석을 할 수 있는 지능형 문서정보처리 시스템(200)이 데이터베이스(50)와 내부 및 외부의 자료입력시스템(60) 사이에 추가된 것을 특징으로 구성되어 있다.1 is a block diagram of a device capable of performing intelligent market relationship analysis in real time at the time of receiving data by adding the intelligent document information processing system 200 according to the present invention. Intelligent document capable of market relation analysis at the point of receipt of document information, including communication network 20, router 30, web server 40, database 50, internal and external data entry system 60 Information processing system 200 is configured to be added between the database 50 and the internal and external data entry system 60.
상기 사용자 단말기(10)는 컴퓨터 단말기를 비롯하여 다른 시스템과 자료 송수신이 가능하도록 모뎀과 같은 통신 인터페이스 및 적절한 통신 소프트웨어를 포함하는 적어도 한대 이상의 통신 및 전산장비로 구성되고, 상기 유무선 통신망(20)은 인터넷 통신망을 비롯하여 국내외적으로 활용가능한 통신망으로 구성된다.The user terminal 10 is composed of at least one communication and computer equipment including a communication interface, such as a modem and appropriate communication software to enable data transmission and reception with other systems, such as a computer terminal, the wired and wireless communication network 20 is the Internet It is composed of communication networks that can be used at home and abroad as well as communication networks.
상기 라우터(30)는 통신 시스템간의 상이한 통신 프로토콜을 지원해주는 역할을 하고, 상기 웹서버(40)는 다양한 사용자와 내부 시스템과의 인터페이스 및 정보송수신을 지원하고, 상기 데이터베이스(50)는 내부 및 외부의 자료입력시스템 (60)이나 지능형 문서정보처리 시스템(200)으로부터 전송된 자료를 저장 및 관리하는 기능을 한다. 또한 상기 내부 및 외부의 자료입력시스템(60)은 자료입력 및 전송장치가 구비된 시스템으로서 본 발명의 지능형 문서정보처리 시스템(200) 및 데이터베이스(50)로 자료전송이 가능한 시스템이다. 그리고 상기 지능형 문서정보처리 시스템(200)은 수신받은 문서정보에 대한 형태소 분석과 구문분석을 실시하여 해당 문서정보를 대표할 수 있는 핵심단어 및 문장을 추출하고, 그 결과와 가장 잘 부합하는 시장관계분석 정보(script)를 추출 및 생성하는 역할을 한다.The router 30 serves to support different communication protocols between communication systems, the web server 40 supports interfaces and information transmission and reception between various users and internal systems, and the database 50 is internal and external. It stores and manages the data transmitted from the data input system 60 or intelligent document information processing system 200 of the. In addition, the internal and external data input system 60 is a system provided with a data input and transmission device is a system capable of transmitting data to the intelligent document information processing system 200 and the database 50 of the present invention. The intelligent document information processing system 200 performs morphological analysis and syntax analysis on the received document information, extracts key words and sentences that can represent the document information, and best matches the result. Extracts and generates analysis information (script).
상기와 같이 구성된 본 발명에 따른 문서정보를 이용한 지능형 실시간 시장관계분석 장치 및 그 방법에 대한 구체적인 실시예를 도 2부터 도 7까지를 활용하여 설명하면 다음과 같다.An embodiment of an intelligent real-time market relationship analysis apparatus and method using document information according to the present invention configured as described above will be described with reference to FIGS. 2 to 7.
도 2는 본 발명에 따른 지능형 문서정보처리 시스템(200)이 별도의 장치로 추가되어 사용자 요청시점에서 실시간으로 지능형 시장관계분석을 할 수 있는 장치의 구성도로서, 상기 도 1 과의 차이는 상기 도 1의 경우 문서정보를 수신받는 시점에서 해당 문서정보에 대한 자연어처리 과정을 수행하는 반면, 도 2는 자료의 수신시점이 아닌 사용자 요청시점에서 자연어처리 과정을 통한 문서정보를 분석하는 차이가 있다. 이 경우 내부 및 외부의 자료입력시스템(60)으로 부터 문서정보가 수신되는 시점에서는 해당 수신정보에 대한 아무런 조작을 가하지 않은 채 단순히 데이터베이스(50)에 저장하기만 한다.FIG. 2 is a block diagram of an apparatus for performing intelligent market relationship analysis in real time at the time of user request by adding the intelligent document information processing system 200 according to the present invention. The difference from FIG. In the case of FIG. 1, the natural language processing process for the document information is performed at the time of receiving the document information, while FIG. 2 has a difference in analyzing the document information through the natural language processing process at the user's request point, not at the point of receiving the data. . In this case, when the document information is received from the internal and external data input system 60, it is simply stored in the database 50 without any manipulation on the corresponding received information.
도 3은 상기 도 1과 도 2에서 제시된 지능형 문서정보처리 시스템(200)에 대한 세부장치의 구성도로서, 내부 및 외부의 자료입력시스템(60) 또는 웹서버(40)를 통하여 전달된 내용을 수신할 수 있는 자료수신모듈(210), 수신된 자료에 대한 형태소를 분석하여 의미있는 단어들을 분리/추출하고, 동시에 축약어에 대한 표준어를 발견하는 형태소분석 모듈(220), 상기 형태소분석 모듈에서 추출된 단어들의 발생빈도 및 단어간의 거리(distance)를 이용하여 각 단어에 대한 가중치를 부여하는 문서용어 관리모듈(230), 상기 가중치가 부여된 단어를 이용하여 2차의 중요단어 추출을 하는 구문분석 모듈(240), 상기 2차로 추출된 단어에 대한 가중치를 재계산하는 문서용어 관리모듈(230), 상기 문서용어 관리모듈(230)을 통하여 최종적으로가중치가 산정된 단어에 최적인 시장관계분석 정보(script)를 추출 및 생성하는 시장관계분석 모듈(250), 및 내부 또는 외부의 서비스 제공자가 직접 특정이슈에 대한 시장관계분석 정보(script)를 제작/입력할 수 있는 자료입력모듈(260)을 포함하여 상기 시장관계분석 모듈(250)의 결과인 시장관계분석 정보(script)를 웹서버(40) 및 데이터베이스(50)로 전송할 수 있는 자료송신모듈(270)이 추가된 것을 특징으로 한다.3 is a block diagram of a detailed apparatus for the intelligent document information processing system 200 shown in FIG. 1 and FIG. 2, and shows contents transmitted through an internal and external data input system 60 or a web server 40. Receivable data receiving module 210, the morpheme analysis module 220 to analyze the morphemes for the received data to separate / extract meaningful words, and at the same time find a standard word for the abbreviation, extracted from the morphological analysis module Document term management module 230 for assigning a weight to each word by using the occurrence frequency of the words and the distance (distance) between the words, syntax analysis to extract the second important word using the weighted words The module 240, the document term management module 230 for recalculating the weights of the second extracted words, and the document term management module 230 are optimal time values for the final weighted words. Market relationship analysis module 250 for extracting and generating relationship analysis information (script), and a data input module that allows the internal or external service provider to directly create / enter market relationship analysis information (script) for a specific issue ( And a data transmission module 270 for transmitting market relationship analysis information (script), which is a result of the market relationship analysis module 250, to the web server 40 and the database 50, including 260. do.
도 4는 사용자가 본 시스템에 접속하여 특정 문서정보를 선택할 경우, 그 결과를 수신받는 과정에 대한 순서도로서, 여기서 S는 단계(step)를 의미한다. 특히 이 순서도는 상기 도 1 처럼 문서정보의 수신시점에서 해당 문서정보에 대한 지능형 시장관계분석이 이루어진 경우에 해당되는 것으로서, 구체적인 실행순서로는 먼저 사용자가 본 서비스 내용 초기화면에 접속하는 단계(S10), 사용자가 특정 문장이나 단어를 선택 또는 입력하는 단계(S11), 상기 선택 및 입력내용을 이용하여 웹서버에서 데이터베이스의 입출력 프로세스를 호출하는 단계(S12), 및 데이터베이스에서 관련내용(본문, script)을 추출하는 단계(S13)를 포함하여 상기 추출내용을 사용자 단말기로 전송하는 단계가 추가된 것을 특징으로 한다.4 is a flowchart illustrating a process of receiving a result when a user accesses the system and selects specific document information, where S denotes a step. In particular, this flowchart corresponds to a case where an intelligent market relation analysis of the document information is performed at the time of receiving the document information as shown in FIG. 1, and the user first accesses the service contents initial screen in a specific execution order (S10). ), The user selecting or inputting a specific sentence or word (S11), calling the input / output process of the database in the web server using the selection and input (S12), and the related content (text, script in the database). ) And transmitting the extracted contents to the user terminal, including the step of extracting (S13).
도 5는 상기 도 1의 장치구성도에 의해 문서정보가 수신되는 시점에서 실시간으로 지능형 시장관계분석을 수행하는 과정에 대한 순서도로서, 먼저 내부 및 외부의 자료입력시스템(60)으로부터 문서정보를 수신받는 단계(S21), 형태소분석 모듈(220)을 통하여 수신자료에 대한 형태소(단어)를 추출하는 단계(S22), 상기 추출된 단어에 대해 문서용어 관리모듈(230)에서 1차 가중치를 부여하는 단계(S23), 구문분석 모듈(240)에 의해 단어를 재추출하는 단계(S24), 상기 재추출된 단어에 대한 2차 가중치를 부여하는 단계(S25), 상기 가중단어에 대해 의미별로 index를 부여하는 단계(S26) 및, 상기 단어와 관련된 script를 비교한 뒤 최적의 script를 추출 및 생성하는 단계(S27)를 포함하여 상기의 단어, script, 관련내용을 데이터베이스(50)에 저장하는 단계(S28)가 추가된 것을 특징으로 한다.FIG. 5 is a flowchart illustrating a process of performing intelligent market relationship analysis in real time when document information is received by the device configuration diagram of FIG. 1. First, document information is received from an internal and external data input system 60. Receiving step (S21), the step of extracting the morpheme (word) for the received data through the morphological analysis module 220 (S22), to give the first weight in the document term management module 230 for the extracted words Step S23, re-extracting the word by the parsing module 240 (S24), giving a second weight to the re-extracted word (S25), and index for each weighted word by meaning Storing the words, scripts, and related contents in the database 50, including the step (S26) and comparing the scripts related to the words and extracting and generating an optimal script (S27). That S28) is added It shall be.
구체적인 실시예를 위해 {손보업계 M&A 급속하게 진행되고 있다.} 라는 문장을 살펴보자. 상기 문장이 본 발명시스템의 자료수신 모듈(210)을 통하여 수신될 경우 형태소분석 모듈(220)에 의하여 {손보업계, M&A, 급속, 진행}과 같은 형태소(단어)를 발견한다. 이러한 형태소 발견을 위해 형태소분석 모듈(220)의 경우 문장에 대한 전처리 과정, 기능어사전 참조, 중심어사전 참조, 사용자 용어사전 참조를 한다.For a specific embodiment, consider the sentence {the insurance industry M & A is rapidly progressing}. When the sentence is received through the data reception module 210 of the present invention, the morpheme analysis module 220 finds morphemes (words) such as {insurance industry, M & A, rapidity, progress}. In order to detect such morphemes, the morpheme analysis module 220 refers to a preprocessing process for a sentence, a functional word dictionary reference, a central word dictionary reference, and a user term dictionary reference.
우선 먼저 단어간의 공백(space), 특수기호(영문자 제외) 등을 체크하는 전처리 과정을 실시하면, 상기 문장은 {손보업계, M&A, 급속하게, 진행되고, 있다}처럼 분리된다. 초기 문장과의 차이점은 마침표(period)가 생략된 것을 알 수 있다.First of all, if a preprocessing process is performed to check a space between words and special symbols (except an English letter), the sentences are separated as in the insurance industry, M & A, and rapidly. The difference from the initial sentence is that the period is omitted.
다음으로 형태소분석 모듈은 내장된 기능어 사전을 이용하여 단어에 부착된 조사, 체언화 접미사, 용언화 접미사, 부사화 접미사, 보조용언, 선어미, 어미 등을 분리하며, 각 기능어에 대한 문법상의 index를 부여한다. 즉, {손보업계, M&A, 급속, 하게(부사화 접미사), 진행, 되고(조사), 있다}Next, using the built-in functional dictionary, the morphological analysis module separates surveys, telephony suffixes, verbal suffixes, adverbative suffixes, auxiliary words, new endings, and endings attached to words. To give. That is, {insurance industry, M & A, rapid, abbreviated (adverbized suffix), progressed, (investigated),}
다음으로 형태소분석 모듈은 내장되어 있는 중심어 사전을 이용하여 상기 분리내용에 대해 명사, 대명사, 수사, 형용사, 동사, 존재사, 부사, 관형사, 감탄사등과 같은 중심어를 발견하고, 그 결과에 대해 문법상의 index를 부여한다. 즉, {손보업계, M&A, 급속(명사), 하게(부사화 접미사), 진행(명사), 되고(조사), 있다(동사)}Next, the morpheme module finds the core words such as nouns, pronouns, adjectives, adjectives, verbs, adverbs, adverbs, adjectives, and interjections using the built-in dictionary of core words, and grammars about the results. Index of the award. That is, {insurance industry, M & A, rapid (noun), hagi (adverbized suffix), progress (noun), and (verb)}
다음으로 형태소분석 모듈은 내장되어 있는 사용자 용어사전을 이용하여 상기 분리된 단어들에 대한 외래어, 표준어 등을 분리 및 정리하고, 그 결과에 대해 문법상의 index를 부여한다. 즉, {손보업계(손해보험업계 ; 명사), M&A(인수합병 ; 명사), 급속(명사), 하게(부사화 접미사), 진행(명사), 되고(조사), 있다(동사)} 상기의 결과를 이용하여 최종적으로 형태소분석 모듈에서는 상기 문장에 대한 형태소(중요단어)를 추출하는데, 그 결과 상기문장은 {손보업계, M&A, 급속, 진행}처럼 정리된다.Next, the morphological analysis module separates and organizes foreign words, standard words, and the like for the separated words using a built-in user glossary, and assigns grammatical indexes to the results. That is, {insurance industry (anti-life insurance industry; nouns), M & A (mergers and acquisitions; nouns), rapid (nouns), hagi (adverbized suffixes), progressive (nouns), (investigative), and (verb)} Using the results, the morphological analysis module finally extracts the morphemes (important words) for the sentence. As a result, the sentence is arranged as {insurance industry, M & A, rapidity, progression}.
이후 추출된 형태소(단어)에 대해 형태소 사전과 문서용어관리 모듈(230)을 이용하여 단어에 대한 1차 가중치를 부여한다(S23). 즉, 과거에 구축해 놓은 데이터베이스를 이용하여 각 형태소들의 출현빈도를 분석하여 형태소들에 대한 가중치를 부여하게 되는데, 가령 기존의 데이터베이스를 조사한 결과 '손보업계'는 500회, 'M&A'는 700회, '급속'은 200회, '진행'은 300회 등장했다고 할 경우, 가중치는 단순히 0.5, 0.7, 0.2, 0.3 처럼 부여할 수 있다. 결국 상기 형태소를 가중치 순서대로 정리할 경우 {M&A, 손보업계, 진행, 급속}처럼 된다. 그리고 상기의 형태소 유형은 {명사 + 명사 + 동사 + 명사}의 형태인데, 이러한 유형과 일치하는 기존에 작성된 구문유형이 존재하는지를 구문분석 모듈(240)에 내장된 구문유형 사전을 이용하여 조사한다. 만약 그러한 유형이 발견될 경우 그 유형에 부합되도록 상기형태소를 재추출한다(S24). 그 결과 상기 가중치 배열내용은 {손보업계, M&A, 진행, 급속}처럼 재배열 된다.Afterwards, the first weight of the word is assigned to the extracted morpheme (word) using the morpheme dictionary and the document term management module 230 (S23). In other words, by using the database built in the past to analyze the frequency of appearance of each morpheme to give weight to the morphemes, for example, as a result of examining the database, 'insurance industry' 500 times, 'M & A' 700 times, If the 'speed' is 200 times, and the 'progress' is 300 times, the weight can be simply given as 0.5, 0.7, 0.2, 0.3. Eventually, when the morphemes are arranged in the order of weight, it becomes like {M & A, insurance industry, progress, rapid}. In addition, the morpheme type is {noun + noun + verb + noun}, and whether there is a previously written syntax type matching the type is examined using a syntax type dictionary built in the parsing module 240. If such a type is found, the stem is reextracted to match the type (S24). As a result, the weight arrangement is rearranged as {insurance industry, M & A, progress, rapid}.
그 이후 각 형태소(단어)에 대한 2차 가중치를 부여(S25)하는데, 상기 단계에서 부합되는 구문유형이 있을 경우 가중치를 부여하지만, 그렇지 않은 경우 가중치는 모두 0의 값을 부여한다. 그리고 상기 구문유형 사전을 통하여 추출된 구문유형과 상기 형태소(단어) 유형을 비교하여 각 단어에 대한 의미별 index를 부여(S26)하는데, 이 과정을 통하여 상기의 형태소에서는 {손보업계, M&A, 진행}이라는 최종 형태소가 추출된다. 그 이후 시장관계분석 모듈(250)을 이용하여 상기 형태소와 관련된 시장관계분석 정보(script)를 추출(S27)한 뒤, 상기의 단어, script, 관련내용을 데이터베이스에 저장(S28)하게 된다. 만약 상기 구문분석 단계(S24)에서 관련된 구문유형이 없을 경우 이전단계(S23)에서 부여된 가중치에 근거하여 즉,가중치가 높은 형태소를 중심으로 관련된 script를 발견하게 된다.After that, the second weights are assigned to each morpheme (word) (S25). If there is a matching syntax type in the step, weights are assigned, but otherwise, the weights are all assigned a value of zero. And by comparing the syntax type extracted from the syntax type dictionary and the morpheme (word) type to give an index for each word meaning (S26), through this process in the morpheme {M & A, M & A, progress } Is the final morpheme. After that, the market relation analysis information (script) related to the morpheme is extracted using the market relation analysis module 250 (S27), and the words, scripts, and related contents are stored in a database (S28). If there is no related syntax type in the parsing step (S24), based on the weights given in the previous step (S23), that is, the script is found based on the morpheme having a high weight.
도 6은 상기 도 2의 장치구성도에 의해 사용자가 특정 단어나 문장을 선택 또는 입력하는 시점에서 지능형 시장관계분석을 수행하는 과정에 대한 순서도로서, 먼저 사용자가 본 서비스 초기화면에 접속하는 단계(S31), 사용자가 특정 문장이나 단어를 선택 또는 입력하는 단계(S32), 형태소분석 모듈(220)을 통하여 수신자료에 대한 형태소(단어)를 추출하는 단계(S33), 상기 추출된 단어에 대해 문서용어 관리모듈(230)에서 1차 가중치를 부여하는 단계(S34) , 구문분석모듈(240)에 의해 단어를 재추출하는 단계(S35), 상기 추출된 단어에 대한 2차 가중치를 부여하는 단계(S36), 상기 가중단어에 대해 의미별로 index를 부여하는 단계(S37) 및, 상기단어와 관련된 script를 비교한 뒤 최적의 script를 추출 및 생성하는 단계(S38)를 포함하여 상기의 단어, script, 관련내용을 사용자단말기(10)로 전송하는 단계(S39)가 추가된 것을 특징으로 한다.FIG. 6 is a flowchart illustrating a process of performing an intelligent market relationship analysis when a user selects or inputs a specific word or sentence according to the device configuration diagram of FIG. 2. First, the user accesses the service initial screen ( S31), the user selecting or inputting a specific sentence or word (S32), extracting the morpheme (word) for the received data through the morphological analysis module 220 (S33), the document for the extracted word Giving a first weight in the term management module 230 (S34), re-extracting words by the syntax analysis module 240 (S35), and giving a second weight for the extracted words ( S36), the step of assigning an index for each of the weighted words by meaning (S37), and comparing the script associated with the word and extracting and generating the optimal script (S38), including the words, script, Use related content Characterized in that the step (S39) of transmitting to the terminal 10 is added.
도 7은 상기 도 1 또는 도 2의 장치구성도를 통하여 최종사용자에게 제공하게 되는 지능형 시장관계분석 정보(script)가 포함된 전체화면 구성도이다. 이 전체화면 구성도는 다시 여러개의 세부화면으로 분류되는데, 이것은 특정기준에 따라 분류 및 정리된 업종분류화면(1000), 각 업종별로 해당되는 실시간 뉴스를 그룹핑하여 보여주는 뉴스그룹 화면(1100), 상기 분류된 업종별 지수의 변화를 실시간 그래프 형태로 보여주는 그래프 화면(1200), 및 개별뉴스의 본문내용을 보여주는 뉴스본문화면(1300)을 포함하여 각 뉴스에 대한 시장관계분석 정보(script)를 보여주는 script 화면(1400)이 추가된 것을 특징으로 한다. 현재 일반적으로 시행되고 있는 서비스 방법과 본 발명시스템의 서비스 방법을 도 7을 이용하여 비교하면, 현재까지는 뉴스그룹 화면(1100)과 뉴스본문화면(1300)만 서비스 하고 있지만, 본 발명시스템에서는 이와 달리 상기한 바와 같이 업종분류화면(1000), 그래프 화면(1200)을 포함하여 script 화면(1400)이 추가되는 것이 특징이다.FIG. 7 is a full screen diagram including intelligent market relationship analysis information (script) provided to an end user through the apparatus diagram of FIG. 1 or FIG. This full screen diagram is again divided into a number of detailed screens, which are classified and sorted according to a specific criteria industry classification screen (1000), a news group screen (1100) showing the real-time news grouped for each industry by group, A script screen showing market relation analysis information (script) for each news, including a graph screen 1200 showing changes in the indexes classified by industry, in real time graph form, and a news content culture page 1300 showing the main content of individual news. 1400 has been added. Comparing the service method that is currently generally implemented and the service method of the present invention system using FIG. 7, only the newsgroup screen 1100 and the news book culture page 1300 are serviced so far. As described above, a script screen 1400 is added, including an industry classification screen 1000 and a graph screen 1200.
여기서 상기 업종분류 방법으로는 첫째, 증권사에서 분류해 놓은 업종분류체계를 활용하는 방법, 둘째, 개별회사들이 감독기관에 제출한 결산자료에 근거하여 각 회사별 사업내용과 주요 생산품목에 따라 업종을 분류하는 방법이 가능하다. 또한 실시간으로 발생하는 문서정보를 상기 분류된 업종유형에 적합시키는 방법으로는 첫째, 문서정보의 송신시점에서 각 문서정보에 분류기호를 첨부하여 문서정보수신시점에서는 상기 분류기호에 따라 자동으로 해당되는 업종에 결부시키는 방법, 둘째, 수신된 문서정보에 대한 자연어처리 과정을 통하여 수신된 문서정보가 내포하고 있는 중요단어를 추출하고, 이 단어를 기준으로 사전에 각 업종별로 정의된 업종단어와 비교하여 해당되는 업종과 결부시키는 방법도 가능하다.The sector classification method is as follows. First, the sector classification system classified by the securities company is used. Second, based on the settlement data submitted by the individual companies to the supervisory authority, the sectors are classified according to the business content of each company and the main production items. It is possible to classify. In addition, as a method for fitting document information generated in real time to the classified business type, first, a classification code is attached to each document information at the time of document information transmission, and at the time of document information reception, the corresponding information is automatically applied. Second, extract the important words contained in the received document information through the natural language processing process for the received document information, and compares with the industry word defined in each industry in advance based on this word It is also possible to combine them with the industry.
이상에서 설명한 바와 같이 본 발명에 따르면, 개인들은 유무선 통신망을 통하여 실시간으로 전송되는 문서정보에 대해 실시간으로 시장관계분석 정보(script)를 제공받을 수 있으므로, 수신받은 문서정보에 대한 구체적인 해석능력이 가능하다. 또한 본 발명시스템은 실시간 서비스를 지원하므로 실시간 의사결정이 필요한 일반인들에게 의사결정지원 수단의 일환으로서 중요한 기능을 할 수 있다. 나아가 본 발명시스템을 통하여 제공되는 시장관계분석 정보(script)를 통하여 사용자들은 해당 문서정보 또는 문서정보가관련된 시장에 미치는 영향력의 범위를 사전에 파악할 수 있고, 또한 이를 통하여 문제에 대한 사전대처기능까지 가능하게 되는 효과가 있다.As described above, according to the present invention, since individuals can be provided with market relation analysis information (script) in real time with respect to document information transmitted in real time through a wired or wireless communication network, specific interpretation ability of the received document information is possible. Do. In addition, since the present invention supports a real-time service, it can play an important function as a part of decision support means for the general public who needs real-time decision making. Furthermore, through market relation analysis information (script) provided through the present invention system, users can grasp the scope of influence of the document information or the document information related to the market in advance, and also through this function, the preliminary response to the problem. There is an effect that becomes possible.
Claims (6)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020000076800A KR20020046558A (en) | 2000-12-15 | 2000-12-15 | System and method for realtime based automatic market relationship analysis using text type information |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020000076800A KR20020046558A (en) | 2000-12-15 | 2000-12-15 | System and method for realtime based automatic market relationship analysis using text type information |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20020046558A true KR20020046558A (en) | 2002-06-21 |
Family
ID=27682085
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020000076800A KR20020046558A (en) | 2000-12-15 | 2000-12-15 | System and method for realtime based automatic market relationship analysis using text type information |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20020046558A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100896702B1 (en) * | 2007-08-16 | 2009-05-14 | 한국과학기술원 | Apparatus for providing Aspect-based Documents Clustering that raises Reliability and Method therefor |
KR102053595B1 (en) | 2018-08-13 | 2019-12-10 | 한국과학기술정보연구원 | How to identify promising items based on m&a activity generation between topics |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR940022311A (en) * | 1993-03-15 | 1994-10-20 | 김영택 | Machine Translation Device and Method |
KR970066941A (en) * | 1996-03-20 | 1997-10-13 | 양승택 | Multilingual translation system using token separator |
JPH103465A (en) * | 1996-06-17 | 1998-01-06 | Syst Gijutsu Kenkyusho:Kk | Stock price prediction device |
KR20000030264A (en) * | 2000-02-17 | 2000-06-05 | 황철운 | Method and recording medium having a program recorded therein for servicing a real-time stock information and system therefor |
KR20000039408A (en) * | 1998-12-12 | 2000-07-05 | 이계철 | Method for analyzing words in korean morphemic analyzing system |
KR20010092601A (en) * | 2000-03-22 | 2001-10-26 | 오연석 | Stock Information Offering Method Through Internet |
KR20010109903A (en) * | 2000-06-03 | 2001-12-12 | 맹완호 | The method for Stockbroking System Implementation on Cyberspace |
-
2000
- 2000-12-15 KR KR1020000076800A patent/KR20020046558A/en not_active Application Discontinuation
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR940022311A (en) * | 1993-03-15 | 1994-10-20 | 김영택 | Machine Translation Device and Method |
KR970066941A (en) * | 1996-03-20 | 1997-10-13 | 양승택 | Multilingual translation system using token separator |
JPH103465A (en) * | 1996-06-17 | 1998-01-06 | Syst Gijutsu Kenkyusho:Kk | Stock price prediction device |
KR20000039408A (en) * | 1998-12-12 | 2000-07-05 | 이계철 | Method for analyzing words in korean morphemic analyzing system |
KR20000030264A (en) * | 2000-02-17 | 2000-06-05 | 황철운 | Method and recording medium having a program recorded therein for servicing a real-time stock information and system therefor |
KR20010092601A (en) * | 2000-03-22 | 2001-10-26 | 오연석 | Stock Information Offering Method Through Internet |
KR20010109903A (en) * | 2000-06-03 | 2001-12-12 | 맹완호 | The method for Stockbroking System Implementation on Cyberspace |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100896702B1 (en) * | 2007-08-16 | 2009-05-14 | 한국과학기술원 | Apparatus for providing Aspect-based Documents Clustering that raises Reliability and Method therefor |
KR102053595B1 (en) | 2018-08-13 | 2019-12-10 | 한국과학기술정보연구원 | How to identify promising items based on m&a activity generation between topics |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7403938B2 (en) | Natural language query processing | |
US7742922B2 (en) | Speech interface for search engines | |
KR101858206B1 (en) | Method for providing conversational administration service of chatbot based on artificial intelligence | |
CN1104696C (en) | System and method for automatically adding informational hypertext links to received documents | |
US7991608B2 (en) | Multilingual data querying | |
US6745161B1 (en) | System and method for incorporating concept-based retrieval within boolean search engines | |
KR100597330B1 (en) | Apparatus and data network browser for providing context sensitive web communications | |
US9282162B2 (en) | Processing user profiles of users in an electronic community | |
US7181683B2 (en) | Method of summarizing markup-type documents automatically | |
US6327589B1 (en) | Method for searching a file having a format unsupported by a search engine | |
US20020002452A1 (en) | Network-based text composition, translation, and document searching | |
US20060206481A1 (en) | Question answering system, data search method, and computer program | |
Lutzky et al. | “I apologise for my poor blogging”: Searching for apologies in the Birmingham Blog Corpus | |
WO2008054331A1 (en) | System and method for processing language independent natural language statements | |
JP2020135135A (en) | Dialog content creation assisting method and system | |
US20240095767A1 (en) | System and method for domain name valuation | |
Rodríguez-Puente et al. | New methods for analysing diachronic suffix competition across registers: How-ity gained ground on-ness in Early Modern English | |
KR20200136636A (en) | Morphology-Based AI Chatbot and Method How to determine the degree of sentence | |
KR20010066754A (en) | system for using domain names in the user's preferred language on the internet | |
JP3467160B2 (en) | Multilingual communication system, server device, and document transmission method for server device | |
CN1309370A (en) | Method and system for file or database search over network or Internet | |
KR20020046558A (en) | System and method for realtime based automatic market relationship analysis using text type information | |
KR100519748B1 (en) | Method and apparatus for internet navigation through continuous voice command | |
JPH0962684A (en) | Information retrieval method and information retrieval device, and information guiding method and information guiding device | |
JP2000330979A (en) | Method for analyzing electronic document to be retrieved and electronic document registration system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |