WO2023277522A1 - 키워드 사전을 이용하여 투자 키워드를 관리하는 서버 및 방법 - Google Patents
키워드 사전을 이용하여 투자 키워드를 관리하는 서버 및 방법 Download PDFInfo
- Publication number
- WO2023277522A1 WO2023277522A1 PCT/KR2022/009227 KR2022009227W WO2023277522A1 WO 2023277522 A1 WO2023277522 A1 WO 2023277522A1 KR 2022009227 W KR2022009227 W KR 2022009227W WO 2023277522 A1 WO2023277522 A1 WO 2023277522A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- keyword
- content
- investment
- registered
- dictionary
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 14
- 238000000605 extraction Methods 0.000 claims abstract description 46
- 238000010276 construction Methods 0.000 claims abstract description 8
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims 1
- 229910052698 phosphorus Inorganic materials 0.000 claims 1
- 239000011574 phosphorus Substances 0.000 claims 1
- 239000000284 extract Substances 0.000 abstract description 11
- 238000010586 diagram Methods 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 244000240602 cacao Species 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Definitions
- the present invention relates to a server and method for managing investment keywords using a keyword dictionary.
- the keyword extraction method for existing unstructured data analyzes morphemes of unstructured content and extracts content keywords according to the number of mentions (or weight) of a specific word based on the morpheme analysis result.
- the accuracy is lowered from the morpheme analysis step.
- words that are far from the context of unstructured content are selected as content keywords, so the accuracy is significantly lowered.
- Patent Document 1 Korean Patent Publication No. 2015-0083620 (published on July 20, 2015)
- the present invention is intended to solve the above-mentioned problems of the prior art, and manages investment keywords for investment contents according to the purpose of analysis of investment contents by using a keyword dictionary corresponding to a predetermined investment target field.
- a server for managing investment keywords using a keyword dictionary includes a keyword dictionary construction unit for constructing a keyword dictionary corresponding to a preset investment target field; a keyword extraction unit extracting at least one registered keyword related to investment content related to investment from among a plurality of registered keywords registered in the keyword dictionary; a content keyword selector selecting a content keyword for the investment content based on the number of extractions included in the metadata for the at least one registered keyword; a content information table generating unit generating an investment content information table based on the investment content and the content keyword; and a management unit that manages the investment content information table and the keyword dictionary in conjunction with each other.
- a method for managing investment keywords using a keyword dictionary performed by a keyword extraction server comprises the steps of constructing a keyword dictionary corresponding to a preset investment target field; extracting at least one registered keyword related to investment content related to investment from among a plurality of registered keywords registered in the keyword dictionary; Selecting a content keyword for the investment content based on the number of times of extraction included in the metadata for the at least one registered keyword; generating an investment content information table based on the investment content and the content keyword; and managing the investment content information table and the keyword dictionary in conjunction with each other.
- the present invention can manage investment keywords for investment contents according to the purpose of analysis of investment contents using a keyword dictionary corresponding to a predetermined investment target field.
- the present invention can greatly improve keyword accuracy of unstructured investment content, and can extract keywords suitable for the analysis purpose of investment content using a keyword dictionary.
- the keywords extracted in this way can play a role as source data for standardization techniques such as sentiment analysis as well as extraction of comprehensive keywords for complex investment contents.
- 1 is a diagram for explaining a keyword extraction method of existing unstructured data.
- FIG. 2 is a block diagram of a keyword extraction server, according to an embodiment of the present invention.
- 3A is a diagram for explaining a keyword extraction method using a keyword dictionary according to an embodiment of the present invention.
- 3B is a diagram for explaining a keyword extraction method using a keyword dictionary according to an embodiment of the present invention.
- FIG. 4 is a diagram for explaining a method of managing a keyword dictionary and an investment content information table in conjunction with each other according to an embodiment of the present invention.
- 5A is a diagram for explaining a method of utilizing a keyword for each investment content according to an embodiment of the present invention.
- 5B is a diagram for explaining a method of utilizing a keyword for each investment content according to an embodiment of the present invention.
- 5C is a diagram for explaining a method of utilizing keywords for each investment content according to an embodiment of the present invention.
- 5D is a diagram for explaining a method of utilizing a keyword for each investment content according to an embodiment of the present invention.
- FIG. 6 is a flowchart illustrating a method of managing investment keywords using a keyword dictionary according to an embodiment of the present invention.
- a "unit” includes a unit realized by hardware, a unit realized by software, and a unit realized using both. Further, one unit may be realized using two or more hardware, and two or more units may be realized by one hardware.
- some of the operations or functions described as being performed by a terminal or device may be performed instead by a server connected to the terminal or device.
- some of the operations or functions described as being performed by the server may also be performed in a terminal or device connected to the corresponding server.
- FIG. 2 is a block diagram of a keyword extraction server 20, according to one embodiment of the present invention.
- the keyword extraction server 20 includes a keyword dictionary construction unit 200, a keyword extraction unit 210, a content keyword selection unit 220, a content information table generation unit 230, a management unit 240, and A keyword service provider 250 may be included.
- the keyword extraction server 20 shown in FIG. 2 is only one implementation example of the present invention, and various modifications are possible based on the components shown in FIG. 2 .
- the keyword dictionary building unit 200 may build a keyword dictionary corresponding to a preset investment target field.
- the predetermined investment target field may include, for example, a value investment target and an event investment target.
- the keyword dictionary builder 200 may build a keyword dictionary corresponding to each of the plurality of investment target fields.
- the keyword dictionary construction unit 200 may build a first keyword dictionary corresponding to a 'value investment target' and a second keyword dictionary corresponding to an 'event investment target'.
- the keyword dictionary construction unit 200 may receive, in real time, an up-to-date keyword related to a preset investment target field from an expert terminal in the preset investment target field.
- the keyword dictionary builder 200 may build a keyword dictionary based on a keyword that passes a preset keyword adoption criterion among a plurality of keywords input from an expert terminal in a preset investment target field.
- registered keywords keywords registered in the keyword dictionary by passing predetermined keyword selection criteria are referred to as registered keywords.
- the keyword dictionary builder 200 may store registered keywords that pass set keyword acceptance criteria, identification codes mapped to the registered keywords, and metadata about the registered keywords in the keyword dictionary.
- the metadata for the registered keyword may include a registration date when the registered keyword is registered in the keyword dictionary and the number of times the registered keyword is extracted from the keyword dictionary.
- the management unit 240 may update the keyword dictionary at each predetermined maintenance period based on a condition for maintaining up-to-dateness of registered keywords.
- the management unit 240 may update the registration date of the corresponding registered keyword in the keyword dictionary when the keyword passing the preset keyword adoption criterion is a registered keyword already stored in the keyword dictionary.
- the keyword dictionary construction unit 200 when the keyword passing the preset keyword acceptance criteria is a new keyword that does not exist in the keyword dictionary, additionally registers the keyword as a newly registered keyword in the keyword dictionary, but the newly registered keyword and the newly registered keyword An identification code mapped to and metadata about newly registered keywords may be additionally stored in the keyword dictionary.
- the keyword extractor 210 may extract at least one registered keyword related to investment content related to investment from among a plurality of registered keywords registered in the keyword dictionary. For example, the keyword extractor 210 may extract a plurality of registered keywords overlapping the keyword dictionary and investment content as content keywords.
- the investment content may include, for example, investment reports, news articles, disclosure data, item analysis data, and item-related postings as data related to investment.
- the content keyword selector 220 may select a content keyword for investment content based on the number of extractions included in the metadata for at least one extracted registration keyword.
- the keyword extraction unit 210 includes a first registered keyword related to the first investment content 303 from the keyword dictionary 301 corresponding to the first investment target field, a second registered keyword, and A third registered keyword may be extracted.
- the management unit 240 may update the number of times of extraction included in meta data for each of the extracted first registered keyword, second registered keyword, and third registered keyword in the keyword dictionary.
- the keyword extraction unit 210 may filter the number of extractions included in metadata for each of the first registered keyword, the second registered keyword, and the third registered keyword from the keyword dictionary corresponding to the first investment target field.
- the keyword extraction unit 210 sorts the number of extractions of each of the first registered keyword, the second registered keyword, and the third registered keyword in descending order, and then selects a preset number of times among the first registered keyword, the second registered keyword, and the third registered keyword.
- a first registration keyword and a second registration keyword belonging to a range may be selected as content keywords for the first investment content.
- the content information table generation unit 230 may generate an investment content information table for investment content based on investment content and content keywords.
- the investment content information table 30 for investment content includes identifiers for investment content 305, metadata for content keywords 307, content types of investment content 309, Source information 311 of investment content and an identification code 313 mapped to content keywords may be included.
- the identification code mapped to the content keyword is the same as the identification code mapped to the registered keyword (keyword registered in the keyword dictionary) corresponding to the content keyword.
- the metadata for the content keyword includes metadata for the registered keyword corresponding to the content keyword (ie, including the registration date when the registered keyword is registered in the keyword dictionary and the number of extractions of the registered keyword from the keyword dictionary);
- the registration keyword corresponding to the keyword may further include extraction date information extracted from the keyword dictionary, and may further include a recency weight for the content keyword.
- the management unit 240 may manage the investment content information table and the keyword dictionary in conjunction with each other.
- the management unit 240 may change a content keyword corresponding to the corresponding registration keyword among content keywords included in the investment contents information table to the changed registration keyword. For example, referring to FIG. 4 , the first registered keyword 403 (eg, '#virtual virtual business') registered in the keyword dictionary 401 is changed to a new registered keyword (eg, '#metaverse'). In this case, the management unit 240 may extract an investment content information table including a content keyword corresponding to the first registration keyword 403 from the investment content information table 405 for each investment content.
- the first registered keyword 403 eg, '#virtual virtual business'
- a new registered keyword eg, '#metaverse'
- the management unit 240 includes investment content including a content keyword corresponding to a registration keyword of '# virtual virtual business' among the investment contents having each of the plurality of investment content information tables 405 (e.g., '# virtual virtual business').
- Investment content, news content, schedule content, etc.) including the content keyword of 'business' can all be extracted.
- the management unit 240 extracts the identification code 407 of the first registration keyword and the identification code 409 of the corresponding content keyword among a plurality of content keywords included in the investment content information table for each extracted investment content, and extracts the extracted content.
- Existing content keywords '#virtual virtual business'
- the management unit 240 may collectively change metadata 411 for existing content keywords to which the identification codes 409 of the extracted content keywords are mapped into metadata 413 for newly registered keywords.
- the management unit 240 determines the input 'M&A' registration keyword and Identification codes mapped to 'Corona 19' registered keywords can be extracted from the keyword dictionary.
- the management unit 240 performs meta data for each of the 'M&A' registered keyword and the 'Corona 19' registered keyword (eg, Registration date (update date), number of extractions, content type, source information, etc.) can be updated in the keyword dictionary.
- meta data eg, Registration date (update date), number of extractions, content type, source information, etc.
- the management unit 240 is an investment content in which an identification code of a content keyword corresponding to an identification code of an 'M&A' registered keyword and an identification code of a 'Corona 19' registered keyword are present in the investment contents information table corresponding to each of a plurality of investment contents. You can search the investment content information table of
- the management unit 240 responds to the 'M&A' registration keyword in the investment contents information table of the searched investment contents. It is possible to additionally input metadata including identification codes of content keywords corresponding to identification codes of content keywords and 'M&A' registration keywords.
- the management unit 240 may update metadata including a registration date (renewal date) of a content keyword corresponding to the 'Corona 19' registration keyword, a content type, etc. in the investment contents information table of the searched investment contents.
- the keyword service providing unit 250 may provide a keyword service through content keywords related to investment content by using an investment content information table for each investment content.
- the keyword service provider 250 extracts and extracts a plurality of content keywords related to the stock content of 'Samsung Electronics' from the investment content information table for the stock content of 'Samsung Electronics'.
- a keyword tag map 50 including a plurality of contents may be provided to the investor terminal. At this time, the keyword tag map 50 may display a plurality of content keywords arranged in an order of high weight for content keywords.
- the management unit 240 may update a recency weight for the content keyword selected by the investor.
- the management unit 240 assigns a freshness weight to the input keyword. can be updated.
- the keyword service provider 250 in the case of investment content 54 linked with SNS content service (eg, Telegram, Facebook, Kakao Story, Instagram, etc.), Investment content 54 is received from the investment terminal through a set special symbol (eg, '@' or '#', etc.), and the management unit 240 is based on a plurality of content keywords related to the input investment content 54 It can be updated by linking the investment contents information table and keyword dictionary.
- SNS content service eg, Telegram, Facebook, Kakao Story, Instagram, etc.
- Investment content 54 is received from the investment terminal through a set special symbol (eg, '@' or '#', etc.), and the management unit 240 is based on a plurality of content keywords related to the input investment content 54 It can be updated by linking the investment contents information table and keyword dictionary.
- the keyword service provider 250 searches for news content in relation to a search keyword (56, eg, 'corona') input from an investor terminal and provides the searched news content to the investor terminal. can do.
- the keyword service providing unit 250 may provide a plurality of content keywords 60 for 'stock' investment contents 58 related to the search keyword 56 input from the investor terminal to the investor terminal.
- the management unit 240 updates a recency weight to a plurality of content keywords related to the investment content.
- the keyword dictionary construction unit 200 keyword extraction unit 210, content keyword selection unit 220, content information table generation unit 230, management unit 240, and keyword service providing unit 250, respectively It will be fully understood that these may be implemented separately, or one or more of them may be implemented in an integrated manner.
- FIG. 6 is a flowchart illustrating a method of managing investment keywords using a keyword dictionary according to an embodiment of the present invention.
- the keyword extraction server 20 may build a keyword dictionary corresponding to a preset investment target field.
- the keyword extraction server 20 may extract at least one registered keyword related to investment content related to investment from among a plurality of registered keywords registered in the keyword dictionary.
- the keyword extraction server 20 may select a content keyword for the investment content based on the number of extractions included in the metadata for the at least one registered keyword.
- the keyword extraction server 20 may generate an investment content information table based on investment content and content keywords.
- the keyword extraction server 20 may manage the investment content information table and the keyword dictionary in conjunction with each other.
- steps S601 to S609 may be further divided into additional steps or combined into fewer steps, depending on the implementation of the present invention. Also, some steps may be omitted if necessary, and the order of steps may be changed.
- An embodiment of the present invention may be implemented in the form of a recording medium including instructions executable by a computer, such as program modules executed by a computer.
- Computer readable media can be any available media that can be accessed by a computer and includes both volatile and nonvolatile media, removable and non-removable media. Also, computer readable media may include all computer storage media. Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data.
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Human Resources & Organizations (AREA)
- Game Theory and Decision Science (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
키워드 사전을 이용하여 투자 키워드를 관리하는 서버는 기설정된 투자 목표 분야에 대응하는 키워드 사전을 구축하는 키워드 사전 구축부, 키워드 사전에 등록된 복수의 등록 키워드 중 투자에 관한 투자 컨텐츠와 관련된 적어도 하나의 등록 키워드를 추출하는 키워드 추출부, 추출된 적어도 하나의 등록 키워드에 대한 메타데이터에 포함된 추출 횟수에 기초하여 투자 컨텐츠에 대한 컨텐츠 키워드를 선정하는 컨텐츠 키워드 선정부, 투자 컨텐츠 및 컨텐츠 키워드에 기초하여 투자 컨텐츠 정보 테이블을 생성하는 컨텐츠 정보 테이블 생성부 및 투자 컨텐츠 정보 테이블 및 키워드 사전을 연동하여 관리하는 관리부를 포함할 수 있다.
Description
본 발명은 키워드 사전을 이용하여 투자 키워드를 관리하는 서버 및 방법에 관한 것이다.
최근 비정형 데이터의 생산량이 기하급수적으로 증가함에 따라 주요정보를 추출하고자 하는 요구가 높아지고 있다.
기존 비정형 데이터에 대한 키워드 추출방식은 도 1을 참조하면, 비정형 컨텐츠에 대하여 형태소를 분석하고, 형태소 분석 결과에 기초하여 특정 단어의 언급횟수(또는 비중)에 따라 컨텐츠 키워드를 추출한다.
이 때, 형태소 분석은 오픈소스에 기반한 변형된 형태의 기술들을 통해 수행된다. 대부분의 오픈소스는 영문권의 알고리즘에 기반하고 있으며, 한글의 경우 용언구조 등 구조적 특수성으로 인해 키워드 추출에 있어 정확도가 떨어진다.
구체적으로, 한글의 구조적 특수성으로 인해 형태소 분석단계에서부터 정확도가 떨어지며, 이로 인해 컨텐츠 키워드 추출 시 비정형 컨텐츠의 문맥과는 동떨어진 단어를 컨텐츠 키워드로 선정하기 때문에 그 정확도가 현저히 떨어진다.
특히, 금융투자분야에 있어서 용어의 전문성과 특수성으로 인해 일반문장에 기반을 둔 오픈소스 사용 시 컨텐츠 키워드의 정확도가 더욱 저하되는 현상이 나타난다.
한편, 동일 컨텐츠라 하더라도 컨텐츠의 수요목적에 따라 주요 키워드가 바뀌어야 하는 이슈가 발생한다. 예를 들어, 예술품 경매에 대한 컨텐츠를 분석하는 경우, 예술가에게는 대상의 예술성, 역사성 등 예술적 가치의 키워드가 중요한 반면, 투자자의 입장에서는 수익률, 미래가치 등에 대한 키워드가 중요하게 되어 분석목적에 맞는 키워드 분석 기술이 필요하다.
(특허문헌 1) 한국공개특허공보 제2015-0083620호 (2015.07.20. 공개)
본 발명은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 기설정된 투자 목표 분야에 대응하는 키워드 사전을 이용하여 투자 컨텐츠의 분석 목적에 맞게 투자 컨텐츠에 대한 투자 키워드를 관리하고자 한다.
다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 제 1 측면에 따른 키워드 사전을 이용하여 투자 키워드를 관리하는 서버는 기설정된 투자 목표 분야에 대응하는 키워드 사전을 구축하는 키워드 사전 구축부; 상기 키워드 사전에 등록된 복수의 등록 키워드 중 투자에 관한 투자 컨텐츠와 관련된 적어도 하나의 등록 키워드를 추출하는 키워드 추출부; 상기 추출된 적어도 하나의 등록 키워드에 대한 메타데이터에 포함된 추출 횟수에 기초하여 상기 투자 컨텐츠에 대한 컨텐츠 키워드를 선정하는 컨텐츠 키워드 선정부; 상기 투자 컨텐츠 및 상기 컨텐츠 키워드에 기초하여 투자 컨텐츠 정보 테이블을 생성하는 컨텐츠 정보 테이블 생성부; 및 상기 투자 컨텐츠 정보 테이블 및 상기 키워드 사전을 연동하여 관리하는 관리부를 포함할 수 있다.
본 발명의 제 2 측면에 따른 키워드 추출 서버에 의해 수행되는 키워드 사전을 이용하여 투자 키워드를 관리하는 방법은 기설정된 투자 목표 분야에 대응하는 키워드 사전을 구축하는 단계; 상기 키워드 사전에 등록된 복수의 등록 키워드 중 투자에 관한 투자 컨텐츠와 관련된 적어도 하나의 등록 키워드를 추출하는 단계; 상기 추출된 적어도 하나의 등록 키워드에 대한 메타데이터에 포함된 추출 횟수에 기초하여 상기 투자 컨텐츠에 대한 컨텐츠 키워드를 선정하는 단계; 상기 투자 컨텐츠 및 상기 컨텐츠 키워드에 기초하여 투자 컨텐츠 정보 테이블을 생성하는 단계; 및 상기 투자 컨텐츠 정보 테이블 및 상기 키워드 사전을 연동하여 관리하는 단계를 포함할 수 있다.
상술한 과제 해결 수단은 단지 예시적인 것으로서, 본 발명을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 기재된 추가적인 실시예가 존재할 수 있다.
전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 본 발명은 기설정된 투자 목표 분야에 대응하는 키워드 사전을 이용하여 투자 컨텐츠의 분석 목적에 맞게 투자 컨텐츠에 대한 투자 키워드를 관리할 수 있다.
이를 통해, 본 발명은 비정형의 투자 콘텐츠의 키워드 정확도를 대폭 개선할 수 있고, 키워드 사전을 이용하여 투자 컨텐츠의 분석목적에 맞는 키워드를 추출할 수 있다. 또한, 이렇게 추출된 키워드는 복합 투자 컨텐츠에 대한 종합 키워드의 추출을 비롯하여 감성분석 등의 정형화 기술에 근원데이터로서의 역할을 수행할 수 있다.
도 1은 기존 비정형 데이터의 키워드 추출 방식을 설명하기 위한 도면이다.
도 2는 본 발명의 일 실시예에 따른, 키워드 추출 서버의 블록도이다.
도 3a는 본 발명의 일 실시예에 따른, 키워드 사전을 이용한 키워드 추출 방법을 설명하기 위한 도면이다.
도 3b는 본 발명의 일 실시예에 따른, 키워드 사전을 이용한 키워드 추출 방법을 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따른, 키워드 사전 및 투자 컨텐츠 정보 테이블을 연동하여 관리하는 방법을 설명하기 위한 도면이다.
도 5a는 본 발명의 일 실시예에 따른, 투자 컨텐츠별 키워드를 활용하는 방법을 설명하기 위한 도면이다.
도 5b는 본 발명의 일 실시예에 따른, 투자 컨텐츠별 키워드를 활용하는 방법을 설명하기 위한 도면이다.
도 5c는 본 발명의 일 실시예에 따른, 투자 컨텐츠별 키워드를 활용하는 방법을 설명하기 위한 도면이다.
도 5d는 본 발명의 일 실시예에 따른, 투자 컨텐츠별 키워드를 활용하는 방법을 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따른, 키워드 사전을 이용하여 투자 키워드를 관리하는 방법을 나타낸 흐름도이다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다.
본 명세서에 있어서 단말 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말 또는 디바이스에서 수행될 수도 있다.
이하, 첨부된 구성도 또는 처리 흐름도를 참고하여, 본 발명의 실시를 위한 구체적인 내용을 설명하도록 한다.
도 2는 본 발명의 일 실시예에 따른, 키워드 추출 서버(20)의 블록도이다.
도 2를 참조하면, 키워드 추출 서버(20)는 키워드 사전 구축부(200), 키워드 추출부(210), 컨텐츠 키워드 선정부(220), 컨텐츠 정보 테이블 생성부(230), 관리부(240) 및 키워드 서비스 제공부(250)를 포함할 수 있다. 다만, 도 2에 도시된 키워드 추출 서버(20)는 본 발명의 하나의 구현 예에 불과하며, 도 2에 도시된 구성요소들을 기초로 하여 여러 가지 변형이 가능하다.
키워드 사전 구축부(200)는 기설정된 투자 목표 분야에 대응하는 키워드 사전을 구축할 수 있다. 여기서, 기설정된 투자 목표 분야는 예를 들어, 가치투자 목표, 이벤트투자 목표 등을 포함할 수 있다.
키워드 사전 구축부(200)는 기설정된 투자 목표 분야가 복수 개 존재하는 경우, 복수의 투자 목표 분야 각각에 대응하는 키워드 사전을 구축할 수 있다.
예를 들어, 키워드 사전 구축부(200)는 '가치투자 목표'에 대응하는 제 1 키워드 사전을 구축하고, '이벤트투자 목표'에 대응하는 제 2 키워드 사전을 구축할 수 있다.
키워드 사전 구축부(200)는 기설정된 투자 목표 분야의 전문가 단말로부터 기설정된 투자 목표 분야와 관련된 최신 키워드를 실시간으로 입력받을 수 있다.
키워드 사전 구축부(200)는 기설정된 투자 목표 분야의 전문가 단말로부터 입력된 복수의 키워드 중 기설정된 키워드 채택 기준을 통과한 키워드에 기초하여 키워드 사전을 구축할 수 있다.
이하에서는 기설정된 키워드 채택 기준을 통과하여 키워드 사전에 등록된 키워드를 등록 키워드라 명명한다.
키워드 사전 구축부(200)는 설정된 키워드 채택 기준을 통과한 등록 키워드, 등록 키워드에 매핑된 식별 코드 및 등록 키워드에 대한 메타데이터를 키워드 사전에 저장할 수 있다. 여기서, 등록 키워드에 대한 메타데이터는 등록 키워드가 키워드 사전에 등록된 등록일 및 키워드 사전으로부터 등록 키워드가 추출된 추출 횟수를 포함할 수 있다.
관리부(240)는 등록 키워드의 최신성 유지 조건에 기초하여 기설정된 보수 주기마다 키워드 사전을 업데이트할 수 있다.
관리부(240)는 기설정된 키워드 채택 기준을 통과하는 키워드가 키워드 사전에 이미 저장된 등록 키워드인 경우, 키워드 사전에서 해당 등록 키워드의 등록일을 업데이트할 수 있다.
키워드 사전 구축부(200)는 기설정된 키워드 채택 기준을 통과하는 키워드가 키워드 사전에 존재하지 않은 신규 키워드인 경우, 해당 키워드를 신규 등록 키워드로서 키워드 사전에 추가 등록하되, 신규 등록 키워드, 신규 등록 키워드에 매핑된 식별 코드 및 신규 등록 키워드에 대한 메타데이터를 키워드 사전에 추가 저장할 수 있다.
키워드 추출부(210)는 키워드 사전에 등록된 복수의 등록 키워드 중 투자에 관한 투자 컨텐츠와 관련된 적어도 하나의 등록 키워드를 추출할 수 있다. 예를 들어, 키워드 추출부(210)는 키워드 사전과 투자 컨텐츠에 중복된 복수의 등록 키워드를 컨텐츠 키워드로 추출할 수 있다.
여기서, 투자 컨텐츠는 예를 들어, 투자에 관한 자료로서 투자 보고서, 뉴스 기사, 공시 자료, 종목 분석 자료 및 종목 관련 게시물 등을 포함할 수 있다.
예를 들어, 컨텐츠 키워드 선정부(220)는 추출된 적어도 하나의 등록 키워드에 대한 메타데이터에 포함된 추출 횟수에 기초하여 투자 컨텐츠에 대한 컨텐츠 키워드를 선정할 수 있다.
예를 들어, 도 3a를 참조하면, 키워드 추출부(210)는 제 1 투자 목표 분야에 대응하는 키워드 사전(301)으로부터 제 1 투자 컨텐츠(303)와 관련된 제 1 등록 키워드, 제 2 등록 키워드 및 제 3 등록 키워드를 추출할 수 있다.
관리부(240)는 추출된 제 1 등록 키워드, 제 2 등록 키워드 및 제 3 등록 키워드 각각에 대한 메타 데이터에 포함된 추출 횟수를 키워드 사전에서 업데이트할 수 있다.
이어서, 키워드 추출부(210)는 제 1 투자 목표 분야에 대응하는 키워드 사전으로부터 제 1 등록 키워드, 제 2 등록 키워드 및 제 3 등록 키워드 각각에 대한 메타데이터에 포함된 추출 횟수를 필터링할 수 있다.
키워드 추출부(210)는 제 1 등록 키워드, 제 2 등록 키워드 및 제 3 등록 키워드 각각의 추출 횟수를 내림차순으로 정렬한 후, 제 1 등록 키워드, 제 2 등록 키워드 및 제 3 등록 키워드 중 기설정된 횟수 범위(예컨대, 5회 이상의 추출 횟수를 포함하는 범위)에 속하는 제 1 등록 키워드 및 제 2 등록 키워드를 제 1 투자 컨텐츠에 대한 컨텐츠 키워드로서 선정할 수 있다.
컨텐츠 정보 테이블 생성부(230)는 투자 컨텐츠 및 컨텐츠 키워드에 기초하여 투자 컨텐츠에 대한 투자 컨텐츠 정보 테이블을 생성할 수 있다.
예를 들어, 도 3b를 참조하면, 투자 컨텐츠에 대한 투자 컨텐츠 정보 테이블(30)은 투자 컨텐츠에 대한 식별자(305), 컨텐츠 키워드에 대한 메타데이터(307), 투자 컨텐츠의 컨텐츠 타입(309), 투자 컨텐츠의 출처 정보(311) 및 컨텐츠 키워드에 매핑된 식별 코드(313)를 포함할 수 있다.
여기서, 컨텐츠 키워드에 매핑된 식별 코드는 해당 컨텐츠 키워드에 대응하는 등록 키워드(키워드 사전에 등록된 키워드)에 매핑된 식별 코드와 동일하다.
컨텐츠 키워드에 대한 메타데이터는 해당 컨텐츠 키워드에 대응하는 등록 키워드에 대한 메타데이터(즉, 등록 키워드가 키워드 사전에 등록된 등록일, 키워드 사전으로부터 등록 키워드가 추출된 추출 횟수를 포함)를 포함하고, 컨텐츠 키워드에 대응하는 등록 키워드가 키워드 사전으로부터 추출된 추출일 정보를 더 포함하고, 컨텐츠 키워드에 대한 최신성 가중치를 더 포함할 수 있다.
관리부(240)는 투자 컨텐츠 정보 테이블 및 키워드 사전을 연동하여 관리할 수 있다.
관리부(240)는 키워드 사전에서 특정 등록 키워드가 변경된 경우, 투자 컨텐츠 정보 테이블에 포함된 컨텐츠 키워드 중 해당 등록 키워드에 대응하는 컨텐츠 키워드를 변경된 등록 키워드로 변경할 수 있다. 예를 들어, 도 4를 참조하면, 키워드 사전(401)에 등록되어 있는 제 1 등록 키워드(403, 예컨대, '#버추얼가상사업')가 신규 등록 키워드(예컨대, '#메타버스')로 변경된 경우, 관리부(240)는 투자 컨텐츠별 투자 컨텐츠 정보 테이블(405)로부터 제 1 등록 키워드(403)에 대응하는 컨텐츠 키워드를 포함하는 투자 컨텐츠 정보 테이블을 추출할 수 있다.
예를 들어, 관리부(240)는 복수의 투자 컨텐츠 정보 테이블(405) 각각을 갖는 투자 컨텐츠 중 '#버추얼가상사업'의 등록 키워드에 대응하는 컨텐츠 키워드를 포함하는 투자 컨텐츠(예컨대, '#버추얼가상사업'의 컨텐츠 키워드를 포함하는 주식 컨텐츠, 뉴스 컨텐츠 일정 컨텐츠 등)를 모두 추출할 수 있다.
관리부(240)는 추출된 투자 컨텐츠별 투자 컨텐츠 정보 테이블에 포함된 복수의 컨텐츠 키워드 중 제 1 등록 키워드의 식별 코드(407)와 대응하는 컨텐츠 키워드의 식별 코드(409)를 추출하고, 추출된 컨텐츠 키워드의 식별 코드(409)가 매핑된 기존 컨텐츠 키워드('#버추얼가상사업')를 신규 등록 키워드(예컨대, '#메타버스')로 일괄 변경할 수 있다. 또한, 관리부(240)는 추출된 컨텐츠 키워드의 식별 코드(409)가 매핑된 기존 컨텐츠 키워드에 대한 메타 데이터(411)를 신규 등록 키워드에 대한 메타 데이터(413)로 일괄 변경할 수 있다.
다른 실시예로, 'A 주식 컨텐츠'(예컨대, 셀트리온 주식)와 관련하여 'M&A' 키워드와 '코로나 19' 키워드를 전문가 단말로부터 입력받은 경우, 관리부(240)는 입력된 'M&A' 등록 키워드와 '코로나 19' 등록 키워드에 매핑된 식별 코드를 키워드 사전으로부터 추출할 수 있다.
이어서, 키워드 사전에 'M&A' 등록 키워드와 '코로나 19' 등록 키워드가 키워드 사전에 존재하는 경우, 관리부(240)는 'M&A' 등록 키워드와 '코로나 19' 등록 키워드 각각에 대한 메타 데이터(예컨대, 등록일(갱신일), 추출횟수, 컨텐츠 타입, 출처 정보 등)를 키워드 사전에서 업데이트할 수 있다.
관리부(240)는 복수의 투자 컨텐츠 각각에 대응하는 투자 컨텐츠 정보 테이블 중 'M&A' 등록 키워드의 식별 코드 및 '코로나 19' 등록 키워드의 식별 코드 각각에 대응하는 컨텐츠 키워드의 식별 코드가 존재하는 투자 컨텐츠의 투자 컨텐츠 정보 테이블을 검색할 수 있다.
검색된 투자 컨텐츠의 투자 컨텐츠 정보 테이블에 '코로나 19' 등록 키워드에 대응하는 컨텐츠 키워드의 식별 코드만 존재하는 경우, 관리부(240)는 해당 검색된 투자 컨텐츠의 투자 컨텐츠 정보 테이블에 'M&A' 등록 키워드에 대응하는 컨텐츠 키워드 및 'M&A' 등록 키워드의 식별 코드에 대응하는 컨텐츠 키워드의 식별 코드를 포함하는 메타 데이터를 추가 입력할 수 있다.
관리부(240)는 해당 검색된 투자 컨텐츠의 투자 컨텐츠 정보 테이블에서 '코로나 19' 등록 키워드에 대응하는 컨텐츠 키워드의 등록일(갱신일), 컨텐츠 타입 등을 포함하는 메타 데이터를 업데이트할 수 있다.
키워드 서비스 제공부(250)는 투자 컨텐츠별 투자 컨텐츠 정보 테이블을 이용하여 투자 컨텐츠와 관련된 컨텐츠 키워드를 통한 키워드 서비스를 제공할 수 있다.
예를 들어, 도 5a를 참조하면, 키워드 서비스 제공부(250)는 '삼성 전자'의 주식 컨텐츠에 대한 투자 컨텐츠 정보 테이블로부터 '삼성 전자'의 주식 컨텐츠와 관련된 복수의 컨텐츠 키워드를 추출하고, 추출된 복수의 컨텐츠를 포함한 키워드 태그맵(50)을 투자자 단말에게 제공할 수 있다. 이 때, 키워드 태그맵(50)은 컨텐츠 키워드에 대한 가중치가 높은 순으로 복수의 컨텐츠 키워드가 정렬되어 표시될 수 있다.
투자자가 키워드 태그맵(50)에 포함된 복수의 컨텐츠 키워드 중 적어도 하나를 선택한 경우, 관리부(240)는 투자자에 의해 선택된 컨텐츠 키워드에 대한 최신성 가중치를 업데이트할 수 있다.
주식 키워드 입력 인터페이스(52)를 통해 투자자 단말로부터 입력받은 '삼성 전자'의 주식 컨텐츠와 관련된 입력 키워드가 기존 키워드 사전에 이미 등록된 등록 키워드인 경우, 관리부(240)는 입력 키워드에 대한 최신성 가중치를 업데이트할 수 있다.
예를 들어, 도 5b를 참조하면, 키워드 서비스 제공부(250)는 SNS 컨텐츠 서비스(예컨대, 텔레그램, 페이스북, 카카오스토리, 인스타그램 등)와 연동된 투자 컨텐츠(54)의 경우, 기설정된 특수기호(예컨대, '@' 또는 '#' 등)를 통해 투자 컨텐츠(54)를 투자 단말로부터 입력받고, 관리부(240)는 입력된 투자 컨텐츠(54)와 관련된 복수의 컨텐츠 키워드에 기초하여 투자 컨텐츠 정보 테이블 및 키워드 사전을 연동하여 업데이트할 수 있다.
예를 들어, 도 5c를 참조하면, 키워드 서비스 제공부(250)는 투자자 단말로부터 입력된 검색 키워드(56, 예컨대, '코로나')와 관련하여 뉴스 컨텐츠를 검색하여 투자자 단말에게 검색된 뉴스 컨텐츠를 제공할 수 있다. 또한, 키워드 서비스 제공부(250)는 투자자 단말로부터 입력된 검색 키워드(56)와 연관된 '주식' 투자 컨텐츠(58)에 대한 복수의 컨텐츠 키워드(60)를 투자자 단말에게 제공할 수 있다.
예를 들어, 도 5d를 참조하면, 투자자 단말로부터 특정 투자 컨텐츠에 대한 일정 관리 정보(62)를 입력받은 경우, 관리부(240)는 해당 투자 컨텐츠와 관련된 복수의 컨텐츠 키워드에 최신성 가중치를 업데이트할 수 있다.
한편, 당업자라면, 키워드 사전 구축부(200), 키워드 추출부(210), 컨텐츠 키워드 선정부(220), 컨텐츠 정보 테이블 생성부(230), 관리부(240) 및 키워드 서비스 제공부(250) 각각이 분리되어 구현되거나, 이 중 하나 이상이 통합되어 구현될 수 있음을 충분히 이해할 것이다.
도 6은 본 발명의 일 실시예에 따른, 키워드 사전을 이용하여 투자 키워드를 관리하는 방법을 나타낸 흐름도이다.
도 6을 참조하면, 단계 S601에서 키워드 추출 서버(20)는 기설정된 투자 목표 분야에 대응하는 키워드 사전을 구축할 수 있다.
단계 S603에서 키워드 추출 서버(20)는 키워드 사전에 등록된 복수의 등록 키워드 중 투자에 관한 투자 컨텐츠와 관련된 적어도 하나의 등록 키워드를 추출할 수 있다.
단계 S605에서 키워드 추출 서버(20)는 추출된 적어도 하나의 등록 키워드에 대한 메타데이터에 포함된 추출 횟수에 기초하여 투자 컨텐츠에 대한 컨텐츠 키워드를 선정할 수 있다.
단계 S607에서 키워드 추출 서버(20)는 투자 컨텐츠 및 컨텐츠 키워드에 기초하여 투자 컨텐츠 정보 테이블을 생성할 수 있다.
단계 S609에서 키워드 추출 서버(20)는 투자 컨텐츠 정보 테이블 및 키워드 사전을 연동하여 관리할 수 있다.
상술한 설명에서, 단계 S601 내지 S609는 본 발명의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 변경될 수도 있다.
본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
Claims (12)
- 키워드 사전을 이용하여 투자 키워드를 관리하는 서버에 있어서,기설정된 투자 목표 분야에 대응하는 키워드 사전을 구축하는 키워드 사전 구축부;상기 키워드 사전에 등록된 복수의 등록 키워드 중 투자에 관한 투자 컨텐츠와 관련된 적어도 하나의 등록 키워드를 추출하는 키워드 추출부;상기 추출된 적어도 하나의 등록 키워드에 대한 메타데이터에 포함된 추출 횟수에 기초하여 상기 투자 컨텐츠에 대한 컨텐츠 키워드를 선정하는 컨텐츠 키워드 선정부;상기 투자 컨텐츠 및 상기 컨텐츠 키워드에 기초하여 투자 컨텐츠 정보 테이블을 생성하는 컨텐츠 정보 테이블 생성부; 및상기 투자 컨텐츠 정보 테이블 및 상기 키워드 사전을 연동하여 관리하는 관리부를 포함하는 것인, 키워드 추출 서버.
- 제 1 항에 있어서,상기 키워드 사전 구축부는 상기 투자 목표 분야의 전문가 단말로부터 입력된 복수의 키워드 중 기설정된 키워드 채택 기준을 통과한 키워드에 기초하여 상기 키워드 사전을 구축하는 것인, 키워드 추출 서버.
- 제 2 항에 있어서,상기 키워드 사전은 상기 등록 키워드에 매핑된 식별 코드 및 상기 등록 키워드에 대한 메타데이터를 더 포함하고,상기 메타데이터는 상기 등록 키워드가 상기 키워드 사전에 등록된 등록일 및 상기 키워드 사전으로부터 상기 등록 키워드가 추출된 추출 횟수를 포함하는 것인, 키워드 추출 서버.
- 제 3 항에 있어서,상기 기설정된 키워드 채택 기준을 통과하는 키워드가 상기 키워드 사전에 이미 저장된 등록 키워드인 경우, 상기 키워드 사전 구축부는 상기 등록 키워드의 등록일을 업데이트하는 것인, 키워드 추출 서버.
- 제 1 항에 있어서,상기 투자 컨텐츠 정보 테이블은 상기 투자 컨텐츠에 대한 식별자, 상기 컨텐츠 키워드에 매핑된 식별 코드 및 상기 컨텐츠 키워드에 대한 메타데이터를 더 포함하는 것인, 키워드 추출 서버.
- 제 4 항에 있어서,상기 키워드 사전에서 상기 투자 컨텐츠와 관련된 등록 키워드가 변경된 경우, 상기 관리부는 상기 투자 컨텐츠 정보 테이블에 포함된 상기 컨텐츠 키워드 중 상기 변경된 등록 키워드에 대응하는 컨텐츠 키워드를 상기 변경된 등록 키워드로 변경하는 것인, 키워드 추출 서버.
- 키워드 추출 서버에 의해 수행되는 키워드 사전을 이용하여 투자 키워드를 관리하는 방법에 있어서,기설정된 투자 목표 분야에 대응하는 키워드 사전을 구축하는 단계;상기 키워드 사전에 등록된 복수의 등록 키워드 중 투자에 관한 투자 컨텐츠와 관련된 적어도 하나의 등록 키워드를 추출하는 단계;상기 추출된 적어도 하나의 등록 키워드에 대한 메타데이터에 포함된 추출 횟수에 기초하여 상기 투자 컨텐츠에 대한 컨텐츠 키워드를 선정하는 단계;상기 투자 컨텐츠 및 상기 컨텐츠 키워드에 기초하여 투자 컨텐츠 정보 테이블을 생성하는 단계; 및상기 투자 컨텐츠 정보 테이블 및 상기 키워드 사전을 연동하여 관리하는 단계를 포함하는 것인, 키워드 추출 방법.
- 제 7 항에 있어서,상기 키워드 사전을 구축하는 단계는상기 투자 목표 분야의 전문가 단말로부터 입력된 복수의 키워드 중 기설정된 키워드 채택 기준을 통과한 키워드에 기초하여 상기 키워드 사전을 구축하는 단계를 포함하는 것인, 키워드 추출 방법.
- 제 8 항에 있어서,상기 키워드 사전은 상기 등록 키워드에 매핑된 식별 코드 및 상기 등록 키워드에 대한 메타데이터를 더 포함하고,상기 메타데이터는 상기 등록 키워드가 상기 키워드 사전에 등록된 등록일 및 상기 키워드 사전으로부터 상기 등록 키워드가 추출된 추출 횟수를 포함하는 것인, 키워드 추출 방법.
- 제 10 항에 있어서,상기 기설정된 키워드 채택 기준을 통과하는 키워드가 상기 키워드 사전에 이미 저장된 등록 키워드인 경우, 상기 등록 키워드의 등록일을 업데이트하는 단계를 더 포함하는 것인, 키워드 추출 방법.
- 제 7 항에 있어서,상기 투자 컨텐츠 정보 테이블은 상기 투자 컨텐츠에 대한 식별자, 상기 컨텐츠 키워드에 매핑된 식별 코드 및 상기 컨텐츠 키워드에 대한 메타데이터를 더 포함하는 것인, 키워드 추출 방법.
- 제 10 항에 있어서,상기 키워드 사전에서 상기 투자 컨텐츠와 관련된 등록 키워드가 변경된 경우, 상기 투자 컨텐츠 정보 테이블에 포함된 상기 컨텐츠 키워드 중 상기 변경된 등록 키워드에 대응하는 컨텐츠 키워드를 상기 변경된 등록 키워드로 변경하는 단계를 더 포함하는 것인, 키워드 추출 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023578904A JP2024524209A (ja) | 2021-06-29 | 2022-06-28 | キーワード辞典を利用して投資キーワードを管理するサーバ及び方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20210084712 | 2021-06-29 | ||
KR10-2021-0084712 | 2021-06-29 | ||
KR10-2022-0046980 | 2022-04-15 | ||
KR1020220046980A KR20230002036A (ko) | 2021-06-29 | 2022-04-15 | 키워드 사전을 이용하여 투자 키워드를 관리하는 서버 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2023277522A1 true WO2023277522A1 (ko) | 2023-01-05 |
Family
ID=84690341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/KR2022/009227 WO2023277522A1 (ko) | 2021-06-29 | 2022-06-28 | 키워드 사전을 이용하여 투자 키워드를 관리하는 서버 및 방법 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2024524209A (ko) |
WO (1) | WO2023277522A1 (ko) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20070081548A (ko) * | 2006-02-13 | 2007-08-17 | 주식회사 디알에프앤 | 뉴스를 이용한 증권정보 제공시스템 |
US9070156B2 (en) * | 1998-09-18 | 2015-06-30 | Amazon Technologies, Inc. | Automated detection and exposure of behavior-based relationships between browsable items |
KR101708444B1 (ko) * | 2015-11-16 | 2017-02-22 | 주식회사 위버플 | 키워드 및 자산 가격 관련성 평가 방법 및 그 장치 |
KR20200083865A (ko) * | 2018-12-31 | 2020-07-09 | 주식회사 핀업 | 투자정보 제공 시스템 |
KR20210016845A (ko) * | 2019-08-05 | 2021-02-17 | 이베스트투자증권 주식회사 | 투자정보 큐레이션 제공방법 |
-
2022
- 2022-06-28 WO PCT/KR2022/009227 patent/WO2023277522A1/ko active Application Filing
- 2022-06-28 JP JP2023578904A patent/JP2024524209A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9070156B2 (en) * | 1998-09-18 | 2015-06-30 | Amazon Technologies, Inc. | Automated detection and exposure of behavior-based relationships between browsable items |
KR20070081548A (ko) * | 2006-02-13 | 2007-08-17 | 주식회사 디알에프앤 | 뉴스를 이용한 증권정보 제공시스템 |
KR101708444B1 (ko) * | 2015-11-16 | 2017-02-22 | 주식회사 위버플 | 키워드 및 자산 가격 관련성 평가 방법 및 그 장치 |
KR20200083865A (ko) * | 2018-12-31 | 2020-07-09 | 주식회사 핀업 | 투자정보 제공 시스템 |
KR20210016845A (ko) * | 2019-08-05 | 2021-02-17 | 이베스트투자증권 주식회사 | 투자정보 큐레이션 제공방법 |
Also Published As
Publication number | Publication date |
---|---|
JP2024524209A (ja) | 2024-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2018030672A1 (ko) | 머신러닝을 활용한 정해진 시나리오로 고객과 상담하는 로봇 자동 상담 방법 및 시스템 | |
WO2018016673A1 (ko) | 대체어 자동 추출 장치 및 방법, 이를 수행하기 위한 기록 매체 | |
WO2019098409A1 (ko) | 머신 러닝 기반의 챗봇용 데이터 추가 장치 | |
CN110929125B (zh) | 搜索召回方法、装置、设备及其存储介质 | |
CN101556614A (zh) | 便捷显示关于一个或更多个输入项目的交互式动态项目云 | |
WO2011122730A1 (ko) | Rdf 네트워크 기반 연관검색 서비스 시스템 및 방법 | |
WO2011162446A1 (ko) | 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈 및 방법 | |
WO2021112463A1 (ko) | 기업을 위한 정보 제공 장치 및 방법 | |
WO2020242086A1 (ko) | 다중 지식의 비교 우위를 추론하는 서버, 방법 및 컴퓨터 프로그램 | |
WO2019039673A1 (ko) | 인공지능 기반의 웹 페이지 분석에 기초한 제품 키워드 정보 자동추출 장치 및 방법 | |
WO2021235617A1 (ko) | 과학기술 지식정보 추천 시스템 및 그 방법 | |
WO2024185948A1 (ko) | 인공신경망 기반의 검색어 사전 생성 및 검색 방법 및 장치 | |
WO2016117739A1 (ko) | 인-메모리 데이터베이스 기반의 데이터 관리 시스템 및 그 방법 | |
WO2023277522A1 (ko) | 키워드 사전을 이용하여 투자 키워드를 관리하는 서버 및 방법 | |
Garda et al. | BELB: a biomedical entity linking benchmark | |
CN110457436B (zh) | 信息标注方法、装置、计算机可读存储介质及电子设备 | |
WO2015133774A1 (ko) | 특허 분석 시스템 및 방법과 이를 실행하기 위한 프로그램이 기록된 기록매체 | |
WO2021261763A1 (ko) | 온톨로지 데이터베이스 기반의 딥러닝을 통한 병리검사결과보고서 정제 시스템 | |
US11475222B2 (en) | Automatically extending a domain taxonomy to the level of granularity present in glossaries in documents | |
WO2021145541A1 (ko) | Pdf 파일을 대상으로 하는 테이블 데이터 파싱 방법 | |
WO2018169168A1 (ko) | 사용자 별 번역 사전을 제공하는 전자 문서 관리 시스템 및 방법 | |
WO2018139778A1 (ko) | 수치정보 검색이 가능한 수치정보 관리장치 | |
WO2018174469A1 (ko) | 디지털 정보 제공 시스템 및 방법 | |
WO2014092361A1 (en) | Evaluation engine of patent evaluation system | |
KR20230002036A (ko) | 키워드 사전을 이용하여 투자 키워드를 관리하는 서버 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 22833578 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2023578904 Country of ref document: JP Kind code of ref document: A |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 22833578 Country of ref document: EP Kind code of ref document: A1 |