KR20200084694A - Method and apparatus for collecting educational materials - Google Patents
Method and apparatus for collecting educational materials Download PDFInfo
- Publication number
- KR20200084694A KR20200084694A KR1020190000860A KR20190000860A KR20200084694A KR 20200084694 A KR20200084694 A KR 20200084694A KR 1020190000860 A KR1020190000860 A KR 1020190000860A KR 20190000860 A KR20190000860 A KR 20190000860A KR 20200084694 A KR20200084694 A KR 20200084694A
- Authority
- KR
- South Korea
- Prior art keywords
- contents
- data
- specific
- collecting
- text data
- Prior art date
Links
- 239000000463 material Substances 0.000 title claims abstract description 57
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000004458 analytical method Methods 0.000 claims abstract description 22
- 238000003058 natural language processing Methods 0.000 claims description 12
- 238000010801 machine learning Methods 0.000 claims description 9
- 238000004445 quantitative analysis Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 230000000875 corresponding effect Effects 0.000 description 9
- 238000011156 evaluation Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000004451 qualitative analysis Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
- G06Q50/2057—Career enhancement or continuing education service
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
Description
본 개시는 교육 자료를 수집하는 방법 및 장치에 관한 것이다. 보다 상세하게는, 본 개시는 특정 분야에 관하여 특정 집단을 교육하기 위한 교육 자료를 수집하는 방법에 있어서, 복수의 컨텐츠를 분석하는 단계를 포함하는 방법 및 장치에 관한 것이다.This disclosure relates to a method and apparatus for collecting educational material. More particularly, the present disclosure relates to a method and apparatus comprising a method of collecting a plurality of contents in a method of collecting educational materials for training a specific group in a specific field.
특정 분야에 대한 교육이 수행되는 경우 어떤 교육 자료가 구비되는지에 따라 교육의 성과가 크게 좌우될 수 있다. 특히, 특정 분야에 익숙하지 않은 특정 집단을 대상으로 교육이 이루어지는 경우, 특정 집단이 특정 분야에 관한 교육 내용을 보다 원활하게 수용할 수 있도록 적합한 교육 자료가 구비될 것이 보다 중요해질 수 있다.When education in a specific field is performed, the performance of education can be greatly influenced by what education materials are provided. In particular, when education is conducted for a specific group not familiar with a specific field, it may be more important that suitable educational materials are provided so that a specific group can more smoothly accommodate the education content related to a specific field.
근래에는 다양한 매체(media)를 통해 다수의 컨텐츠(contents)들이 유통되고 있어, 특정 분야를 교육하기 위해 컨텐츠들이 활용될 수 있다. 다만, 비전문적으로 생산된 컨텐츠들이 교육에 부적절하게 활용될 여지가 있고, 교육의 대상이 되는 특정 집단과 무관한 컨텐츠들이 사용되어 교육의 효율이 저하되는 점이 문제될 수 있다.Recently, a large number of contents are distributed through various media, so contents can be utilized to educate a specific field. However, there is room for inappropriately produced contents to be used for education, and it can be a problem that the efficiency of education is deteriorated because contents irrelevant to a specific group to be used are used.
따라서, 다양한 매체를 통해 교육에 컨텐츠를 교육 자료로서 활용하면서도, 부적절한 컨텐츠들이 교육 자료에서 배제되도록 하고, 특정 집단과의 상관 관계가 있는 컨텐츠들을 선별함으로써 교육이 효율적으로 수행되도록 하는 기술이 요구된다.Accordingly, there is a need for a technology that enables education to be efficiently performed by using content for education through various media as education materials, while making inappropriate content excluded from education materials, and selecting content that is correlated with a specific group.
다양한 실시예들은 교육 자료를 수집하는 방법 및 장치를 제공하기 위한 것이다. 본 개시가 이루고자 하는 기술적 과제는 전술한 바와 같은 기술적 과제들로 한정되지 않으며, 이하의 실시예들로부터 또 다른 기술적 과제들이 유추될 수 있다.Various embodiments are intended to provide a method and apparatus for collecting educational material. The technical problem to be achieved by the present disclosure is not limited to the technical problems as described above, and other technical problems may be inferred from the following embodiments.
전술한 기술적 과제를 해결하기 위한 수단으로서, 본 개시의 일 측면에 따른 특정 분야에 관하여 특정 집단을 교육하기 위한 교육 자료를 수집하는 방법은, 상기 특정 집단에 관한 데이터 중 상기 특정 분야와 관련되는 데이터를 분석 대상 데이터로 분류하는 단계; 상기 분석 대상 데이터에 대한 검색을 통해 매체(media)로부터 상기 분석 대상 데이터와 관련되는 복수의 컨텐츠(contents)를 수집하는 단계; 상기 복수의 컨텐츠를 분석하는 단계; 상기 분석 결과로부터 상기 복수의 컨텐츠 각각에 대한 선호도를 계산하는 단계; 및 상기 선호도에 기초하여 상기 복수의 컨텐츠 중 적어도 하나를 상기 교육 자료로 선별하는 단계를 포함할 수 있다.As a means for solving the above technical problem, a method of collecting educational materials for educating a specific group in a specific field according to an aspect of the present disclosure includes data related to the specific field among data related to the specific group Classifying the data as data to be analyzed; Collecting a plurality of contents related to the analysis target data from a medium through a search for the analysis target data; Analyzing the plurality of contents; Calculating preferences for each of the plurality of contents from the analysis result; And selecting at least one of the plurality of contents as the educational material based on the preference.
본 개시의 다른 측면에 따른 특정 분야에 관하여 특정 집단을 교육하기 위한 교육 자료를 수집하는 장치는, 적어도 하나의 프로그램을 저장하는 메모리; 및 상기 적어도 하나의 프로그램을 실행함으로써 상기 교육 자료를 수집하는 프로세서를 포함하고, 상기 프로세서는, 상기 특정 집단에 관한 데이터 중 상기 특정 분야와 관련되는 데이터를 분석 대상 데이터로 분류하고, 상기 분석 대상 데이터에 대한 검색을 통해 매체(media)로부터 상기 분석 대상 데이터와 관련되는 복수의 컨텐츠(contents)를 수집하고, 상기 복수의 컨텐츠를 분석하고, 상기 분석 결과로부터 상기 복수의 컨텐츠 각각에 대한 선호도를 계산하고, 상기 선호도에 기초하여 상기 복수의 컨텐츠 중 적어도 하나를 상기 교육 자료로 선별할 수 있다.An apparatus for collecting educational materials for educating a specific group in a specific field according to another aspect of the present disclosure includes: a memory storing at least one program; And a processor that collects the educational material by executing the at least one program, wherein the processor classifies data related to the specific field among data related to the specific group as data to be analyzed, and data to be analyzed. Collects a plurality of contents related to the analysis target data from the media through a search for, analyzes the plurality of contents, and calculates preferences for each of the plurality of contents from the analysis results , Based on the preference, at least one of the plurality of contents may be selected as the educational material.
본 개시에 따른 특정 분야에 관하여 특정 집단을 교육하기 위한 교육 자료를 수집하는 방법 및 장치를 통해 복수의 컨텐츠가 정량적으로 및 정성적으로 분석될 수 있어, 특정 집단의 교육 자료에 대한 흥미 및 접근성이 증가할 수 있고, 교육 자료를 활용하여 특정 집단을 대상으로 특정 분야를 교육하는 효과가 개선될 수 있다.A plurality of contents can be quantitatively and qualitatively analyzed through a method and apparatus for collecting educational materials for educating a specific group with respect to a specific field according to the present disclosure, so that interest and accessibility to educational materials of a specific group It can increase, and the effectiveness of educating specific fields for specific groups using educational materials can be improved.
도 1은 일부 실시예에 따른 특정 분야에 관하여 특정 집단을 교육하기 위한 교육 자료를 수집하는 방법을 구성하는 단계들을 나타내는 흐름도이다.
도 2는 일부 실시예에 따른 특정 분야에 관하여 특정 집단을 교육하기 위한 교육 자료를 수집하는 방법을 구현하는 구체적인 예시를 설명하기 위한 도면이다.
도 3은 일부 실시예에 따른 특정 분야에 관하여 특정 집단을 교육하기 위한 교육 자료를 수집하는 방법의 효과를 설명하기 위한 그래프들을 나타내는 도면이다.
도 4는 일부 실시예에 따른 특정 분야에 관하여 특정 집단을 교육하기 위한 교육 자료를 수집하는 장치를 구성하는 요소들을 나타내는 블록도이다.1 is a flow chart showing steps constituting a method of collecting educational material for educating a specific group in a specific field according to some embodiments.
2 is a view for explaining a specific example of implementing a method of collecting educational materials for educating a specific group in a specific field according to some embodiments.
3 is a diagram illustrating graphs for explaining the effect of a method of collecting educational materials for educating a specific group with respect to a specific field according to some embodiments.
4 is a block diagram showing elements constituting an apparatus for collecting educational materials for educating a specific group in a specific field according to some embodiments.
이하 첨부된 도면을 참조하면서 오로지 예시를 위한 실시예들을 상세히 설명하기로 한다. 아래의 설명은 실시예들을 구체화하기 위한 것일 뿐 발명의 권리 범위를 제한하거나 한정하는 것이 아님은 물론이다. 상세한 설명 및 실시예로부터 당해 기술분야의 전문가가 용이하게 유추할 수 있는 것은 권리범위에 속하는 것으로 해석된다.Hereinafter, exemplary embodiments will be described in detail with reference to the accompanying drawings. It should be understood that the following description is only for the purpose of embodying the embodiments and does not limit or limit the scope of the invention. From the detailed description and examples, what can be easily inferred by experts in the art is interpreted as belonging to the scope of rights.
본 명세서에서 사용되는 '구성된다' 또는 '포함한다' 등의 용어는 명세서 상에 기재된 여러 구성 요소들 또는 여러 단계들을 반드시 모두 포함하는 것으로 해석되지 않아야 하며, 그 중 일부 구성 요소들 또는 일부 단계들은 포함되지 않을 수 있고, 또는 추가적인 구성 요소들 또는 단계들이 더 포함될 수 있는 것으로 해석되어야 한다.As used herein, terms such as'consist of' or'comprises' should not be construed as including all the various components or various steps described in the specification, and some of the components or some steps It may not be included, or it should be construed that additional components or steps may be further included.
본 명세서에서 사용되는 '제 1' 또는 '제 2' 등과 같은 서수를 포함하는 용어는 다양한 구성 요소들을 설명하는데 사용될 수 있으나, 상기 구성 요소들은 상기 용어들에 의해 한정되지 않아야 한다. 상기 용어들은 하나의 구성 요소를 다른 구성 요소들로부터 구별하기 위한 목적으로만 사용된다.As used herein, terms including an ordinal number such as'first' or'second' may be used to describe various components, but the components should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from other components.
본 명세서에서 사용되는 용어는 본 발명에서의 기능을 고려하여 가능한 현재 널리 사용되는 일반적인 용어들로 선택되었으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당하는 발명의 설명 부분에서 그 의미가 상세하게 기재될 것이다. 따라서, 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.The terms used in the present specification have been selected as general terms that are widely used at present considering the functions in the present invention, but this may be changed according to the intention or precedent of a person skilled in the art or the appearance of new technologies. In addition, in certain cases, some terms are arbitrarily selected by the applicant, and in this case, their meanings will be described in detail in the description of the corresponding invention. Therefore, the term used in the present invention should be defined based on the meaning of the term and the contents of the present invention, rather than a simple term name.
본 실시예들은 특정 분야에 관하여 특정 집단을 교육하기 위한 교육 자료를 수집하는 방법 및 장치에 관한 것으로서 이하의 실시예들이 속하는 기술 분야에서 통상의 지식을 가진 자에게 널리 알려져 있는 사항들에 관해서는 자세한 설명을 생략한다.The embodiments of the present invention relate to a method and apparatus for collecting educational materials for educating a specific group in a specific field, and detailed descriptions of matters well known to those of ordinary skill in the technical field to which the following embodiments belong Omit the description.
도 1은 일부 실시예에 따른 특정 분야에 관하여 특정 집단을 교육하기 위한 교육 자료를 수집하는 방법을 구성하는 단계들을 나타내는 흐름도이다.1 is a flow chart showing steps constituting a method of collecting educational material for educating a specific group in a specific field according to some embodiments.
도 1을 참조하면, 본 개시에 따른 특정 분야에 관하여 특정 집단을 교육하기 위한 교육 자료를 수집하는 방법을 구성하는 단계들이 도시되어 있다. 다만 이에 한정되는 것은 아니고, 본 개시에 따른 방법은 도 1에 도시되는 단계들 외에도 다른 범용적인 단계들을 더 포함할 수 있다.Referring to FIG. 1, there are shown steps constituting a method of collecting educational materials for educating a specific group in a specific field according to the present disclosure. However, the present invention is not limited thereto, and the method according to the present disclosure may further include other general-purpose steps in addition to those shown in FIG. 1.
특정 집단은 교육의 대상이 되는 집단을 의미할 수 있다. 특정 집단은 소정의 기준에 따라 동일한 특성을 갖는 것으로 분류되는 구성원들을 포함할 수 있다. 예를 들면, 특정 집단은 특정 학과에 소속되는 학생들의 집단일 수 있다. 또는, 특정 교과목을 수강하는 수강생들의 집단일 수 있다. 다만 이에 한정되는 것은 아니고, 특정 집단은 동일한 특성을 공유하는 다른 집단에 해당할 수도 있다.A specific group may mean a group targeted for education. Certain populations may include members classified as having the same characteristics according to certain criteria. For example, a specific group may be a group of students belonging to a specific department. Or, it may be a group of students taking a specific subject. However, the present invention is not limited thereto, and a specific group may correspond to other groups sharing the same characteristics.
특정 분야는 특정 집단을 교육하기 위한 목적을 의미할 수 있다. 특정 분야는 학제에 포함되는 특정 교과목 또는 특수 목적의 프로젝트 등일 수 있다. 예를 들면, 특정 분야는 소프트웨어(software) 분야 또는 프로그래밍(programming) 분야 중 적어도 하나를 포함할 수 있다. 다만 그 외에도 특정 분야는 특정 집단을 교육하기 위한 목적이 되는 다양한 분야일 수 있다.A specific field can mean the purpose of educating a specific group. A specific field may be a specific subject or special purpose project included in the interdisciplinary system. For example, a specific field may include at least one of a software field or a programming field. However, other specific fields may be various fields for the purpose of educating a specific group.
교육 자료는 특정 분야에 관하여 특정 집단을 교육하기 위한 수단을 의미할 수 있다. 교육 자료는 특정 집단에 관한 데이터를 토대로 구비될 수 있다. 교육 자료는 특정 집단이 그 목적 또는 기능에 부합하도록 교육받는 데 사용되는 자료일 수 있다. 예를 들면, 교육 자료는 특정 집단을 교육하기 위한 텍스트, 이미지 및 영상 등을 포함하는 컨텐츠(contents)일 수 있으나, 이에 한정되는 것은 아니다.Training material can mean a means to educate a specific group in a particular field. Training materials may be provided based on data on specific groups. Educational materials may be materials used to be trained to meet a specific group's purpose or function. For example, the educational material may be content including text, images, and videos for educating a specific group, but is not limited thereto.
본 개시에 따른 방법은 본 개시에 따른 특정 분야에 관하여 특정 집단을 교육하기 위한 교육 자료를 수집하는 장치에 의해 수행될 수 있다. 본 개시에 따른 장치는 본 개시에 다른 방법을 구성하는 단계들을 수행할 수 있다. 본 개시에 따른 장치에 대한 구체적인 내용은 후술될 도 4를 참조하여 설명될 수 있다.The method according to the present disclosure may be performed by an apparatus for collecting educational materials for educating a specific group with respect to a specific field according to the present disclosure. An apparatus according to the present disclosure may perform steps constituting other methods in the present disclosure. Details of the device according to the present disclosure may be described with reference to FIG. 4 to be described later.
단계 110에서, 본 개시에 따른 장치는 특정 집단에 관한 데이터 중 특정 분야와 관련되는 데이터를 분석 대상 데이터로 분류할 수 있다.In
특정 집단에 관한 데이터는 특정 집단의 특성에 관련되는 데이터를 의미할 수 있다. 예를 들면, 특정 집단이 대학의 특정 학과인 경우 특정 집단에 관한 데이터는 특정 학과의 학사 과정, 커리큘럼(curriculum), 필수 교과목 및 졸업 요건 중 적어도 하나를 포함할 수 있다.Data related to a specific group may refer to data related to characteristics of a specific group. For example, when a specific group is a specific department of a university, data regarding a specific group may include at least one of a bachelor's course, curriculum, required courses, and graduation requirements of a specific department.
특정 분야와 관련되는 데이터는 특정 집단에 관한 데이터 중에서 특정 분야에 대한 교육과 관련되는 데이터를 의미할 수 있다. 예를 들면, 특정 분야와 관련되는 데이터는 특정 집단에 관한 데이터 중에서 특정 분야에 관한 인물 또는 사건 등을 의미할 수 있다.Data related to a specific field may mean data related to education for a specific field among data related to a specific group. For example, data related to a specific field may mean a person or event related to a specific field among data related to a specific group.
단계 120에서, 본 개시에 따른 장치는 분석 대상 데이터에 대한 검색을 통해 매체(media)로부터 분석 대상 데이터와 관련되는 복수의 컨텐츠(contents)를 수집할 수 있다.In
매체는 사용자 제작 컨텐츠(UCC, user created contents)가 공유되는 온라인 영상 플랫폼, 검색어에 대한 검색 결과를 제공하는 포털 사이트, 신문 기사를 제공하는 언론사별 홈페이지 및 국내외 방송 프로그램 등을 포함할 수 있다. 다만 이에 한정되는 것은 아니고, 분석 대상 데이터와 관련되는 컨텐츠를 제공하는 다른 요소들도 매체에 해당할 수 있다.The media may include an online video platform in which user-created contents (UCC) are shared, a portal site providing search results for search terms, a website for each media company providing newspaper articles, and domestic and international broadcasting programs. However, the present invention is not limited thereto, and other elements providing content related to the data to be analyzed may also correspond to the medium.
분석 대상 데이터와 관련되는 복수의 컨텐츠는 분석 대상 데이터에 대한 검색 결과로 매체를 통해 접근 가능한 컨텐츠를 의미할 수 있다. 예를 들면, 분석 대상 데이터와 관련되는 복수의 컨텐츠는 온라인 영상 플랫폼에 공유되는 영상 컨텐츠, 인터넷 상에서 포털 사이트에 의해 제공되는 각종 게시물, 언론사별 홈페이지를 통해 접근 가능한 뉴스 기사 및 국내외 TV 영상 제작물 등을 포함할 수 있다.The plurality of contents related to the data to be analyzed may mean content accessible through a medium as a search result for the data to be analyzed. For example, a plurality of content related to the data to be analyzed include video content shared on an online video platform, various posts provided by portal sites on the Internet, news articles accessible through media-specific websites, and domestic and foreign TV video productions. It can contain.
단계 130에서, 본 개시에 따른 장치는 복수의 컨텐츠를 분석할 수 있다.In
보다 상세하게는, 본 개시에 따른 장치는 복수의 컨텐츠를 정량적(quantitative)으로 분석할 수 있고, 복수의 컨텐츠를 정성적(qualitative)으로 분석할 수 있다.More specifically, the device according to the present disclosure may quantitatively analyze a plurality of contents and qualitatively analyze a plurality of contents.
본 개시에 따른 장치는 복수의 컨텐츠에 대한 통계적인 데이터를 분석함으로써 복수의 컨텐츠를 정량적으로 분석할 수 있다.The apparatus according to the present disclosure may quantitatively analyze a plurality of contents by analyzing statistical data on the plurality of contents.
복수의 컨텐츠에 대한 통계적인 데이터는 복수의 컨텐츠에 대해 수치로 제공되는 평가 지표를 의미할 수 있다. 예를 들면, 복수의 컨텐츠에 대한 통계적인 데이터는 영상 컨텐츠에 대한 추천 횟수와 추천 비율, 재생 횟수, 영상 컨텐츠를 업로드한 유저의 구독자 수 등을 의미할 수 있고, 또는 포털 사이트에 의해 제공되는 각종 게시물 및 뉴스 기사의 조회수, 작성된 댓글(comment)의 개수 등을 의미할 수도 있으며, 국내외 영상 제작물의 평가 점수, 제작비 등을 의미할 수도 있다. 다만 이와 같은 예시들에 한정되는 것은 아니고, 복수의 컨텐츠를 평가하기 위해 수치로 제공되는 다른 지표들 역시 복수의 컨텐츠에 대한 통계적인 데이터에 해당할 수 있다.Statistical data for a plurality of contents may mean an evaluation index provided numerically for the plurality of contents. For example, statistical data for a plurality of contents may mean the number of recommendations and the ratio of recommendations for the video content, the number of playbacks, the number of subscribers of the user who uploaded the video content, etc., or various types provided by the portal site It may mean the number of views of posts and news articles, the number of comments made, etc., or the evaluation score of a domestic or foreign video production or production cost. However, the present invention is not limited to these examples, and other indicators provided numerically to evaluate a plurality of contents may also correspond to statistical data for the plurality of contents.
본 개시에 따른 장치는 복수의 컨텐츠를 평가하기 위한 텍스트 데이터(text data)에 대한 자연어 처리(natural language processing)를 수행함으로써 복수의 컨텐츠를 정량적으로 분석할 수 있다.The apparatus according to the present disclosure may quantitatively analyze a plurality of contents by performing natural language processing on text data for evaluating a plurality of contents.
복수의 컨텐츠를 평가하기 위한 텍스트 데이터는 소비자들이 복수의 컨텐츠를 소비한 이후 그에 대한 평가를 위해 작성하는 다양한 텍스트를 의미할 수 있다. 예를 들면, 텍스트 데이터는 영상 컨텐츠에 대해 작성되는 댓글, 각종 게시물 또는 뉴스 기사에 대해 작성되는 댓글 및 국내외 영상 제작물에 대한 의견을 나타내는 게시물 등을 포함할 수 있다.Text data for evaluating a plurality of contents may mean various texts that consumers write for evaluating after consuming a plurality of contents. For example, text data may include comments written on video content, comments written on various posts or news articles, and posts indicating opinions on domestic and foreign video productions.
자연어 처리는 컴퓨터와 같은 기계가 인간의 언어를 분석하고, 그 의미를 인식할 수 있도록 하는 컴퓨터 과학의 한 분야를 의미할 수 있다. 자연어 처리를 통해 컴퓨터는 인간의 언어를 세부 요소로 분해할 수 있고, 각 요소의 의미를 이해할 수 있도록 학습될 수 있다.Natural language processing may refer to a field of computer science that enables machines, such as computers, to analyze human language and recognize its meaning. Through natural language processing, computers can decompose human language into sub-elements and learn to understand the meaning of each element.
통계적인 방식에 따라 수치로서 표현될 수 있는 정량적인 데이터와는 달리, 텍스트 데이터는 그에 포함되는 내용이 어떤 의미를 갖는지가 수치 등의 직관적인 지표로 표현되기 어렵다는 점에서, 텍스트 데이터는 정성적인 데이터에 해당할 수 있다. 따라서, 정성적 데이터로서의 텍스트 데이터는 자연어 처리와 같은 정석적인 분석을 통해야만 비로소 그 내용이 본 개시에 따른 방법에 활용될 수 있다.Unlike quantitative data that can be expressed as numbers according to a statistical method, text data is qualitative data in that it is difficult to express the meaning of what is included in it with intuitive indicators such as numbers. May correspond to Therefore, the text data as qualitative data can be utilized in the method according to the present disclosure only after a qualitative analysis such as natural language processing.
텍스트 데이터는 그에 대한 자연어 처리에 의해 정석적으로 분석됨에 따라 복수의 컨텐츠에 대한 평가 지표가 될 수 있다. 예를 들면, 본 개시에 따른 장치는 영상 컨텐츠에 대한 댓글에 대한 자연어 처리를 수행함으로써 영상 컨텐츠에 대한 댓글이 의도하는 내용을 파악할 수 있어, 댓글이 해당 영상 컨텐츠를 추천하는지 여부 등을 결정할 수 있다.The text data can be an evaluation index for a plurality of contents as it is analyzed statically by natural language processing. For example, the device according to the present disclosure can grasp the content intended by the comment on the video content by performing natural language processing on the comment on the video content, so that it is possible to determine whether or not the comment recommends the video content. .
본 개시에 따른 장치는 텍스트 데이터에 대한 기계 학습(machine learning)을 수행함으로써 자연어 처리를 수행할 수 있다.The apparatus according to the present disclosure may perform natural language processing by performing machine learning on text data.
기계 학습은 컴퓨터 등의 기계가 학습 대상에 대한 반복적인 학습을 통해 학습 대상이 갖는 속성(feature)을 분류할 수 있도록 패턴(pattern)을 형성하는 과정을 의미할 수 있다. 텍스트 데이터에 대한 기계 학습은 다량의 텍스트 데이터에 대한 학습을 수행하여, 어떠한 텍스트 데이터가 긍정적인 데이터인지, 또는 부정적인 데이터인지를 구분하기 위한 패턴을 형성하는 과정을 의미할 수 있다. 다만 위와 같은 예시에 한정되는 것은 아니고, 텍스트 데이터에 대한 기계 학습을 통해 긍정 또는 부정 여부만이 아닌 다양한 속성을 분류하기 위한 패턴이 형성될 수도 있다.Machine learning may mean a process of forming a pattern so that a machine such as a computer can classify features of a learning object through repetitive learning of the learning object. Machine learning on text data may refer to a process of forming a pattern for distinguishing which text data is positive data or negative data by performing learning on a large amount of text data. However, the present invention is not limited to the above examples, and patterns for classifying various attributes, not only positive or negative, may be formed through machine learning of text data.
텍스트 데이터에 대한 기계 학습은 신경망 알고리즘(neural network algorithm)을 통해 수행될 수 있다. 텍스트 데이터에 대한 기계 학습은 텍스트 데이터에 대한 학습이 진행됨에 따라 복수의 노드들을 포함하는 적어도 하나의 레이어(layer)가 형성되고, 노드들의 액티베이션(activation) 및 노드들 간의 가중치(weight)가 형성되는 방식으로 구현될 수 있다.Machine learning of text data may be performed through a neural network algorithm. In machine learning of text data, as learning of text data progresses, at least one layer including a plurality of nodes is formed, and activation of nodes and weight between nodes are formed. Can be implemented in a manner.
본 개시에 따른 장치는 텍스트 데이터에 대한 형태소 분석(morpheme analysis)을 수행함으로써 텍스트 데이터로부터 복수의 컨텐츠에 대한 긍정적인 형태소 및 부정적인 형태소를 추출할 수 있고, 복수의 컨텐츠에 대한 긍정적인 형태소 및 부정적인 형태소를 추출함으로써 자연어 처리를 수행할 수 있다.The apparatus according to the present disclosure can extract positive and negative morphemes for a plurality of contents from text data by performing morpheme analysis on text data, and positive and negative morphemes for a plurality of contents Natural language processing can be performed by extracting.
형태소 분석은 개별 어휘 또는 문장으로 구성되는 텍스트 데이터를 형태소 단위로 구분하는 것을 의미할 수 있다. 형태소는 더 이상 분석되면 의미을 잃어버리게 되는, 언어학적으로 의미를 내포할 수 있는 가장 작은 단위를 의미할 수 있다. 형태소 분석을 통해 텍스트 데이터는 그를 구성하는 형태소들로 나뉘어질 수 있다.Morphological analysis may mean classifying text data composed of individual vocabulary or sentences into morpheme units. A morpheme can mean the smallest unit that can contain meaning linguistically, which loses meaning when it is analyzed further. Through morpheme analysis, text data can be divided into morphemes constituting him.
본 개시에 따른 장치는 형태소 단위로 분석된 텍스트 데이터가 복수의 컨텐츠에 대하여 긍정적인 내용에 해당하는 긍정적인 형태소인지, 복수의 컨텐츠에 대하여 부정적인 내용에 해당하는 부정적인 형태소인지 여부를 판단할 수 있다. 그 과정에서, 형태소에 대한 학습을 통해 형태소가 긍정적인지 부정적인지에 관한 패턴을 형성하는 기계 학습이 수행될 수 있다. 다만 형태소가 긍정 또는 부정의 속성으로 이진적으로 분류되는 예시에 한정되는 것은 아니고, 텍스트 데이터를 구성하는 형태소들은 매우 좋음, 좋음, 보통, 나쁨 및 매우 나쁨 중 어느 하나로 분류될 수도 있다.The apparatus according to the present disclosure may determine whether text data analyzed in units of morphemes is a positive morpheme corresponding to positive contents for a plurality of contents or a negative morpheme corresponding to negative contents for a plurality of contents. In the process, machine learning may be performed to form patterns regarding whether morphemes are positive or negative through learning about morphemes. However, the morpheme is not limited to an example in which binary morphemes are classified as positive or negative attributes, and morphemes constituting text data may be classified as one of very good, good, normal, bad, and very bad.
위와 같이 긍정적인 형태소 및 부정적인 형태소가 텍스트 데이터로부터 추출되는 경우, 긍정적인 형태소 및 부정적인 형태소는 복수의 컨텐츠를 정성적으로 분석하는 데 활용될 수 있다. 예를 들면, 긍정적인 형태소 및 부정적인 형태소 각각의 개수가 단순히 비교될 수 있다. 다만 이에 한정되는 것은 아니고, 긍정적인 형태소 및 부정적인 형태소를 활용하여 복수의 컨텐츠를 정성적으로 분석하는 다양한 방식이 채용될 수 있다.As described above, when positive and negative morphemes are extracted from text data, positive and negative morphemes may be used to qualitatively analyze a plurality of contents. For example, the number of each of the positive and negative morphemes can simply be compared. However, the present invention is not limited thereto, and various methods of qualitatively analyzing a plurality of contents using positive and negative morphemes may be employed.
단계 140에서, 본 개시에 따른 장치는 분석 결과로부터 복수의 컨텐츠 각각에 대한 선호도를 계산할 수 있다. 구체적으로, 본 개시에 따른 장치는 복수의 컨텐츠에 대한 분석 결과에 기초하여 복수의 컨텐츠 각각에 대한 선호도를 계산할 수 있다.In
복수의 컨텐츠 각각에 대한 선호도는 복수의 컨텐츠에 대한 정량적 분석 결과 및 정성적 분석 결과 중 적어도 하나로부터 도출될 수 있다. 단지 통계적인 수치로 제시되는 정량적 분석 결과만을 활용하는 것이 아닌, 정성적 분석 결과까지 함께 고려될 수 있다는 점에서, 복수의 컨텐츠 각각에 대한 선호도는 보다 정밀하고 정확하게 계산될 수 있다.The preference for each of the plurality of contents may be derived from at least one of a quantitative analysis result and a qualitative analysis result for the plurality of contents. The preference for each of a plurality of contents can be calculated more precisely and accurately, in that not only quantitative analysis results presented as statistical figures are used but qualitative analysis results can be considered together.
복수의 컨텐츠 각각에 대한 선호도는 앞서 살핀 바와 같이, 통계적인 데이터 분석, 자연어 처리, 기계 학습 및 형태소 분석 중 적어도 하나를 통해 계산될 수 있다.As described above, preferences for each of the plurality of contents may be calculated through at least one of statistical data analysis, natural language processing, machine learning, and morpheme analysis.
본 개시에 따른 장치는 복수의 컨텐츠 및 텍스트 데이터 사이의 상관 관계(correlation)로부터 도출되는 텍스트 데이터에 대한 가중치(weight)에 기초하여 선호도를 계산할 수 있다.The apparatus according to the present disclosure may calculate the preference based on a weight for text data derived from a correlation between a plurality of content and text data.
복수의 컨텐츠 및 텍스트 데이터 사이의 상관 관계는 복수의 컨텐츠에 대해 제공되는 텍스트 데이터가 복수의 컨텐츠와 어느 정도로 연관이 있는지를 나타낼 수 있다. 특정 컨텐츠가 둘 이상의 요소로 구성되는 경우, 하나의 요소만에 관련되는 내용을 갖는 텍스트 데이터보다, 둘 이상의 요소에 관련되는 내용을 갖는 텍스트 데이터가 보다 큰 상관 관계를 가질 수 있다. 이와 같이, 복수의 컨텐츠 및 텍스트 데이터 사이의 상관 관계는 특정 컨텐츠에 포함되는 요소들의 개수 및 텍스트 데이터에 포함되는 요소들의 개수를 기반으로 도출될 수 있다. 요소들의 개수에 기반하는 상관 관계는 자카드 계수(Jaccard coefficient) 등으로 구현될 수 있다. 다만 이와 같은 예시에 한정되는 것은 아니고, 상관 관계를 도출하기 위한 보다 정교한 방식 역시 채용될 수 있다.The correlation between the plurality of contents and the text data may indicate how much the text data provided for the plurality of contents are related to the plurality of contents. When a specific content is composed of two or more elements, text data having content related to two or more elements may have a greater correlation than text data having content related to only one element. As such, the correlation between a plurality of contents and text data may be derived based on the number of elements included in specific content and the number of elements included in text data. Correlation based on the number of elements may be implemented as a Jaccard coefficient. However, the present invention is not limited to such an example, and a more sophisticated method for deriving a correlation may also be employed.
본 개시에 따른 장치는 복수의 컨텐츠 및 텍스트 데이터 사이의 상관 관계로부터 텍스트 데이터에 대한 가중치를 도출할 수 있다. 각각의 텍스트 데이터에 대하여, 상관 관계가 높을수록 해당 텍스트 데이터에 높은 가중치를 설정하는 방식 등이 채용될 수 있다. 일 예로서 가중치는 상관 관계로부터 선형적으로 도출될 수 있으나, 그에 한정되는 것은 아니고, 가중치 및 상관 관계 사이에는 다양한 방식의 비례 관계가 적용될 수 있다.The apparatus according to the present disclosure may derive a weight for text data from a correlation between a plurality of content and text data. For each text data, as the correlation increases, a method of setting a high weight for the text data may be employed. As an example, the weight may be linearly derived from the correlation, but is not limited thereto, and a proportional relationship of various methods may be applied between the weight and the correlation.
본 개시에 따른 장치는 텍스트 데이터에 대한 가중치에 기초하여 선호도를 계산할 수 있다. 높은 가중치의 텍스트 데이터는 높은 비중으로 반영되고, 낮은 가중치의 텍스트 데이터는 낮은 비중으로 반영되는 방식으로 선호도가 계산될 수 있다. 예를 들면, 본 개시에 따른 장치는, 특정 컨텐츠에 대한 복수 개의 텍스트 데이터에 있어서, 각각의 텍스트 데이터에 포함되는 부정적인 형태소 대비 긍정적인 형태소의 비율에 해당 텍스트 데이터의 가중치를 적용하는 방식으로 특정 컨텐츠에 대한 선호도를 계산할 수 있다. 다만 이에 한정되는 것은 아니고, 복수의 컨텐츠 각각에 대한 선호도를 계산하기 위한 다양한 방식이 채용될 수 있다.The device according to the present disclosure may calculate the preference based on the weight for text data. Preference can be calculated in such a way that text data of high weight is reflected in high weight and text data of low weight is reflected in low weight. For example, according to the present disclosure, in a plurality of text data for a specific content, the specific content is obtained by applying a weight of the corresponding text data to a ratio of a positive morpheme to a negative morpheme included in each text data. You can calculate your preference for. However, the present invention is not limited thereto, and various methods for calculating preferences for each of a plurality of contents may be employed.
단계 150에서, 본 개시에 따른 장치는 선호도에 기초하여 복수의 컨텐츠 중 적어도 하나를 교육 자료로 선별할 수 있다. 예를 들면, 본 개시에 따른 장치는 복수의 컨텐츠를 각각의 선호도 순으로 정렬하여 상위 특정 개수 또는 특정 비율에 해당하는 개수의 컨텐츠를 교육 자료로 선별할 수 있다.In
복수의 컨텐츠로부터 교육 자료가 선별되는 과정에서, 복수의 컨텐츠에 대한 정량적 분석 결과 외에도 정성적 분석 결과까지 함께 고려될 수 있어, 보다 정확한 교육 자료의 선별이 가능할 수 있다.In the course of selecting educational materials from a plurality of contents, in addition to quantitative analysis results of a plurality of contents, qualitative analysis results may be considered together, so that more accurate selection of educational materials may be possible.
또한, 복수의 컨텐츠로부터 교육 자료가 선별되는 과정에서, 복수의 컨텐츠 및 텍스트 데이터 사이의 상관 관계 및 그로부터 도출되는 가중치가 활용될 수 있어, 선호도가 보다 정교하게 계산될 수 있고, 그에 따라 교육 자료가 선별되는 성능 또한 개선될 수 있다.In addition, in a process in which educational materials are selected from a plurality of contents, a correlation between a plurality of contents and text data and weights derived therefrom can be utilized, so that preferences can be more precisely calculated, and accordingly, educational materials Screening performance can also be improved.
한편, 본 개시에 따른 특정 분야에 관하여 특정 집단을 교육하기 위한 교육 자료를 수집하는 방법은 그 방법을 실행하는 명령어들을 포함하는 하나 이상의 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체에 기록될 수 있다.Meanwhile, a method of collecting educational materials for educating a specific group with respect to a specific field according to the present disclosure may be recorded in a computer-readable recording medium in which one or more programs including instructions for executing the method are recorded. .
컴퓨터로 읽을 수 있는 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함될 수 있다. 프로그램 명령어의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드가 포함될 수 있다.Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs, DVDs, and floptical disks. Hardware devices specifically configured to store and execute program instructions, such as magneto-optical media, and ROM, RAM, flash memory, and the like, may be included. Examples of program instructions may include high-level language code that can be executed by a computer using an interpreter, etc., as well as machine language codes made by a compiler.
도 2는 일부 실시예에 따른 특정 분야에 관하여 특정 집단을 교육하기 위한 교육 자료를 수집하는 방법을 구현하는 구체적인 예시를 설명하기 위한 도면이다.2 is a view for explaining a specific example of implementing a method of collecting educational materials for educating a specific group in a specific field according to some embodiments.
도 2를 참조하면, 소프트웨어 또는 프로그래밍 분야에 관하여, 해당 분야의 비전공자에 해당하는 영문학과 학생들을 교육하기 위한 교육 자료를 수집하는 과정이 도시되어 있다.Referring to Figure 2, with respect to the software or programming field, there is shown the process of collecting educational materials for educating students of English literature corresponding to the non-major in the field.
단계 210에서, 특정 집단에 관한 데이터 중 특정 분야와 관련되는 데이터를 분석 대상 데이터로 분류하는 단계 및 분석 대상 데이터에 대한 검색을 통해 매체(media)로부터 분석 대상 데이터와 관련되는 복수의 컨텐츠(contents)를 수집하는 단계의 예시가 제시되어 있다.In
단계 220 및 230에서, 복수의 컨텐츠를 분석하는 단계, 분석 결과로부터 복수의 컨텐츠 각각에 대한 선호도를 계산하는 단계, 및 선호도에 기초하여 복수의 컨텐츠 중 적어도 하나를 교육 자료로 선별하는 단계의 예시가 제시되어 있다.In
도 3은 일부 실시예에 따른 특정 분야에 관하여 특정 집단을 교육하기 위한 교육 자료를 수집하는 방법의 효과를 설명하기 위한 그래프들을 나타내는 도면이다.3 is a diagram illustrating graphs for explaining the effect of a method of collecting educational materials for educating a specific group with respect to a specific field according to some embodiments.
도 3을 참조하면, 소프트웨어 또는 프로그래밍 분야에 관하여, 해당 분야의 비전공자에 해당하는 영문학과 학생들을 교육하기 위한 교육 자료를 수집하여 한 학기 동안 수업을 진행한 결과가 도시되어 있다. 한 학기 동안의 수업은 80 여명의 영문학과 학생들을 대상으로 수행되었고, 도 3의 자료들은 수업에 대한 강의 평가 데이터를 기반으로 제작되었다.Referring to FIG. 3, with respect to the software or programming field, the results of the course for a semester are shown by collecting educational materials for educating students of English literature corresponding to non-majors in the field. Classes during one semester were conducted for 80 English department students, and the materials in FIG. 3 were produced based on lecture evaluation data for the classes.
그래프 310, 320 및 330에는 각각 강의에 대한 이해도, 본 강의의 주당 공부 시간 및 취업후 업무능력 관련 효과에 대한 생각에 관한 강의 평가 결과가 도시되어 있다. 남학생보다 여학생이 많은 영문학과의 특성 및 소프트웨어와 프로그래밍 분야는 남학생이 보다 익숙하게 학습하는 경향을 고려할 때, 본 개시에 다른 방법으로 교육 자료를 수집하여 교육을 진행한 결과 남학생보다 여학생으로부터 보다 높은 강의 이해도 등이 확인된다는 점에서, 본 개시에 다른 방법이 비전공자를 교육하기 위해 효율적일 수 있음이 확인될 수 있다.
그래프 340에는 강의에 대한 만족도에 관한 강의 평가 결과가 도시되어 있다. 만족에 해당하는 표본의 개수가 불만에 해당하는 표본의 개수보다 높다는 점에서, 본 개시에 따른 방법에 의한 교육 자료를 활용한 교육이 비전공자를 대상으로 했음에도 불구하고 전반적으로 적절하게 수행되었음이 확인될 수 있다.
도 4는 일부 실시예에 따른 특정 분야에 관하여 특정 집단을 교육하기 위한 교육 자료를 수집하는 장치를 구성하는 요소들을 나타내는 블록도이다.4 is a block diagram showing elements constituting an apparatus for collecting educational materials for educating a specific group in a specific field according to some embodiments.
도 4를 참조하면, 특정 분야에 관하여 특정 집단을 교육하기 위한 교육 자료를 수집하는 장치(400)는 메모리(410) 및 프로세서(420)를 포함할 수 있다. 다만 도 4에 도시되는 구성 요소들 외에도, 범용적인 구성 요소들이 장치(400)에 더 포함될 수 있다.Referring to FIG. 4, an
장치(400)는 도 1을 통해 설명된 본 개시에 따른 방법을 수행하는 장치에 대응될 수 있다. 따라서, 장치(400)에 대하여 일부 설명이 생략되는 경우에도, 도 1을 통해 설명된 본 개시에 따른 방법을 수행하는 장치에 대한 설명은 장치(400)에 대해서도 동일하게 적용될 수 있다.The
메모리(410)는 적어도 하나의 프로그램을 저장할 수 있다. 메모리(410)는 프로세서(420)에서 처리된 데이터들 및 처리될 데이터들을 저장할 수 있다. 특히, 메모리(410)는 장치(400)가 수행하는 특정 분야에 관하여 특정 집단을 교육하기 위한 교육 자료를 수집하는 방법을 구현하기 위한 적어도 하나의 프로그램을 저장할 수 있다.The
메모리는 DRAM(dynamic random access memory), SRAM(static random access memory), ROM(read-only memory), EEPROM(electrically erasable programmable read-only memory), CD-ROM, 블루레이 디스크(blu-ray disc), HDD(hard disk drive), SSD(solid state drive) 또는 플래시 메모리로 구현될 수 있으나, 이에 한정되는 것은 아니다.The memory includes dynamic random access memory (DRAM), static random access memory (SRAM), read-only memory (ROM), electrically erasable programmable read-only memory (EEPROM), CD-ROM, and blu-ray disc. , A hard disk drive (HDD), a solid state drive (SSD), or a flash memory, but is not limited thereto.
프로세서(420)는 다수의 논리 게이트들의 어레이로 구현될 수 있고, 범용적인 마이크로 프로세서와 마이크로 프로세서에서 실행될 수 있는 프로그램이 저장된 메모리의 조합으로 구현될 수도 있다. 또한, 프로세서(420)는 복수 개의 프로세싱 엘리먼트들(processing elements)로 구성될 수도 있다.The
프로세서(420)는 메모리(410)에 저장되는 적어도 하나의 프로그램을 실행함으로써 특정 분야에 관하여 특정 집단을 교육하기 위한 교육 자료를 수집하는 방법을 구현할 수 있다. 구체적으로, 프로세서(420)는 특정 집단에 관한 데이터 중 특정 분야와 관련되는 데이터를 분석 대상 데이터로 분류하고, 분석 대상 데이터에 대한 검색을 통해 매체(media)로부터 분석 대상 데이터와 관련되는 복수의 컨텐츠(contents)를 수집하고, 복수의 컨텐츠를 분석하고, 분석 결과로부터 복수의 컨텐츠 각각에 대한 선호도를 계산하고, 선호도에 기초하여 복수의 컨텐츠 중 적어도 하나를 교육 자료로 선별할 수 있다.The
이상에서 실시예들에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속한다.Although the embodiments have been described in detail above, the scope of the present invention is not limited to this, and various modifications and improvements of those skilled in the art using the basic concept of the present invention defined in the following claims are also provided. Belongs to
400: 교육 자료를 수집하는 장치
410: 메모리
420: 프로세서400: a device for collecting educational materials
410: memory
420: processor
Claims (9)
상기 특정 집단에 관한 데이터 중 상기 특정 분야와 관련되는 데이터를 분석 대상 데이터로 분류하는 단계;
상기 분석 대상 데이터에 대한 검색을 통해 매체(media)로부터 상기 분석 대상 데이터와 관련되는 복수의 컨텐츠(contents)를 수집하는 단계;
상기 복수의 컨텐츠를 분석하는 단계;
상기 분석 결과로부터 상기 복수의 컨텐츠 각각에 대한 선호도를 계산하는 단계; 및
상기 선호도에 기초하여 상기 복수의 컨텐츠 중 적어도 하나를 상기 교육 자료로 선별하는 단계를 포함하는, 방법.In the method of collecting educational materials to educate a specific group on a specific field,
Classifying data related to the specific field among data related to the specific group as data to be analyzed;
Collecting a plurality of contents related to the analysis target data from a medium through a search for the analysis target data;
Analyzing the plurality of contents;
Calculating preferences for each of the plurality of contents from the analysis result; And
And selecting at least one of the plurality of contents as the educational material based on the preference.
상기 분석하는 단계는,
상기 복수의 컨텐츠를 정량적(quantitative)으로 분석하는 단계; 및
상기 복수의 컨텐츠를 정성적(qualitative)으로 분석하는 단계를 포함하는, 방법.According to claim 1,
The analyzing step,
Quantitatively analyzing the plurality of contents; And
And qualitatively analyzing the plurality of contents.
상기 정량적으로 분석하는 단계는,
상기 복수의 컨텐츠에 대한 통계적인 데이터를 분석하는 단계를 포함하는, 방법.According to claim 2,
The quantitative analysis step,
And analyzing statistical data for the plurality of content.
상기 정성적으로 분석하는 단계는,
상기 복수의 컨텐츠를 평가하기 위한 텍스트 데이터(text data)에 대한 자연어 처리(natural language processing)를 수행하는 단계를 포함하는, 방법.According to claim 2,
The qualitatively analyzing step,
And performing natural language processing on text data for evaluating the plurality of contents.
상기 자연어 처리를 수행하는 단계는,
상기 텍스트 데이터에 대한 기계 학습(machine learning)을 수행하는 단계를 포함하는, 방법.The method of claim 4,
The step of performing the natural language processing,
And performing machine learning on the text data.
상기 자연어 처리를 수행하는 단계는,
상기 텍스트 데이터에 대한 형태소 분석(morpheme analysis)을 수행함으로써 상기 텍스트 데이터로부터 상기 복수의 컨텐츠에 대한 긍정적인 형태소 및 부정적인 형태소를 추출하는 단계를 포함하는, 방법.The method of claim 4,
The step of performing the natural language processing,
And extracting positive and negative morphemes for the plurality of contents from the text data by performing morpheme analysis on the text data.
상기 선호도를 계산하는 단계는,
상기 복수의 컨텐츠 및 상기 텍스트 데이터 사이의 상관 관계(correlation)로부터 도출되는 상기 텍스트 데이터에 대한 가중치(weight)에 기초하여 상기 선호도를 계산하는 단계를 포함하는, 방법.The method of claim 4,
The step of calculating the preference,
And calculating the preference based on a weight for the text data derived from a correlation between the plurality of content and the text data.
상기 특정 분야는 소프트웨어(software) 분야 및 프로그래밍(programming) 분야 중 적어도 하나를 포함하는, 방법.According to claim 1,
The specific field includes at least one of a software field and a programming field.
적어도 하나의 프로그램을 저장하는 메모리; 및
상기 적어도 하나의 프로그램을 실행함으로써 상기 교육 자료를 수집하는 프로세서를 포함하고,
상기 프로세서는,
상기 특정 집단에 관한 데이터 중 상기 특정 분야와 관련되는 데이터를 분석 대상 데이터로 분류하고,
상기 분석 대상 데이터에 대한 검색을 통해 매체(media)로부터 상기 분석 대상 데이터와 관련되는 복수의 컨텐츠(contents)를 수집하고,
상기 복수의 컨텐츠를 분석하고,
상기 분석 결과로부터 상기 복수의 컨텐츠 각각에 대한 선호도를 계산하고,
상기 선호도에 기초하여 상기 복수의 컨텐츠 중 적어도 하나를 상기 교육 자료로 선별하는, 장치.A device for collecting educational materials to educate a specific group on a specific field,
A memory storing at least one program; And
And a processor for collecting the training material by executing the at least one program,
The processor,
Among the data related to the specific group, data related to the specific field is classified as analysis target data,
Collecting a plurality of contents related to the analysis target data from the media through a search for the analysis target data,
Analyzing the plurality of contents,
The preferences for each of the plurality of contents are calculated from the analysis results,
And selecting at least one of the plurality of contents as the educational material based on the preference.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190000860A KR102211075B1 (en) | 2019-01-03 | 2019-01-03 | Method and apparatus for collecting educational materials |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190000860A KR102211075B1 (en) | 2019-01-03 | 2019-01-03 | Method and apparatus for collecting educational materials |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200084694A true KR20200084694A (en) | 2020-07-13 |
KR102211075B1 KR102211075B1 (en) | 2021-02-02 |
Family
ID=71570654
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190000860A KR102211075B1 (en) | 2019-01-03 | 2019-01-03 | Method and apparatus for collecting educational materials |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102211075B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220010109A (en) * | 2020-07-17 | 2022-01-25 | 윤종식 | Server and method for providing charge-free lerning curation service |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140008732A (en) * | 2012-07-11 | 2014-01-22 | 한국전자통신연구원 | Personalized content searching apparatus and method based on user's comment |
KR20140046196A (en) * | 2012-10-10 | 2014-04-18 | 주식회사 유비온 | Method of providing adaptive learning guide |
KR20150002409A (en) | 2013-06-26 | 2015-01-07 | 숭실대학교산학협력단 | Method and apparatus for learning user preference |
KR101851890B1 (en) * | 2017-01-13 | 2018-06-07 | 군산대학교산학협력단 | Method for analyzing digital content |
KR20180096341A (en) | 2017-02-21 | 2018-08-29 | 전북대학교산학협력단 | System for implementing educational contents social curator based on ontology supporting mooc and flipped learning on social platform and method thereof |
-
2019
- 2019-01-03 KR KR1020190000860A patent/KR102211075B1/en active IP Right Grant
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140008732A (en) * | 2012-07-11 | 2014-01-22 | 한국전자통신연구원 | Personalized content searching apparatus and method based on user's comment |
KR20140046196A (en) * | 2012-10-10 | 2014-04-18 | 주식회사 유비온 | Method of providing adaptive learning guide |
KR20150002409A (en) | 2013-06-26 | 2015-01-07 | 숭실대학교산학협력단 | Method and apparatus for learning user preference |
KR101851890B1 (en) * | 2017-01-13 | 2018-06-07 | 군산대학교산학협력단 | Method for analyzing digital content |
KR20180096341A (en) | 2017-02-21 | 2018-08-29 | 전북대학교산학협력단 | System for implementing educational contents social curator based on ontology supporting mooc and flipped learning on social platform and method thereof |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220010109A (en) * | 2020-07-17 | 2022-01-25 | 윤종식 | Server and method for providing charge-free lerning curation service |
Also Published As
Publication number | Publication date |
---|---|
KR102211075B1 (en) | 2021-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Akçapınar et al. | Developing an early-warning system for spotting at-risk students by using eBook interaction logs | |
Vaibhav et al. | Do sentence interactions matter? leveraging sentence level representations for fake news classification | |
Hautea et al. | Youth perspectives on critical data literacies | |
Rosé et al. | Analyzing collaborative learning processes automatically: Exploiting the advances of computational linguistics in computer-supported collaborative learning | |
Anoopkumar et al. | A Review on Data Mining techniques and factors used in Educational Data Mining to predict student amelioration | |
Peña-Ayala | Educational data mining: A survey and a data mining-based analysis of recent works | |
Brahim | Predicting student performance from online engagement activities using novel statistical features | |
Ruiz et al. | Towards the development of a learning analytics extension in open edX | |
Yang et al. | Asking the right question in collaborative q&a systems | |
Gurcan et al. | Analysis of software engineering industry needs and trends: Implications for education | |
Biehler et al. | Introducing students to machine learning with decision trees using CODAP and Jupyter Notebooks | |
Oeda et al. | Log-data clustering analysis for dropout prediction in beginner programming classes | |
CN109977230B (en) | Selected question error cause analysis method suitable for adaptive teaching | |
Yunita et al. | Research review on big data usage for learning analytics and educational data mining: A way forward to develop an intelligent automation system | |
Hornbæk et al. | Comparison of techniques for matching of usability problem descriptions | |
CN109729348B (en) | Method, device and equipment for determining video quality | |
Taskin et al. | Characterizing comment types and levels of engagement in video-based learning as a basis for adaptive nudging | |
Khalil | Learning analytics in massive open online courses | |
KR102675005B1 (en) | Method and Apparatus for Providing Knowledge Compass Service | |
Grönberg et al. | Palaute: An online text mining tool for analyzing written student course feedback | |
Hamim et al. | Student profile modeling using boosting algorithms | |
Almatrafi et al. | Improving MOOCs using information from discussion forums: An opinion summarization and suggestion mining approach | |
Ibrahim et al. | Mining unit feedback to explore students’ learning experiences | |
Dhamecha et al. | Balancing human efforts and performance of student response analyzer in dialog-based tutors | |
KR102211075B1 (en) | Method and apparatus for collecting educational materials |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
AMND | Amendment | ||
E601 | Decision to refuse application | ||
X091 | Application refused [patent] | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |