KR20190140599A - Method and system for filtering user channel contents by a business producer - Google Patents

Method and system for filtering user channel contents by a business producer Download PDF

Info

Publication number
KR20190140599A
KR20190140599A KR1020180067242A KR20180067242A KR20190140599A KR 20190140599 A KR20190140599 A KR 20190140599A KR 1020180067242 A KR1020180067242 A KR 1020180067242A KR 20180067242 A KR20180067242 A KR 20180067242A KR 20190140599 A KR20190140599 A KR 20190140599A
Authority
KR
South Korea
Prior art keywords
content
filtering
item
server
information
Prior art date
Application number
KR1020180067242A
Other languages
Korean (ko)
Other versions
KR102072738B1 (en
Inventor
임철재
Original Assignee
엔에이치엔 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔 주식회사 filed Critical 엔에이치엔 주식회사
Priority to KR1020180067242A priority Critical patent/KR102072738B1/en
Publication of KR20190140599A publication Critical patent/KR20190140599A/en
Application granted granted Critical
Publication of KR102072738B1 publication Critical patent/KR102072738B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Computational Linguistics (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

The present invention relates to a method for filtering user channel content by a business producer and a system thereof. The method for filtering user channel content by a filtering server implemented by a computer can comprise the steps of: receiving information related to content; analyzing the information related to the received content based on a preset item; scoring each item related to the content according as the content is analyzed; and filtering content based on the scored value for each item.

Description

비지니스 생산자에 의한 사용자 채널 컨텐츠 필터링 방법 및 시스템{METHOD AND SYSTEM FOR FILTERING USER CHANNEL CONTENTS BY A BUSINESS PRODUCER}Method and system for filtering user channel contents by business producers {METHOD AND SYSTEM FOR FILTERING USER CHANNEL CONTENTS BY A BUSINESS PRODUCER}

아래의 설명은 정보 제공 기술에 관한 것으로, 컨텐츠 분류 방법 및 시스템에 관한 것이다. The following description relates to information providing technology, and to a content classification method and system.

인터넷 보급과 정보통신기술 발전이 급속도로 이루어짐에 따라 인터넷을 이용한 다양한 서비스가 제공되고 있다. 일례로, 사용자들은 블로그, 유튜브 또는 SNS와 같은 특정 서비스를 통하여 사용자만의 컨텐츠를 제작하여 게시함으로써 다른 사용자에게 정보를 제공하거나 정보를 공유하고 있다.With the rapid spread of the Internet and the development of information and communication technology, various services using the Internet are provided. For example, users create and publish their own content through a specific service such as blog, YouTube or SNS to provide information or share information with other users.

또한, 인터넷을 기반으로 한 전자상거래(electronic commerce)가 보편화되고 있다. 이러한 전자상거래의 대표적인 예로는 B2C(Business-to-Consumer)라 불리는 기업 대 소비자 간 전자상거래를 꼽을 수 있으며, 이는 인터넷을 매개로 공급자와 소비자 간에 진행되는 모든 형태의 전자적 거래를 총칭한다. In addition, electronic commerce based on the Internet is becoming popular. An example of such e-commerce is a business-to-consumer electronic commerce called B2C (Business-to-Consumer), which refers to all types of electronic transactions between suppliers and consumers via the Internet.

초기의 블로그와 같은 유저 컨텐츠는 사용자가 자신의 경험을 바탕으로 자료 및 정보를 제공해주는 것에 초점이 맞춰져 있던 것과 달리, 점차 B2C 모델에서 마케팅이 어려워지자 C2C 모델 중 하나인 블로깅 홍보가 시작되었다. 컨텐츠를 이용한 마케팅이 활성화되면서 컨텐츠의 채널 자체는 사용자이지만 생산자는 회사나 단체가 되어버렸으며, 순수한 의도의 정보 제공에서 홍보의 채널로 변질되면서 진정한 사용자에 경험을 둔 블로그나 컨텐츠를 찾기가 어려워졌다.In the early days, user content such as blogs focused on providing users with materials and information based on their own experiences, and as marketing became more difficult in the B2C model, blogging promotion, one of the C2C models, began. As marketing using content is active, the content channel itself is a user, but the producer has become a company or a group, and it has become difficult to find a blog or content with a genuine user experience as it is changed from purely intentional information to a channel of promotion. .

이에 따라 컨텐츠를 필터링하여 실제 사용자가 작성하였을 것 같은 정보 제공 목적의 컨텐츠를 엄선해주는 기술이 요구되고 있다.Accordingly, there is a demand for a technology that filters content and selects content for informational purposes that may be created by a real user.

인터넷에서 제공되는 많은 양의 정보들 중 사용자로부터 작성된 컨텐츠를 필터링하는 방법 및 시스템을 제공할 수 있다. 구체적으로, 컨텐츠와 관련된 정보를 여러 항목에 기초하여 분석을 수행함에 따라 분석 결과를 각각의 점수화하여 컨텐츠를 필터링하는 방법 및 시스템을 제공할 수 있다. A method and system for filtering content created from a user among a large amount of information provided on the Internet can be provided. In detail, as the analysis of information related to the content is performed based on various items, a method and a system for filtering the content by scoring the analysis result may be provided.

컴퓨터로 구현되는 필터링 서버에 의해 수행되는 컨텐츠 필터링 방법은, 컨텐츠와 관련된 정보를 수신하는 단계; 상기 수신된 컨텐츠와 관련된 정보를 기 설정된 항목에 기초하여 분석하는 단계; 상기 컨텐츠의 분석을 수행함에 따라 상기 컨텐츠와 관련된 각각의 항목에 대하여 점수화하는 단계; 및 상기 각각의 항목에 대하여 점수화한 값에 기반하여 컨텐츠를 필터링하는 단계를 포함할 수 있다. Content filtering method performed by a computer-implemented filtering server, receiving information related to the content; Analyzing the information related to the received content based on a preset item; Scoring each item associated with the content as the analysis of the content is performed; And filtering the content based on the scored value for each item.

상기 수신된 컨텐츠와 관련된 정보를 기 설정된 항목에 기초하여 분석하는 단계는, 상기 컨텐츠에 대한 중복 검사, 상기 컨텐츠에 대한 필터링 검사, 상기 컨텐츠의 업데이트 검사, 상기 컨텐츠의 신고 여부 검사, 상기 컨텐츠의 IP 추적 검사 중 적어도 두 개 이상의 항목에 기초하여 컨텐츠의 분석을 수행하는 단계를 포함할 수 있다.The analyzing of the information related to the received content based on a preset item may include: duplicate inspection of the contents, filtering inspection of the contents, update inspection of the contents, inspection of whether the contents are reported, and IP of the contents. The method may include analyzing the content based on at least two items of the tracking check.

상기 수신된 컨텐츠와 관련된 정보를 기 설정된 항목에 기초하여 분석하는 단계는, 상기 컨텐츠에 포함된 정보를 해싱함에 따라 획득된 해시정보와 기 저장된 컨텐츠의 해시정보를 매칭시켜 유사도를 판단하여 중복 검사를 수행하는 단계를 포함할 수 있다. The analyzing of the information related to the received content based on a preset item may include matching the hash information obtained by hashing the information included in the content with the hash information of the pre-stored content to determine similarity, and to perform duplicate inspection. It may include the step of performing.

상기 수신된 컨텐츠와 관련된 정보를 기 설정된 항목에 기초하여 분석하는 단계는, 상기 컨텐츠에 기재된 단어, 문장, 어구, 문단 또는 상기 컨텐츠에 포함된 이미지 중 적어도 하나 이상을 포함하는 컨텐츠에 포함된 정보를 해싱함에 따라 코드화된 해시정보와 상기 기 저정된 컨텐츠의 해시정보를 매칭한 매칭결과가 기 설정된 기준 이상의 매칭률인지 여부를 판단하는 단계를 포함할 수 있다.The analyzing of the information related to the received content based on a preset item may include: information included in content including at least one of a word, a sentence, a phrase, a paragraph, or an image included in the content. The method may include determining whether a matching result of matching the encoded hash information and the hash information of the predetermined content according to hashing is a matching rate higher than or equal to a preset criterion.

상기 수신된 컨텐츠와 관련된 정보를 기 설정된 기준항목에 기초하여 분석하는 단계는, 상기 컨텐츠에 기재된 단어, 상기 컨텐츠에 기재된 문장, 상기 컨텐츠에 기재된 어구, 상기 컨텐츠에 기재된 문단 또는 상기 컨텐츠에 포함된 이미지 중 적어도 하나 이상을 포함하는 컨텐츠에 포함된 정보를 해시함에 따라 코드화된 해시정보를 저장하는 단계를 포함할 수 있다. The analyzing of the information related to the received content based on a predetermined reference item may include: a word written in the content, a sentence written in the content, a phrase written in the content, a paragraph written in the content, or an image included in the content. Storing hash information encoded according to hashing information included in content including at least one of the contents.

상기 수신된 컨텐츠와 관련된 정보를 기 설정된 기준항목에 기초하여 분석하는 단계는, 상기 컨텐츠를 주기적으로 작성하는 사용자 계정, 상기 컨텐츠를 기 설정된 기준 이상으로 컨텐츠를 생산하는 사용자 계정, 상기 컨텐츠의 업데이트 주기가 기 설정된 시간 이하인 사용자 계정 또는 상기 컨텐츠의 업데이트의 주기가 기 설정된 시간 이하이고 기 설정된 기준 이상의 컨텐츠를 생산하는 사용자 계정 중 어느 하나 이상의 사용자 계정과 관련된 컨텐츠를 판단하는 단계를 포함할 수 있다. The analyzing of the information related to the received content based on a predetermined reference item may include: a user account for periodically creating the content, a user account for producing the content over a preset criterion, and an update period of the content. The method may include determining a content associated with any one or more user accounts of a user account that is less than or equal to a preset time or a user account that is less than or equal to a preset time and produces content that is greater than or equal to a predetermined reference.

상기 식별된 컨텐츠와 관련된 정보를 기 설정된 기준항목에 기초하여 분석하는 단계는, 상기 컨텐츠의 IP 대역대를 추적함에 따라 기 저장된 IP 주소와 상기 식별된 IP 대역대의 매칭 여부를 판단하는 단계를 포함할 수 있다. The analyzing of the information related to the identified content based on a preset reference item may include determining whether to match a pre-stored IP address with the identified IP band according to the IP band of the content. Can be.

상기 컨텐츠의 분석을 수행함에 따라 상기 컨텐츠와 관련된 각각의 항목에 대하여 점수화하는 단계는, 상기 컨텐츠에 부여된 점수에 기초하여 각각의 항목에 대한 분석 결과에 따라 점수를 감산 또는 가산하는 단계를 포함할 수 있다. The scoring of each item related to the content as the content is analyzed may include subtracting or adding a score according to an analysis result of each item based on a score assigned to the content. Can be.

상기 각각의 항목에 대하여 점수화한 값에 기반하여 컨텐츠를 필터링하는 단계는, 상기 각각의 항목에 대하여 점수화한 값을 가산한 종합점수가 기 설정된 기준값 이하일 경우, 상기 컨텐츠를 필터링하는 단계를 포함할 수 있다. The filtering of the content based on the scored value for each item may include filtering the content when the total score obtained by adding the scored value for each item is less than or equal to a preset reference value. have.

상기 각각의 항목에 대하여 점수화한 값에 기반하여 컨텐츠를 필터링하는 단계는, 상기 컨텐츠의 노출을 제거하거나, 상기 컨텐츠가 일정 기간동안 업로드되는 횟수의 평균 또는 상기 컨텐츠가 일정기간 동안 카운팅되는 최저횟수를 제한하는 단계를 포함할 수 있다. The filtering of the content based on the scored value for each item may include removing an exposure of the content, an average of the number of times the content is uploaded for a predetermined period, or a minimum number of times the content is counted for a predetermined period. It may comprise the step of limiting.

컴퓨터로 구현되는 컨텐츠를 필터링하는 서버는, 컨텐츠와 관련된 정보를 수신하는 수신부; 상기 수신된 컨텐츠와 관련된 정보를 기 설정된 항목에 기초하여 분석하는 분석부; 상기 컨텐츠의 분석을 수행함에 따라 상기 컨텐츠와 관련된 각각의 항목에 대하여 점수화하는 점수 부여부; 및 상기 각각의 항목에 대하여 점수화한 값에 기반하여 컨텐츠를 필터링하는 필터링부를 포함할 수 있다. The server for filtering content implemented by a computer may include: a receiver configured to receive information related to the content; An analysis unit for analyzing the information related to the received content based on a preset item; A score assigning unit for scoring each item related to the content as the content is analyzed; And a filtering unit for filtering content based on the scored value for each item.

컨텐츠 필터링을 통하여 불필요한 컨텐츠를 제거하여 사용자로부터 실제로 작성된 컨텐츠를 제공할 수 있다.Through content filtering, unnecessary content may be removed to provide the actually created content from the user.

상업적인 의도로 작성된 컨텐츠의 노출을 감소시키고 컨텐츠의 질을 향상시킬 수 있다.It is possible to reduce the exposure and improve the quality of the content that is created for commercial purposes.

컨텐츠와 관련된 정보를 분석한 분석 결과를 각각의 점수화함에 따라 반영된 점수값에 기초하여 실시간으로 컨텐츠를 필터링할 수 있다. As each analysis result of analyzing the information related to the content is scored, the content may be filtered in real time based on the reflected score value.

도 1은 일 실시예에 따른 네트워크 환경의 예를 도시한 도면이다.
도 2는 일 실시예에 따른 전자 기기 및 서버의 내부 구성을 설명하기 위한 블록도이다.
도 3은 일 실시예에 따른 필터링 서버의 프로세서가 포함할 수 있는 구성 요소의 예를 도시한 블록도이다.
도 4는 일 실시예에 따른 필터링 서버에서 수행되는 컨텐츠 필터링 방법을 설명하기 위한 흐름도이다.
도 5는 일 실시예에 따른 필터링 서버에서 컨텐츠를 필터링하는 동작을 설명하기 위한 도면이다.
도 6은 일 실시예에 따른 필터링 서버에서 각각의 컨텐츠에 점수를 부여하는 것을 설명하기 위한 도면이다.
도 7은 일 실시예에 따른 필터링 서버에서 컨텐츠를 분석하는 방법을 설명하기 위한 예이다.
1 is a diagram illustrating an example of a network environment according to an embodiment.
2 is a block diagram illustrating an internal configuration of an electronic device and a server according to an exemplary embodiment.
3 is a block diagram illustrating an example of components that may be included in a processor of a filtering server according to an exemplary embodiment.
4 is a flowchart illustrating a content filtering method performed by a filtering server according to an exemplary embodiment.
5 is a diagram for describing an operation of filtering content in a filtering server, according to an exemplary embodiment.
6 is a diagram illustrating an example of assigning a score to each content in the filtering server according to an exemplary embodiment.
7 is an example for describing a method of analyzing content in a filtering server, according to an exemplary embodiment.

이하, 실시예를 첨부한 도면을 참조하여 상세히 설명한다.Hereinafter, exemplary embodiments will be described in detail with reference to the accompanying drawings.

도 1은 일 실시예에 따른 네트워크 환경의 예를 도시한 도면이다.1 is a diagram illustrating an example of a network environment according to an embodiment.

도 1의 네트워크 환경은 복수의 전자 기기들(110, 120, 130, 140), 복수의 서버들(150, 160) 및 네트워크(170)를 포함하는 예를 나타내고 있다. 이러한 도 1은 발명의 설명을 위한 일례로 전자 기기의 수나 서버의 수가 도 1과 같이 한정되는 것은 아니다. The network environment of FIG. 1 illustrates an example including a plurality of electronic devices 110, 120, 130, and 140, a plurality of servers 150 and 160, and a network 170. 1 is an example for describing the present invention, and the number of electronic devices or the number of servers is not limited as shown in FIG. 1.

복수의 전자 기기들(110, 120, 130, 140)은 컴퓨터 장치로 구현되는 고정형 단말이거나 이동형 단말일 수 있다. 복수의 전자 기기들(110, 120, 130, 140)의 예를 들면, 스마트폰(smart phone), 휴대폰, 네비게이션, 컴퓨터, 노트북, 디지털방송용 단말, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 태블릿 PC 등이 있다. 일례로 전자 기기 1(110)은 무선 또는 유선 통신 방식을 이용하여 네트워크(170)를 통해 다른 전자 기기들(120, 130, 140) 및/또는 서버(150, 160)와 통신할 수 있다. 실시예에서는 전자 기기는 클라이언트일 수 있다. The plurality of electronic devices 110, 120, 130, and 140 may be fixed terminals or mobile terminals implemented as computer devices. Examples of the plurality of electronic devices 110, 120, 130, and 140 include a smart phone, a mobile phone, a navigation device, a computer, a notebook computer, a digital broadcasting terminal, a personal digital assistant (PDA), and a portable multimedia player (PMP). Tablet PC). For example, the electronic device 1 110 may communicate with other electronic devices 120, 130, 140 and / or the server 150, 160 through a network 170 using a wireless or wired communication scheme. In an embodiment, the electronic device may be a client.

통신 방식은 제한되지 않으며, 네트워크(170)가 포함할 수 있는 통신망(일례로, 이동통신망, 유선 인터넷, 무선 인터넷, 방송망)을 활용하는 통신 방식뿐만 아니라 기기들간의 근거리 무선 통신 역시 포함될 수 있다. 예를 들어, 네트워크(170)는, PAN(personal area network), LAN(local area network), CAN(campus area network), MAN(metropolitan area network), WAN(wide area network), BBN(broadband network), 인터넷 등의 네트워크 중 하나 이상의 임의의 네트워크를 포함할 수 있다. 또한, 네트워크(170)는 버스 네트워크, 스타 네트워크, 링 네트워크, 메쉬 네트워크, 스타-버스 네트워크, 트리 또는 계층적(hierarchical) 네트워크 등을 포함하는 네트워크 토폴로지 중 임의의 하나 이상을 포함할 수 있으나, 이에 제한되지 않는다.The communication method is not limited, and may include not only a communication method using a communication network (for example, a mobile communication network, a wired internet, a wireless internet, a broadcasting network) that the network 170 may include, but also a short range wireless communication between devices. For example, the network 170 may include a personal area network (PAN), a local area network (LAN), a campus area network (CAN), a metropolitan area network (MAN), a wide area network (WAN), and a broadband network (BBN). And one or more of networks such as the Internet. The network 170 may also include any one or more of network topologies, including bus networks, star networks, ring networks, mesh networks, star-bus networks, trees, or hierarchical networks, but It is not limited.

서버(150, 160) 각각은 복수의 전자 기기들(110, 120, 130, 140)과 네트워크(170)를 통해 통신하여 명령, 코드, 파일, 컨텐츠, 서비스 등을 제공하는 컴퓨터 장치 또는 복수의 컴퓨터 장치들로 구현될 수 있다.Each of the servers 150 and 160 communicates with the plurality of electronic devices 110, 120, 130, and 140 through the network 170 to provide a command, code, file, content, service, or the like. It may be implemented in devices.

일례로, 서버(160)는 네트워크(170)를 통해 접속한 전자 기기 1(110)로 어플리케이션의 설치를 위한 파일을 제공할 수 있다. 이 경우 전자 기기 1(110)은 서버(160)로부터 제공된 파일을 이용하여 어플리케이션을 설치할 수 있다. 또한 전자 기기 1(110)이 포함하는 운영체제(Operating System, OS) 및 적어도 하나의 프로그램(일례로 브라우저나 상기 설치된 어플리케이션)의 제어에 따라 서버(150)에 접속하여 서버(150)가 제공하는 서비스나 컨텐츠를 제공받을 수 있다. 예를 들어, 전자 기기 1(110)이 어플리케이션의 제어에 따라 네트워크(170)를 통해 서비스 요청 메시지를 서버(150)로 전송하면, 서버(150)는 서비스 요청 메시지에 대응하는 코드를 전자 기기 1(110)로 전송할 수 있고, 전자 기기 1(110)은 어플리케이션의 제어에 따라 코드에 따른 화면을 구성하여 표시함으로써 사용자에게 컨텐츠를 제공할 수 있다.For example, the server 160 may provide a file for installing an application to the electronic device 1 110 connected through the network 170. In this case, the electronic device 1110 may install an application using a file provided from the server 160. In addition, a service provided by the server 150 by accessing the server 150 under the control of an operating system (OS) included in the electronic device 1 110 and at least one program (for example, a browser or the installed application). I can be provided with the content. For example, when the electronic device 1 110 transmits a service request message to the server 150 through the network 170 under the control of the application, the server 150 transmits a code corresponding to the service request message to the electronic device 1. The electronic device 1 110 may provide content to a user by configuring and displaying a screen according to a code under the control of an application.

도 2는 일 실시예에 따른 전자 기기 및 서버의 내부 구성을 설명하기 위한 블록도이다.2 is a block diagram illustrating an internal configuration of an electronic device and a server according to an exemplary embodiment.

도 2에서는 하나의 전자 기기에 대한 예로서 전자 기기 1(110), 그리고 하나의 서버에 대한 예로서 서버(150)의 내부 구성을 설명한다. 다른 전자 기기들(120, 130, 140)이나 서버(160)뿐만 아니라 도 1을 통해 설명한 네트워크 환경에 포함될 수 있는 또 다른 전자 기기들이나 또 다른 서버들에도 동일한 또는 유사한 내부 구성요소들이 적용될 수 있다. In FIG. 2, an internal configuration of the electronic device 1 110 as an example of one electronic device and the server 150 as an example of one server will be described. The same or similar internal components may be applied to other electronic devices 120, 130, 140 or server 160 as well as other electronic devices or other servers that may be included in the network environment described with reference to FIG. 1.

전자 기기 1(110)과 서버(150)는 메모리(211, 221), 프로세서(212, 222), 통신 모듈(213, 223) 그리고 입출력 인터페이스(214, 224)를 포함할 수 있다. 메모리(211, 221)는 컴퓨터에서 판독 가능한 기록 매체로서, RAM(random access memory), ROM(read only memory) 및 디스크 드라이브와 같은 비소멸성 대용량 기록장치(permanent mass storage device)를 포함할 수 있다. 또한, 메모리(211, 221)에는 운영체제와 적어도 하나의 프로그램 코드(일례로 전자 기기 1(110)에 설치되어 구동되는 브라우저나 상술한 어플리케이션 등을 위한 코드)가 저장될 수 있다. 이러한 소프트웨어 구성요소들은 드라이브 메커니즘(drive mechanism)을 이용하여 메모리(211, 221)와는 별도의 컴퓨터에서 판독 가능한 기록 매체로부터 로딩될 수 있다. 이러한 별도의 컴퓨터에서 판독 가능한 기록 매체는 플로피 드라이브, 디스크, 테이프, DVD/CD-ROM 드라이브, 메모리 카드 등의 컴퓨터에서 판독 가능한 기록 매체를 포함할 수 있다. 다른 실시예에서 소프트웨어 구성요소들은 컴퓨터에서 판독 가능한 기록 매체가 아닌 통신 모듈(213, 223)을 통해 메모리(211, 221)에 로딩될 수도 있다. 예를 들어, 적어도 하나의 프로그램은 개발자들 또는 어플리케이션의 설치 파일을 배포하는 파일 배포 시스템(일례로 상술한 서버(160))이 네트워크(170)를 통해 제공하는 파일들에 의해 설치되는 프로그램(일례로 상술한 어플리케이션)에 기반하여 메모리(211, 221)에 로딩될 수 있다.The electronic device 1 110 and the server 150 may include memories 211 and 221, processors 212 and 222, communication modules 213 and 223, and input / output interfaces 214 and 224. The memories 211 and 221 are computer-readable recording media, and may include non-volatile permanent storage devices such as random access memory (RAM), read only memory (ROM), and disk drives. In addition, the memory 211 and 221 may store an operating system and at least one program code (for example, a code installed for the browser or the above-described application or the like installed in the electronic device 1110). These software components may be loaded from a computer readable recording medium separate from the memories 211 and 221 using a drive mechanism. Such a separate computer-readable recording medium may include a computer-readable recording medium such as a floppy drive, a disk, a tape, a DVD / CD-ROM drive, a memory card, and the like. In other embodiments, software components may be loaded into the memory 211, 221 through the communication module 213, 223 rather than a computer readable recording medium. For example, the at least one program is a program installed by files provided by the file distribution system (for example, the server 160 described above) through the network 170 for distributing installation files of developers or applications (for example, It can be loaded into the memory (211, 221) based on the above-described application).

프로세서(212, 222)는 기본적인 산술, 로직 및 입출력 연산을 수행함으로써, 컴퓨터 프로그램의 명령을 처리하도록 구성될 수 있다. 명령은 메모리(211, 221) 또는 통신 모듈(213, 223)에 의해 프로세서(212, 222)로 제공될 수 있다. 예를 들어 프로세서(212, 222)는 메모리(211, 221)와 같은 기록 장치에 저장된 프로그램 코드에 따라 수신되는 명령을 실행하도록 구성될 수 있다.Processors 212 and 222 may be configured to process instructions of a computer program by performing basic arithmetic, logic, and input / output operations. Instructions may be provided to the processors 212, 222 by the memory 211, 221 or the communication modules 213, 223. For example, the processors 212 and 222 may be configured to execute a command received according to a program code stored in a recording device such as the memory 211 and 221.

통신 모듈(213, 223)은 네트워크(170)를 통해 전자 기기 1(110)과 서버(150)가 서로 통신하기 위한 기능을 제공할 수 있으며, 다른 전자 기기(일례로 전자 기기 2(120)) 또는 다른 서버(일례로 서버(160))와 통신하기 위한 기능을 제공할 수 있다. 일례로, 전자 기기 1(110)의 프로세서(212)가 메모리(211)와 같은 기록 장치에 저장된 프로그램 코드에 따라 생성한 요청(일례로 컨텐츠에 대한 스트리밍 서비스 요청)이 통신 모듈(213)의 제어에 따라 네트워크(170)를 통해 서버(150)로 전달될 수 있다. 역으로, 서버(150)의 프로세서(222)의 제어에 따라 제공되는 제어 신호나 명령, 컨텐츠, 파일 등이 통신 모듈(223)과 네트워크(170)를 거쳐 전자 기기 1(110)의 통신 모듈(213)을 통해 전자 기기 1(110)로 수신될 수 있다. 예를 들어 통신 모듈(213)을 통해 수신된 서버(150)의 제어 신호나 명령 등은 프로세서(212)나 메모리(211)로 전달될 수 있고, 컨텐츠나 파일 등은 전자 기기 1(110)가 더 포함할 수 있는 저장 매체로 저장될 수 있다.The communication modules 213 and 223 may provide a function for the electronic device 1 110 and the server 150 to communicate with each other through the network 170, and another electronic device (for example, the electronic device 2 120). Alternatively, it may provide a function for communicating with another server (eg, server 160). For example, a request (eg, a streaming service request for content) generated by the processor 212 of the electronic device 1 110 according to a program code stored in a recording device such as the memory 211 is controlled by the communication module 213. In accordance with the network 170 may be delivered to the server 150. Conversely, control signals, commands, contents, files, and the like provided according to the control of the processor 222 of the server 150 are transmitted to the communication module of the electronic device 1 110 via the communication module 223 and the network 170 ( It may be received by the electronic device 1110 through 213. For example, a control signal or a command of the server 150 received through the communication module 213 may be transmitted to the processor 212 or the memory 211, and the content or the file may be transmitted by the electronic device 1110. It may be stored as a storage medium that may further include.

입출력 인터페이스(214, 224)는 입출력 장치(215)와의 인터페이스를 위한 수단일 수 있다. 예를 들어, 입력 장치는 키보드 또는 마우스 등의 장치를, 그리고 출력 장치는 어플리케이션의 통신 세션을 표시하기 위한 디스플레이와 같은 장치를 포함할 수 있다. 다른 예로 입출력 인터페이스(214)는 터치스크린과 같이 입력과 출력을 위한 기능이 하나로 통합된 장치와의 인터페이스를 위한 수단일 수도 있다. 보다 구체적인 예로, 전자 기기 1(110)의 프로세서(212)는 메모리(211)에 로딩된 컴퓨터 프로그램의 명령을 처리함에 있어서 서버(150)나 전자 기기 2(120)가 제공하는 데이터를 이용하여 구성되는 서비스 화면이나 컨텐츠가 입출력 인터페이스(214)를 통해 디스플레이에 표시될 수 있다.The input / output interfaces 214 and 224 may be means for interfacing with the input / output device 215. For example, the input device may include a device such as a keyboard or mouse, and the output device may include a device such as a display for displaying a communication session of an application. As another example, the input / output interface 214 may be a means for interfacing with a device in which functions for input and output are integrated into one, such as a touch screen. As a more specific example, the processor 212 of the electronic device 1110 is configured using data provided by the server 150 or the electronic device 2 120 in processing a command of a computer program loaded in the memory 211. The service screen or the content may be displayed on the display through the input / output interface 214.

또한, 다른 실시예들에서 전자 기기 1(110) 및 서버(150)는 도 2의 구성요소들보다 더 많은 구성요소들을 포함할 수도 있다. 그러나, 대부분의 종래기술적 구성요소들을 명확하게 도시할 필요성은 없다. 예를 들어, 전자 기기 1(110)은 상술한 입출력 장치(215) 중 적어도 일부를 포함하도록 구현되거나 또는 트랜시버(transceiver), GPS(Global Positioning System) 모듈, 카메라, 각종 센서, 데이터베이스 등과 같은 다른 구성요소들을 더 포함할 수도 있다.Also, in other embodiments, the electronic device 1 110 and the server 150 may include more components than those of FIG. 2. However, it is not necessary to clearly show most of the prior art components. For example, the electronic device 1 110 may be implemented to include at least some of the above-described input / output devices 215 or other components such as a transceiver, a global positioning system (GPS) module, a camera, various sensors, a database, and the like. It may further include elements.

도 3은 일 실시예에 따른 필터링 서버의 프로세서가 포함할 수 있는 구성 요소의 예를 도시한 블록도이고, 도 4는 일 실시예에 따른 필터링 서버에서 수행되는 컨텐츠 필터링 방법을 설명하기 위한 흐름도이다.3 is a block diagram illustrating an example of a component that may be included in a processor of a filtering server according to an embodiment, and FIG. 4 is a flowchart illustrating a content filtering method performed by a filtering server according to an embodiment. .

필터링 서버의 프로세서(222)는 수신부(310), 분석부(320), 점수 부여부(330) 및 필터링부(340)를 포함할 수 있다. 이러한 프로세서(222)의 구성요소들은 필터링 서버에 저장된 프로그램 코드가 제공하는 제어 명령에 따라 프로세서(222)에 의해 수행되는 서로 다른 기능들(different functions)의 표현들일 수 있다. 프로세서(222) 및 프로세서(222)의 구성요소들은 도 4의 컨텐츠 필터링 방법이 포함하는 단계들(410 내지 440)을 수행하도록 필터링 서버를 제어할 수 있다. 이때, 프로세서(222) 및 프로세서(222)의 구성요소들은 메모리가 포함하는 운영체제의 코드와 적어도 하나의 프로그램의 코드에 따른 명령(instruction)을 실행하도록 구현될 수 있다.The processor 222 of the filtering server may include a receiver 310, an analyzer 320, a scorer 330, and a filter 340. Components of such a processor 222 may be representations of different functions performed by the processor 222 according to control instructions provided by program code stored in the filtering server. The processor 222 and the components of the processor 222 may control the filtering server to perform the steps 410 to 440 included in the content filtering method of FIG. 4. In this case, the processor 222 and the components of the processor 222 may be implemented to execute instructions according to code of an operating system included in a memory and code of at least one program.

프로세서(222)는 컨텐츠 필터링 방법을 위한 프로그램의 파일에 저장된 프로그램 코드를 메모리에 로딩할 수 있다. 예를 들면, 필터링 서버에서 프로그램이 실행되면, 프로세서는 운영체제의 제어에 따라 프로그램의 파일로부터 프로그램 코드를 메모리에 로딩하도록 필터링 서버를 제어할 수 있다. 이때, 프로세서(222) 및 프로세서(222)가 포함하는 수신부(310), 분석부(320), 점수 부여부(330) 및 필터링부(340) 각각은 메모리에 로딩된 프로그램 코드 중 대응하는 부분의 명령을 실행하여 이후 단계들(410 내지 440)을 실행하기 위한 프로세서(222)의 서로 다른 기능적 표현들일 수 있다. The processor 222 may load program code stored in a file of a program for a content filtering method into a memory. For example, when a program is executed in the filtering server, the processor may control the filtering server to load program code from a file of the program into a memory under control of an operating system. In this case, each of the processor 310, the receiver 310, the analyzer 320, the scorer 330, and the filter 340 included in the processor 222 and the processor 222 may correspond to a corresponding portion of the program code loaded in the memory. It may be different functional representations of the processor 222 for executing the instructions to execute the subsequent steps 410-440.

단계(410)에서 수신부(310)는 컨텐츠와 관련된 정보를 수신할 수 있다. 수신부(310)는 컨텐츠가 업로드됨에 따라 게시된 컨텐츠와 관련된 정보를 조회할 수 있고, 업로드가 요청된 컨텐츠와 관련된 정보를 조회할 수 있다. In operation 410, the receiver 310 may receive information related to content. As the content is uploaded, the receiver 310 may inquire information related to the posted content and may inquire information related to the content requested to be uploaded.

단계(420)에서 분석부(320)는 수신된 컨텐츠와 관련된 정보를 기 설정된 항목에 기초하여 분석할 수 있다. 분석부(320)는 컨텐츠에 대한 중복 검사, 컨텐츠에 대한 필터링 검사, 컨텐츠의 업데이트 검사, 컨텐츠의 신고 여부 검사, 컨텐츠의 IP 추적 검사 중 적어도 두 개 이상의 항목에 기초하여 컨텐츠의 분석을 수행할 수 있다. 분석부(320)는 컨텐츠에 포함된 정보를 해싱함에 따라 획득된 해시정보와 기 저장된 컨텐츠의 해시정보를 매칭시켜 유사도를 판단하여 중복 검사를 수행할 수 있다. 구체적으로, 도 7을 참고하면, 컨텐츠를 분석하는 방법을 설명하기 위한 예이다. 예를 들면, 필터링 서버는 사용자 단말(110)로부터 게시되는 컨텐츠를 조회함에 따라 컨텐츠의 해시정보와 데이터베이스(350)에서 사용자 단말(110)의 컨텐츠와 대응되는 컨텐츠의 해시정보를 탐색할 수 있다. 분석부(320)는 사용자 단말(110)의 컨텐츠의 해시정보와 데이터베이스(350)에서 검색된 컨텐츠의 해시정보를 매칭시킴에 따라 매칭결과를 도출할 수 있다. 분석부(320)는 컨텐츠에 기재된 단어, 문장, 어구, 문단 또는 컨텐츠에 포함된 이미지 중 적어도 하나 이상을 포함하는 컨텐츠에 포함된 정보를 해싱함에 따라 코드화된 해시정보와 기 저정된 컨텐츠의 해시정보를 매칭한 결과가 기 설정된 기준 이상의 매칭률인지 여부를 판단할 수 있다. 사전에, 데이터베이스(350)에 컨텐츠에 기재된 단어, 컨텐츠에 기재된 문장, 컨텐츠에 기재된 어구, 컨텐츠에 기재된 문단 또는 컨텐츠에 포함된 이미지 중 적어도 하나 이상을 포함하는 컨텐츠에 포함된 정보를 해시함에 따라 코드화된 해시정보를 저장할 수 있다. 또한, 분석부(320)는 컨텐츠를 주기적으로 작성하는 사용자 계정, 컨텐츠를 기 설정된 기준 이상으로 컨텐츠를 생산하는 사용자 계정, 컨텐츠의 업데이트 주기가 기 설정된 시간 이하인 사용자 계정 또는 컨텐츠의 업데이트의 주기가 기 설정된 시간 이하이고 기 설정된 기준 이상의 컨텐츠를 생산하는 사용자 계정 중 어느 하나 이상의 사용자 계정과 관련된 컨텐츠를 판단할 수 있다. 예를 들면, 분석부(320)는 특정 시간에 주기적으로 컨텐츠를 업데이트하는 사용자 계정, 주기적으로 컨텐츠를 생산하는 사용자 계정 등과 관련된 컨텐츠를 상업적인 컨텐츠로 분류할 수 있다. 또한, 분석부(320)는 컨텐츠의 IP 대역대를 추적함에 따라 기 저장된 IP 주소와 식별된 IP 대역대의 매칭 여부를 판단할 수 있다. In operation 420, the analyzer 320 may analyze the information related to the received content based on a preset item. The analysis unit 320 may analyze the content on the basis of at least two items among the overlapping check of the content, the filtering check of the content, the update check of the content, the check whether the content is reported, and the IP tracking check of the content. have. The analysis unit 320 may perform overlapping inspection by determining similarity by matching hash information of the previously stored content with hash information obtained by hashing the information included in the content. Specifically, referring to FIG. 7, it is an example for explaining a method of analyzing content. For example, the filtering server may search for hash information of the content and hash information of the content corresponding to the content of the user terminal 110 in the database 350 as the content is posted from the user terminal 110. The analysis unit 320 may derive a matching result by matching the hash information of the content of the user terminal 110 and the hash information of the content retrieved from the database 350. The analysis unit 320 hashes the information included in the content including at least one or more of a word, sentence, phrase, paragraph, or image included in the content, and the hash information of the encoded content and the hash information of the predetermined content. It may be determined whether the result of the matching is a matching rate higher than or equal to a preset criterion. Encoded in the database 350 by hashing information contained in the content including at least one or more of a word written in the content, a sentence written in the content, a phrase written in the content, a paragraph written in the content, or an image included in the content. Stored hash information. In addition, the analysis unit 320 may be a user account for periodically creating the content, a user account for producing the content more than a predetermined criterion for the content, a user account whose content update period is less than the preset time or the period of the update of the content Content related to any one or more user accounts of a user account that is less than or equal to a predetermined time and produces more content than a predetermined criterion may be determined. For example, the analyzer 320 may classify content related to a user account that periodically updates the content at a specific time, a user account that periodically produces the content, and the like as commercial content. In addition, the analyzer 320 may determine whether to match the pre-stored IP address and the identified IP band by tracking the IP band of the content.

단계(430)에서 점수 부여부(330)는 컨텐츠의 분석을 수행함에 따라 컨텐츠와 관련된 각각의 항목에 대하여 점수화할 수 있다. 점수 부여부(330)는 컨텐츠에 부여된 점수에 기초하여 각각의 항목에 대한 분석 결과에 따라 점수를 감산 또는 가산할 수 있다. 도 6을 참고하면, 각각의 컨텐츠에 점수를 부여하는 것을 설명하기 위한 도면이다. 예를 들면, 점수 부여부(330)는 컨텐츠에 대하여 분석을 수행함에 따라 각각의 항목에 부여된 점수를 기재하여 점수표(600)에 저장할 수 있다. 점수 부여부(330)는 각각의 항목에 부여된 점수를 기준점수에 부여하여 최종적인 종합점수를 계산할 수 있다. 이때, 점수 부여부(330)는 컨텐츠에 대한 분석이 수행될 때마다 각각의 항목에 대한 점수가 업데이트될 수 있다. 또한, 점수 부여부(330)는 컨텐츠에 대하여 수행된 분석 결과에 기초하여 각각의 항목에 가중치를 부여할 수도 있다. 이에, 점수 부여부(330)는 컨텐츠의 일부 항목에 가중치가 부여되어 점수가 도출될 수 있다. In operation 430, the scoring unit 330 may score each item related to the content as the content is analyzed. The score assigning unit 330 may subtract or add a score according to the analysis result of each item based on the score assigned to the content. Referring to FIG. 6, a diagram for describing assigning a score to each content is illustrated. For example, the score assigning unit 330 may store the scores assigned to each item in the score table 600 as the content is analyzed. The score assigning unit 330 may calculate a final comprehensive score by assigning a score given to each item to a reference score. In this case, the score assigning unit 330 may update the score for each item whenever analysis of the content is performed. In addition, the score assigning unit 330 may assign a weight to each item based on the analysis result performed on the content. Thus, the score assigning unit 330 may be weighted to some items of the content to derive the score.

단계(440)에서 필터링부(340)는 각각의 항목에 대하여 점수화한 값에 기반하여 컨텐츠를 필터링할 수 있다. 필터링부(340)는 비즈니스 생산자에 의하여 생산된 사용자 채널의 컨텐츠를 필터링할 수 있다. 필터링부(340)는 각각의 항목에 대하여 점수화한 값을 가산한 종합점수가 기 설정된 기준값 이하일 경우, 컨텐츠를 필터링하여 컨텐츠의 노출을 제거할 수 있다. 필터링부(340)는 컨텐츠가 제작된 시간 및/또는 횟수가 일정하게 업데이트됨을 감지함에 따라 컨텐츠를 필터링할 수 있다. 필터링부(340)는 컨텐츠가 일정 기간동안 업로드되는 횟수의 평균 또는 컨텐츠가 일정기간 동안 카운팅되는 최저횟수를 제한할 수 있다. 필터링부(340)는 컨텐츠의 내용 또는 컨텐츠의 출처가 동일한 것으로 판단하여 컨텐츠를 필터링할 수 있다. 예를 들면, 필터링부(340)는 컨텐츠를 필터링하는 것은 컨텐츠를 인터넷 서비스에 노출시키지 않거나, 컨텐츠의 업로드되는 횟수 또는 컨텐츠가 카운팅되는 횟수 등을 제한하는 것일 수 있다. 또는, 필터링부(340)는 사용자 또는 컴퓨터의 조작에 의하여 기준값을 완화시켜 컨텐츠의 노출을 허용할 수도 있다. In operation 440, the filtering unit 340 may filter the content based on the scored value for each item. The filtering unit 340 may filter the content of the user channel produced by the business producer. The filtering unit 340 may filter the content to remove the exposure of the content when the total score obtained by adding the scored value for each item is less than or equal to the preset reference value. The filtering unit 340 may filter the content as the time and / or the number of times the content is produced is constantly updated. The filtering unit 340 may limit the average number of times the content is uploaded for a certain period or the minimum number of times the content is counted for a certain period of time. The filtering unit 340 may filter the content by determining that the content or the source of the content are the same. For example, the filtering unit 340 may filter the content so as not to expose the content to an Internet service, or to limit the number of times the content is uploaded or the number of times the content is counted. Alternatively, the filtering unit 340 may allow exposure of content by relaxing a reference value by a user or a computer.

도 5는 일 실시예에 따른 필터링 서버에서 컨텐츠를 필터링하는 동작을 설명하기 위한 도면이다.5 is a diagram for describing an operation of filtering content in a filtering server, according to an exemplary embodiment.

필터링 서버는 사용자로부터 업로드되는 컨텐츠를 조회할 수 있다(501). 여기서, 사용자는 컨텐츠를 제작 또는 생산하는 컨텐츠 생산자일 수 있고, 개인 또는 기관(업체)일 수 있다. 또한, 사용자는 인터넷 서비스에 사용자 계정으로 로그인하여 해당 인터넷 서비스에 컨텐츠를 업로드할 수 있다. 예를 들면, 사용자로부터 인터넷 서비스(예를 들면, SNS, 포탈 사이트 등)에 컨텐츠를 업로드됨에 따라 인터넷 서비스에 컨텐츠가 게시될 수 있다. 이때, 필터링 서버는 컨텐츠를 게시되기 전에 또는 게시된 컨텐츠를 크롤링하여 컨텐츠를 조회할 수 있다. 구체적으로, 필터링 서버는 컨텐츠가 인터넷 서비스에 게시되기 위하여 업로드 요청이 이루어짐에 따라 컨텐츠를 조회할 수 있고, 또는, 인터넷 서비스에 게시된 컨텐츠를 크롤링하여 컨텐츠를 조회할 수도 있다. The filtering server may query the content uploaded from the user (501). Here, the user may be a content producer producing or producing content, and may be an individual or an institution (company). In addition, the user may log in to the Internet service with a user account and upload content to the corresponding Internet service. For example, as content is uploaded from a user to an Internet service (eg, SNS, portal site, etc.), the content may be posted on the Internet service. In this case, the filtering server may query the content before the content is posted or by crawling the posted content. In detail, the filtering server may query the content as the upload request is made so that the content is posted on the Internet service, or may crawl the content posted on the Internet service to query the content.

필터링 서버는 컨텐츠를 수신함에 따라 컨텐츠와 관련된 정보를 분석 및 저장할 수 있다(502). 필터링 서버는 컨텐츠와 관련된 정보를 기 설정된 항목에 기초하여 분석을 수행할 수 있다. 예를 들면, 필터링 서버는 컨텐츠에 대한 중복 검사, 컨텐츠에 대한 필터링 검사, 컨텐츠의 업데이트 여부 검사, 컨텐츠의 신고 여부 검사, 컨텐츠의 IP 추적 가능 여부 검사 중 적어도 두 개 이상의 항목에 기초하여 컨텐츠의 분석을 수행할 수 있다. 이때, 필터링 서버는 컨텐츠에 대하여 복수 개의 항목에 대하여 동시에 또는 차례로 분석을 수행할 수 있다. 필터링 서버는 이러한 항목에 부합되지 않는 컨텐츠를 노출시키기 위함이다. As the filtering server receives the content, the filtering server may analyze and store information related to the content (502). The filtering server may analyze the information related to the content based on a preset item. For example, the filtering server may analyze the content based on at least two items among the duplicate checks on the content, the filtering checks on the content, the update check on the content, the check on whether to report the content, and the IP traceability check on the content. Can be performed. In this case, the filtering server may analyze the plurality of items simultaneously or sequentially for the content. The filtering server is intended to expose content that does not match these items.

예를 들면, 필터링 서버는 컨텐츠에 포함된 정보를 해싱함에 따라 획득된 해시정보와 기 저장된 컨텐츠의 해시정보를 매칭시켜 유사도를 판단하여 중복 검사를 수행할 수 있다. 필터링 서버는 컨텐츠에 기재된 단어, 문장, 어구, 문단 또는 컨텐츠에 포함된 이미지 중 적어도 하나 이상을 포함하는 컨텐츠에 포함된 정보를 해싱할 수 있다(503). 여기서, 해싱은 컨텐츠에 기재된 단어, 문장, 어구, 문단 또는 이미지에 대하여 해싱을 수행함에 따라 유니크한 해시정보로 변환될 수 있다. 예를 들면, 컨텐츠에 기재된 특정 어구가 해싱됨에 따라 'ABCDEDCBA'와 같이 특정 길이의 해시코드로 변환될 수 있고, 이러한 해시코드를 각각 비교할 수 있다. For example, the filtering server may match the hash information obtained by hashing the information included in the content with the hash information of the pre-stored content, determine the similarity, and perform a duplicate check. The filtering server may hash information included in content including at least one or more of a word, sentence, phrase, paragraph, or image included in the content (503). Here, the hashing may be converted into unique hash information by hashing the word, sentence, phrase, paragraph, or image described in the content. For example, as specific phrases described in the content are hashed, they may be converted into hash codes having a specific length, such as 'ABCDEDCBA', and the hash codes may be compared with each other.

필터링 서버는 컨텐츠에 포함된 정보를 해싱함에 따라 코드화된 해시정보와 기 저정된 컨텐츠의 해시정보를 매칭한 결과가 기 설정된 기준 이상의 매칭률 이상일 경우, 컨텐츠의 출처가 동일한 것으로 판단할 수 있다. 사전에, 필터링 서버는 컨텐츠에 기재된 단어, 컨텐츠에 기재된 문장, 컨텐츠에 기재된 어구, 컨텐츠에 기재된 문단 또는 컨텐츠에 포함된 이미지 중 적어도 하나 이상을 포함하는 컨텐츠에 포함된 정보를 해시함에 따라 코드화된 해시정보를 데이터베이스에 저장해놓을 수 있고, 코드화된 해시정보를 캐시화할 수 있다. 데이터베이스에 저장된 해시정보는 인터넷 서비스에 노출되는 컨텐츠 또는 인터넷 서비스의 노출이 제외된 컨텐츠들을 포함할 수 있다. The filtering server may determine that the source of the content is the same when the result of matching the encoded hash information with the hash information of the predetermined content is equal to or greater than a preset criterion as hashing the information included in the content. In advance, the filtering server hashes information contained in content that includes at least one of words in content, sentences in content, phrases in content, paragraphs in content, or images in content. You can store information in a database and cache coded hash information. The hash information stored in the database may include contents exposed to the Internet service or contents from which the exposure of the Internet service is excluded.

필터링 서버는 데이터베이스에 저장된 해시정보와 컨텐츠에 대하여 변환된 해시정보를 매칭하여 매칭률을 판단할 수 있다. 일례로, 필터링 서버는 컨텐츠에 기재된 문단에 대하여 해싱된 해시정보, 컨텐츠에 기재된 어구에 대하여 해싱된 해시정보 및 컨텐츠에 포함된 이미지에 대하여 해싱된 해시정보를 포함하는 순서로 기 저장된 컨텐츠의 해시정보를 매칭하여 분석을 수행할 수 있다. 다른 예로서, 필터링 서버는 컨텐츠의 해시정보와 가장 오래된 컨텐츠를 탐색한 후, 가장 오래된 컨텐츠에 대하여 해싱함에 따라 획득된 해시정보를 매칭하여 분석을 수행할 수 있다. 필터링 서버는 컨텐츠에 대하여 변환된 해시정보와 기 저장된 해시정보를 매칭하여 일치되는 문장, 어구 등을 검출할 수 있고, 각각의 단어, 문단, 어구 이미지 등을 매칭한 해시정보에 기초하여 종합적인 매칭률을 도출할 수도 있다. 또한, 필터링 서버는 매칭률이 기 설정된 매칭률(예를 들면, 80%) 이상일 경우, 동일한 컨텐츠로 판단할 수 있다. 필터링 서버는 일치되는 해시정보를 검출하여 데이터베이스에 저장할 수 있다(504). 또는, 필터링 서버는 기 저장된 해시정보와 비교된 컨텐츠 및 컨텐츠와 관련된 해시정보를 데이터베이스에 저장할 수 있다(504). 또한, 필터링 서버는 데이터베이스에 저장된 해시정보를 새로운 컨텐츠와 분석을 수행할 수 있다. The filtering server may determine the matching rate by matching the hash information stored in the database with the converted hash information for the content. For example, the filtering server may include hash information hashed for a paragraph described in the content, hash information hashed for a phrase described in the content, and hash information hashed for an image included in the content. Can be analyzed to match. As another example, the filtering server may search the hash information of the content and the oldest content, and then perform analysis by matching the hash information obtained by hashing the oldest content. The filtering server may detect the sentence, phrase, and the like that match the converted hash information and pre-stored hash information with respect to the content, and comprehensive matching based on the hash information that matches each word, paragraph, phrase image, etc. You can also derive the rate. In addition, the filtering server may determine the same content when the matching rate is equal to or greater than a preset matching rate (eg, 80%). The filtering server may detect the matching hash information and store it in the database (504). Alternatively, the filtering server may store the content compared with the previously stored hash information and hash information related to the content in the database (504). In addition, the filtering server may perform new content and analysis on the hash information stored in the database.

필터링 서버는 컨텐츠의 내용을 분석함에 따라 컨텐츠의 출처를 분석할 수 있다(505). 필터링 서버는 컨텐츠를 생산하는 생산자, 컨텐츠의 업데이트 주기 또는 횟수 등을 분석할 수 있다(506). 필터링 서버는 상업적인 의도로 컨텐츠를 작성하는 그룹을 필터링하기 위한 분석을 수행할 수 있다. 이때, 컨텐츠의 업데이트 주기가 짧고 많은 컨텐츠를 생산하는 대상을 필터링하기 위함이다. 예를 들면, 필터링 서버는 컨텐츠를 주기적으로 작성하는 사용자 계정, 컨텐츠를 기 설정된 기준 이상으로 컨텐츠를 생산하는 사용자 계정, 컨텐츠의 업데이트 주기가 기 설정된 시간 이하인 사용자 계정 또는 컨텐츠의 업데이트의 주기가 기 설정된 시간 이하이고 기 설정된 기준 이상의 컨텐츠를 생산하는 사용자 계정 중 어느 하나 이상의 사용자 계정과 관련된 컨텐츠를 판단할 수 있다. 또한, 필터링 서버는 컨텐츠의 제작 시간 및 횟수가 일정함을 감지함에 따라 컨텐츠가 상업적인 의로도 생산되었을 것으로 판단할 수 있다. 또한, 필터링 서버는 컨텐츠의 IP 대역대를 추적함에 따라 기 저장된 IP 주소와 식별된 IP 대역대의 매칭 여부를 판단할 수 있다. 예를 들면, 상업적인 컨텐츠의 경우, IP 대역대 또는 내부 IP 주소가 동일 또는 유사할 수 있다. 필터링 서버는 IP 대역대 또는 내부 IP 주소가 동일 또는 유사한 컨텐츠를 추출할 수 있다. The filtering server may analyze the source of the content as the content of the content is analyzed (505). The filtering server may analyze a producer who produces the content, an update cycle or the number of times of the content, etc. (506). The filtering server may perform an analysis for filtering a group for composing content with commercial intention. At this time, the update period of the content is short, and to filter the object producing a lot of content. For example, the filtering server may be configured to periodically set a user account for periodically creating content, a user account for producing content with a predetermined criterion or more, and a user account whose content update period is less than or equal to a preset time. Content related to any one or more user accounts of less than a time and a user account that produces more than a predetermined reference content may be determined. In addition, the filtering server may determine that the content has been produced commercially as the content production time and number of times are constant. In addition, the filtering server may determine whether the pre-stored IP address matches the identified IP band as the IP band of the content is tracked. For example, for commercial content, IP bands or internal IP addresses may be the same or similar. The filtering server may extract content having the same or similar IP band or internal IP address.

한편, 필터링 서버 유저의 신고에 기초하여 컨텐츠를 분석할 수도 있다(507). 필터링 서버는 유저의 신고 횟수를 데이터베이스에 저장할 수 있다(508). 더 나아가, 필터링 서버는 기 서비스 제공 업체의 블랙리스트에 기초하여 컨텐츠를 분석할 수도 있다. 예를 들면, 필터링 서버는 인터넷 서비스에 블랙리스트를 등록할 수 있다. 이때, 각각의 기업에 대하여 생성된 상대 기업 블랙리스트를 등록하여 기업의 컨텐츠를 우선적으로 노출시키기 위한 점수를 제공하되, 앞서 각각의 컨텐츠에 대한 분석을 수행하여 점수를 부여하는 값보다 작은 범위에서 플러스 점수를 부여할 수 있다. 이때, 필터링 서버는 컨텐츠 노출의 부작용을 최소화하기 위하여 타겟에 한하여 횟수 제한 및 신고를 수신할 경우, 우선 노출을 종료할 수 있다. 필터링 서버는 단계(507) 내지 단계(508)의 프로세스를 상황에 따라 선택적으로 처리할 수 있다. 필터링 서버는 사용자가 컨텐츠를 조회하였을 경우, 명백하게 상업적인 컨텐츠인 것을 확인하였을 경우, 사용자로부터 컨텐츠에 대한 점수가 임의적으로 부여될 수 있다. 또는 필터링 서버는 사용자에 의하여 요청된 컨텐츠에 대한 점수를 부여할 수도 있다. Meanwhile, the content may be analyzed based on the report of the filtering server user (507). The filtering server may store the user's report count in the database (508). Furthermore, the filtering server may analyze the content based on the black list of the service provider. For example, the filtering server may register a blacklist with the Internet service. In this case, a score for exposing the contents of the company is first provided by registering a counterpart blacklist generated for each company, but the analysis is performed in advance for each content, and the score is smaller than the value that gives the score. You can assign a score. In this case, the filtering server may end the exposure first when receiving the limit and report on the target only in order to minimize the side effects of the content exposure. The filtering server may selectively process the processes of steps 507 to 508 according to the situation. When the filtering server checks that the content is clearly commercial content when the user inquires the content, a score for the content may be randomly given from the user. Alternatively, the filtering server may assign a score for the content requested by the user.

필터링 서버는 컨텐츠의 출처를 분석함에 따라 상업적인 의도로 작성된 컨텐츠를 필터링할 수 있다. 필터링 서버는 컨텐츠에 대하여 설정된 다양한 복수의 항목에 기초하여 컨텐츠를 분석함에 따라 각각의 항목별로 점수화할 수 있다(509). 예를 들면, 필터링 서버는 컨텐츠에 대하여 내용 및 출처를 분석함에 따라 각각의 컨텐츠를 점수화할 수 있다. 필터링 서버는 컨텐츠의 내용을 분석함에 따라 도출된 점수, 컨텐츠의 출처를 분석함에 따라 도출된 점수를 획득할 수 있다. 예를 들면, 컨텐츠의 매칭률 범위를 설정하여 컨텐츠의 매칭률이 60%~70%에 포함될 경우, 70%80~에 포함될 경우, -20점, 80%~90%에 포함될 경우, -30 점과 같이 매칭률에 기초하여 점수화할 수 있다. 다른 예로서, 컨텐츠를 분석한 결과, 매칭된 컨텐츠의 여부에 따라, 또는, 컨텐츠가 상업적인 것으로 판단됨에 따라 마이너스 점수 또는 플러스 점수를 부여할 수 있다. 이때, 필터링 서버는 컨텐츠의 분석 결과가 기 설정된 기준 이상일 경우, 가중치를 부여할 수 있다. 다시 말해서, 필터링 서버는 컨텐츠의 분석 결과가 기 설정된 매칭률 이상일 경우, 상업적인 컨텐츠로 판단하여 가중치를 부여하게 된다. 이와 같이, 가중치가 부여된 컨텐츠가 보다 확실하게 필터링될 수 있다. 또한, 필터링 서버는 컨텐츠의 분석을 수행함에 따라 동일한 컨텐츠로 판단된 적어도 두 개의 컨텐츠 각각을 동시에 컨텐츠의 노출을 제외시키기 위한 점수를 부여할 수 있다. 다시 말해서, 필터링 서버는 컨텐츠와 비교하기 위하여 추출된 컨텐츠가 동일하다고 판단될 경우, 두 개의 컨텐츠 모두 점수를 부여할 수 있다. 이에 따라, 컨텐츠의 노출이 제외되어야 할 컨텐츠가 노출될 경우, 다른 컨텐츠의 분석을 수행할 때 함께 필터링시킬 수 있다. 이때, 동일한 컨텐츠로 판단된 컨텐츠의 개수가 많을수록 해당하는 컨텐츠의 점수에 가중치를 크게 부여할 수 있다.The filtering server may filter content created for commercial purposes as the source of the content is analyzed. The filtering server may score each item as the content is analyzed based on a plurality of items set for the content (509). For example, the filtering server may score each content as the content and source are analyzed for the content. The filtering server may obtain a score derived by analyzing the content of the content and a score derived by analyzing the source of the content. For example, if the content matching rate range is set to 60% to 70%, 70% to 80%, -20 points to 80% to 90%, and -30 points to 80% to 90% As described above, the score may be scored based on the matching rate. As another example, as a result of analyzing the content, a negative score or a positive score may be given according to whether or not the matched content or the content is determined to be commercial. In this case, the filtering server may assign a weight when the analysis result of the content is equal to or greater than a preset criterion. In other words, when the analysis result of the content is equal to or greater than a predetermined matching rate, the filtering server determines that the content is commercial content and assigns a weight. As such, the weighted content can be filtered more reliably. In addition, as the filtering server analyzes the content, each of the at least two content determined to be the same content may be assigned a score for excluding the exposure of the content at the same time. In other words, if it is determined that the extracted content is the same to compare with the content, the filtering server may assign a score to both contents. Accordingly, when the content, which should be excluded from the exposure of the content, is exposed, it may be filtered together when analyzing other content. In this case, the greater the number of contents determined to be the same content, the greater the weight of the corresponding content score.

필터링 서버는 컨텐츠에 대한 분석을 수행함에 따라 각각의 항목에 대한 분석 결과에 따라 점수를 감산 또는 가산할 수 있다. 예를 들면, 사전에 컨텐츠에 기본점수가 부여될 수 있다. 컨텐츠 각각에 대하여 1000점이 기본점수로 부여될 수 있으며, 기본점수에서 컨텐츠에 대한 분석을 수행한 결과에 따라 점수를 감산 또는 가산하게 된다. 필터링 서버는 컨텐츠를 분석함에 따라 각각의 항목에 대하여 획득된 점수를 종합할 수 있다. 또는, 필터링 서버는 각각의 항목에 대하여 획득된 점수를 종합한 종합점수를 컨텐츠를 기준으로 오름차순 또는 내림차순으로 정렬할 수 있다. 이에 따라 필터링 서버는 컨텐츠에 대한 필터링(510)을 수행함에 따라 정상적인 컨텐츠의 페이지를 노출시킬 수 있다(511). 필터링 서버는 각각의 점수를 종합한 종합점수가 기 설정된 값 이상 또는 이하일 경우, 컨텐츠를 필터링할 수 있다. 예를 들면, 필터링 서버는 기 설정된값(기준값) 이하의 컨텐츠를 필터링하여 컨텐츠의 노출을 제외시킬 수 있다. As the filtering server analyzes the content, the filtering server may subtract or add the score according to the analysis result for each item. For example, a base score may be given to content in advance. 1000 points may be assigned to each content as a base score, and the score is subtracted or added according to a result of analyzing the content in the base score. The filtering server may aggregate the scores obtained for each item as the content is analyzed. Alternatively, the filtering server may sort the total score that combines the scores obtained for each item in ascending or descending order based on the content. Accordingly, the filtering server may expose the page of the normal content as the filtering 510 is performed on the content (511). The filtering server may filter the content when the combined score of each score is more than or less than a predetermined value. For example, the filtering server may filter out content below a preset value (reference value) to exclude exposure of the content.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The apparatus described above may be implemented as a hardware component, a software component, and / or a combination of hardware components and software components. For example, the devices and components described in the embodiments are, for example, processors, controllers, arithmetic logic units (ALUs), digital signal processors, microcomputers, field programmable gate arrays (FPGAs). Can be implemented using one or more general purpose or special purpose computers, such as a programmable logic unit (PLU), a microprocessor, or any other device capable of executing and responding to instructions. The processing device may execute an operating system (OS) and one or more software applications running on the operating system. The processing device may also access, store, manipulate, process, and generate data in response to the execution of the software. For convenience of explanation, one processing device may be described as being used, but one of ordinary skill in the art will appreciate that the processing device includes a plurality of processing elements and / or a plurality of types of processing elements. It can be seen that it may include. For example, the processing device may include a plurality of processors or one processor and one controller. In addition, other processing configurations are possible, such as parallel processors.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.The software may include a computer program, code, instructions, or a combination of one or more of the above, and configure the processing device to operate as desired, or process it independently or collectively. You can command the device. Software and / or data may be any type of machine, component, physical device, virtual equipment, computer storage medium or device in order to be interpreted by or to provide instructions or data to the processing device. It can be embodied in. The software may be distributed over networked computer systems so that they may be stored or executed in a distributed manner. Software and data may be stored on one or more computer readable recording media.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. Method according to the embodiment is implemented in the form of program instructions that can be executed by various computer means may be recorded on a computer readable medium. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. The program instructions recorded on the media may be those specially designed and constructed for the purposes of the embodiments, or they may be of the kind well-known and available to those having skill in the computer software arts. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include machine code, such as produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter or the like.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.Although the embodiments have been described by the limited embodiments and the drawings as described above, various modifications and variations are possible to those skilled in the art from the above description. For example, the described techniques may be performed in a different order than the described method, and / or components of the described systems, structures, devices, circuits, etc. may be combined or combined in a different manner than the described method, or other components. Or even if replaced or replaced by equivalents, an appropriate result can be achieved.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.Therefore, other implementations, other embodiments, and equivalents to the claims are within the scope of the claims which follow.

Claims (20)

컴퓨터로 구현되는 필터링 서버에 의해 수행되는 컨텐츠 필터링 방법에 있어서,
컨텐츠와 관련된 정보를 수신하는 단계;
상기 수신된 컨텐츠와 관련된 정보를 기 설정된 항목에 기초하여 분석하는 단계;
상기 컨텐츠의 분석을 수행함에 따라 상기 컨텐츠와 관련된 각각의 항목에 대하여 점수화하는 단계; 및
상기 각각의 항목에 대하여 점수화한 값에 기반하여 컨텐츠를 필터링하는 단계
를 포함하는 컨텐츠 필터링 방법.
In the content filtering method performed by a computer-implemented filtering server,
Receiving information related to the content;
Analyzing the information related to the received content based on a preset item;
Scoring each item associated with the content as the analysis of the content is performed; And
Filtering content based on the scored value for each item;
Content filtering method comprising a.
제1항에 있어서,
상기 수신된 컨텐츠와 관련된 정보를 기 설정된 항목에 기초하여 분석하는 단계는,
상기 컨텐츠에 대한 중복 검사, 상기 컨텐츠에 대한 필터링 검사, 상기 컨텐츠의 업데이트 검사, 상기 컨텐츠의 신고 여부 검사, 상기 컨텐츠의 IP 추적 검사 중 적어도 두 개 이상의 항목에 기초하여 컨텐츠의 분석을 수행하는 단계
를 포함하는 컨텐츠 필터링 방법.
The method of claim 1,
Analyzing the information related to the received content based on a preset item,
Performing an analysis of the content based on at least two items among the duplicated inspection of the contents, the filtering inspection of the contents, the updating inspection of the contents, the inspection of whether the contents have been reported, and the IP tracking inspection of the contents;
Content filtering method comprising a.
제1항에 있어서,
상기 수신된 컨텐츠와 관련된 정보를 기 설정된 항목에 기초하여 분석하는 단계는,
상기 컨텐츠에 포함된 정보를 해싱함에 따라 획득된 해시정보와 기 저장된 컨텐츠의 해시정보를 매칭시켜 유사도를 판단하여 중복 검사를 수행하는 단계
를 포함하는 컨텐츠 필터링 방법.
The method of claim 1,
Analyzing the information related to the received content based on a preset item,
Performing overlapping inspection by determining similarity by matching the hash information obtained by hashing the information included in the content with hash information of previously stored content.
Content filtering method comprising a.
제3항에 있어서,
상기 수신된 컨텐츠와 관련된 정보를 기 설정된 항목에 기초하여 분석하는 단계는,
상기 컨텐츠에 기재된 단어, 문장, 어구, 문단 또는 상기 컨텐츠에 포함된 이미지 중 적어도 하나 이상을 포함하는 컨텐츠에 포함된 정보를 해싱함에 따라 코드화된 해시정보와 상기 기 저정된 컨텐츠의 해시정보를 매칭한 매칭결과가 기 설정된 기준 이상의 매칭률인지 여부를 판단하는 단계
를 포함하는 컨텐츠 필터링 방법.
The method of claim 3,
Analyzing the information related to the received content based on a preset item,
Hashing the encoded hash information and the hash information of the predetermined content by hashing the information contained in the content including at least one or more of a word, a sentence, a phrase, a paragraph, or an image included in the content. Determining whether the matching result is a matching rate higher than or equal to a preset criterion;
Content filtering method comprising a.
제4항에 있어서,
상기 수신된 컨텐츠와 관련된 정보를 기 설정된 기준항목에 기초하여 분석하는 단계는,
상기 컨텐츠에 기재된 단어, 상기 컨텐츠에 기재된 문장, 상기 컨텐츠에 기재된 어구, 상기 컨텐츠에 기재된 문단 또는 상기 컨텐츠에 포함된 이미지 중 적어도 하나 이상을 포함하는 컨텐츠에 포함된 정보를 해시함에 따라 코드화된 해시정보를 저장하는 단계
를 포함하는 컨텐츠 필터링 방법.
The method of claim 4, wherein
Analyzing the information related to the received content based on a predetermined reference item,
Hash information coded by hashing information included in content including at least one of a word written in the content, a sentence written in the content, a phrase written in the content, a paragraph written in the content, or an image included in the content Steps to save
Content filtering method comprising a.
제1항에 있어서,
상기 수신된 컨텐츠와 관련된 정보를 기 설정된 기준항목에 기초하여 분석하는 단계는,
상기 컨텐츠를 주기적으로 작성하는 사용자 계정, 상기 컨텐츠를 기 설정된 기준 이상으로 컨텐츠를 생산하는 사용자 계정, 상기 컨텐츠의 업데이트 주기가 기 설정된 시간 이하인 사용자 계정 또는 상기 컨텐츠의 업데이트의 주기가 기 설정된 시간 이하이고 기 설정된 기준 이상의 컨텐츠를 생산하는 사용자 계정 중 어느 하나 이상의 사용자 계정과 관련된 컨텐츠를 판단하는 단계
를 포함하는 컨텐츠 필터링 방법.
The method of claim 1,
Analyzing the information related to the received content based on a predetermined reference item,
A user account for periodically creating the content, a user account for producing the content with a predetermined criterion or more, a user account whose update period is less than or equal to a preset time, or a period of updating the content is less than or equal to a preset time; Determining content associated with any one or more user accounts among user accounts that produce content equal to or greater than a predetermined standard;
Content filtering method comprising a.
제1항에 있어서,
상기 식별된 컨텐츠와 관련된 정보를 기 설정된 기준항목에 기초하여 분석하는 단계는,
상기 컨텐츠의 IP 대역대를 추적함에 따라 기 저장된 IP 주소와 상기 식별된 IP 대역대의 매칭 여부를 판단하는 단계
를 포함하는 컨텐츠 필터링 방법.
The method of claim 1,
Analyzing the information related to the identified content based on a predetermined reference item,
Determining whether the previously stored IP address matches the identified IP band according to the IP band band of the contents;
Content filtering method comprising a.
제1항에 있어서,
상기 컨텐츠의 분석을 수행함에 따라 상기 컨텐츠와 관련된 각각의 항목에 대하여 점수화하는 단계는,
상기 컨텐츠에 부여된 점수에 기초하여 각각의 항목에 대한 분석 결과에 따라 점수를 감산 또는 가산하는 단계
를 포함하는 컨텐츠 필터링 방법.
The method of claim 1,
Scoring each item related to the content as the analysis of the content is performed,
Subtracting or adding a score according to an analysis result for each item based on the score given to the content
Content filtering method comprising a.
제1항에 있어서,
상기 각각의 항목에 대하여 점수화한 값에 기반하여 컨텐츠를 필터링하는 단계는,
상기 각각의 항목에 대하여 점수화한 값을 가산한 종합점수가 기 설정된 기준값 이하일 경우, 상기 컨텐츠를 필터링하는 단계
를 포함하는 컨텐츠 필터링 방법.
The method of claim 1,
Filtering the content based on the scored value for each item,
Filtering the content when a total score obtained by adding a scored value for each item is equal to or less than a preset reference value;
Content filtering method comprising a.
제9항에 있어서,
상기 각각의 항목에 대하여 점수화한 값에 기반하여 컨텐츠를 필터링하는 단계는,
상기 컨텐츠의 노출을 제거하거나, 상기 컨텐츠가 일정 기간동안 업로드되는 횟수의 평균 또는 상기 컨텐츠가 일정기간 동안 카운팅되는 최저횟수를 제한하는 단계
를 포함하는 컨텐츠 필터링 방법.
The method of claim 9,
Filtering the content based on the scored value for each item,
Removing exposure of the content or limiting the average number of times the content is uploaded for a certain period or the minimum number of times the content is counted for a certain period of time
Content filtering method comprising a.
컴퓨터로 구현되는 컨텐츠를 필터링하는 서버에 있어서,
컨텐츠와 관련된 정보를 수신하는 수신부;
상기 수신된 컨텐츠와 관련된 정보를 기 설정된 항목에 기초하여 분석하는 분석부;
상기 컨텐츠의 분석을 수행함에 따라 상기 컨텐츠와 관련된 각각의 항목에 대하여 점수화하는 점수 부여부; 및
상기 각각의 항목에 대하여 점수화한 값에 기반하여 컨텐츠를 필터링하는 필터링부
를 포함하는 필터링 서버.
A server for filtering content implemented by a computer,
Receiving unit for receiving information related to the content;
An analysis unit for analyzing the information related to the received content based on a preset item;
A score assigning unit for scoring each item related to the content as the content is analyzed; And
Filtering unit for filtering the content based on the scored value for each item
Filtering server comprising a.
제11항에 있어서,
상기 분석부는,
상기 컨텐츠에 대한 중복 검사, 상기 컨텐츠에 대한 필터링 검사, 상기 컨텐츠의 업데이트 검사, 상기 컨텐츠의 신고 여부 검사, 상기 컨텐츠의 IP 추적 검사 중 적어도 두 개 이상의 항목에 기초하여 컨텐츠의 분석을 수행하는
것을 특징으로 하는 필터링 서버.
The method of claim 11,
The analysis unit,
Analyzing the content based on at least two items among the duplicated inspection of the contents, the filtering inspection of the contents, the updating inspection of the contents, the inspection of whether the contents have been reported, and the IP tracking inspection of the contents;
Filtering server, characterized in that.
제11항에 있어서,
상기 분석부는,
상기 컨텐츠에 포함된 정보를 해싱함에 따라 획득된 해시정보와 기 저장된 컨텐츠의 해시정보를 매칭시켜 유사도를 판단하여 중복 검사를 수행하는
것을 특징으로 하는 필터링 서버.
The method of claim 11,
The analysis unit,
Hashing information obtained by hashing the information contained in the content and matching the hash information of the pre-stored content to determine the degree of similarity and to perform duplicate inspection
Filtering server, characterized in that.
제13항에 있어서,
상기 분석부는,
상기 컨텐츠에 기재된 단어, 문장, 어구, 문단 또는 상기 컨텐츠에 포함된 이미지 중 적어도 하나 이상을 포함하는 컨텐츠에 포함된 정보를 해싱함에 따라 코드화된 해시정보와 상기 기 저정된 컨텐츠의 해시정보를 매칭한 매칭결과가 기 설정된 기준 이상의 매칭률인지 여부를 판단하는
것을 특징으로 하는 필터링 서버.
The method of claim 13,
The analysis unit,
Hashing the encoded hash information and the hash information of the predetermined content by hashing the information contained in the content including at least one or more of a word, a sentence, a phrase, a paragraph, or an image included in the content. Determining whether the matching result is a matching rate above a predetermined criterion
Filtering server, characterized in that.
제14항에 있어서,
상기 분석부는,
상기 컨텐츠에 기재된 단어, 상기 컨텐츠에 기재된 문장, 상기 컨텐츠에 기재된 어구, 상기 컨텐츠에 기재된 문단 또는 상기 컨텐츠에 포함된 이미지 중 적어도 하나 이상을 포함하는 컨텐츠에 포함된 정보를 해시함에 따라 코드화된 해시정보를 저장하는
것을 특징으로 하는 필터링 서버.
The method of claim 14,
The analysis unit,
Hash information coded by hashing information included in content including at least one of a word written in the content, a sentence written in the content, a phrase written in the content, a paragraph written in the content, or an image included in the content To save
Filtering server, characterized in that.
제11항에 있어서,
상기 분석부는,
상기 컨텐츠를 주기적으로 작성하는 사용자 계정, 상기 컨텐츠를 기 설정된 기준 이상으로 컨텐츠를 생산하는 사용자 계정, 상기 컨텐츠의 업데이트 주기가 기 설정된 시간 이하인 사용자 계정 또는 상기 컨텐츠의 업데이트의 주기가 기 설정된 시간 이하이고 기 설정된 기준 이상의 컨텐츠를 생산하는 사용자 계정 중 어느 하나 이상의 사용자 계정과 관련된 컨텐츠를 판단하는
것을 특징으로 하는 필터링 서버.
The method of claim 11,
The analysis unit,
A user account for periodically creating the content, a user account for producing the content with a predetermined criterion or more, a user account whose update period is less than or equal to a preset time, or a period of updating the content is less than or equal to a preset time; Determining the content related to any one or more user accounts of the user account that produces content above the predetermined criteria
Filtering server, characterized in that.
제11항에 있어서,
상기 분석부는,
상기 컨텐츠의 IP 대역대를 추적함에 따라 기 저장된 IP 주소와 상기 식별된 IP 대역대의 매칭 여부를 판단하는
것을 특징으로 하는 필터링 서버.
The method of claim 11,
The analysis unit,
As the IP band of the content is tracked, it is determined whether a pre-stored IP address matches the identified IP band.
Filtering server, characterized in that.
제11항에 있어서,
상기 점수 부여부는,
상기 컨텐츠에 부여된 점수에 기초하여 각각의 항목에 대한 분석 결과에 따라 점수를 감산 또는 가산하는
것을 특징으로 하는 필터링 서버.
The method of claim 11,
The score grant unit,
A score is subtracted or added based on the analysis result for each item based on the score given to the content.
Filtering server, characterized in that.
제11항에 있어서,
상기 필터링부는,
상기 각각의 항목에 대하여 점수화한 값을 가산한 종합점수가 기 설정된 기준값 이하일 경우, 상기 컨텐츠를 필터링하는
것을 특징으로 하는 필터링 서버.
The method of claim 11,
The filtering unit,
Filtering the content when a total score obtained by adding a scored value for each item is equal to or less than a predetermined reference value;
Filtering server, characterized in that.
제19항에 있어서,
상기 필터링부는,
상기 컨텐츠의 노출을 제거하거나, 상기 컨텐츠가 일정 기간동안 업로드되는 횟수의 평균 또는 상기 컨텐츠가 일정기간 동안 카운팅되는 최저횟수를 제한하는
것을 특징으로 하는 필터링 서버.
The method of claim 19,
The filtering unit,
Remove the exposure of the content, or limit the average number of times the content is uploaded over a period of time or the minimum number of times the content is counted over a period of time
Filtering server, characterized in that.
KR1020180067242A 2018-06-12 2018-06-12 Method and system for filtering user channel contents by a business producer KR102072738B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180067242A KR102072738B1 (en) 2018-06-12 2018-06-12 Method and system for filtering user channel contents by a business producer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180067242A KR102072738B1 (en) 2018-06-12 2018-06-12 Method and system for filtering user channel contents by a business producer

Publications (2)

Publication Number Publication Date
KR20190140599A true KR20190140599A (en) 2019-12-20
KR102072738B1 KR102072738B1 (en) 2020-03-02

Family

ID=69062842

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180067242A KR102072738B1 (en) 2018-06-12 2018-06-12 Method and system for filtering user channel contents by a business producer

Country Status (1)

Country Link
KR (1) KR102072738B1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090006397A (en) * 2007-07-11 2009-01-15 에스케이 텔레콤주식회사 System and method for multi-stage filtering of malicious videos in video distribution environment
KR20100116056A (en) * 2009-04-21 2010-10-29 한국전자통신연구원 Distributed filtering apparatus and its method for copyright protection of digital contents
KR101859620B1 (en) * 2016-12-23 2018-05-18 충북대학교 산학협력단 Method and system for recommending content based on trust in online social network

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090006397A (en) * 2007-07-11 2009-01-15 에스케이 텔레콤주식회사 System and method for multi-stage filtering of malicious videos in video distribution environment
KR20100116056A (en) * 2009-04-21 2010-10-29 한국전자통신연구원 Distributed filtering apparatus and its method for copyright protection of digital contents
KR101859620B1 (en) * 2016-12-23 2018-05-18 충북대학교 산학협력단 Method and system for recommending content based on trust in online social network

Also Published As

Publication number Publication date
KR102072738B1 (en) 2020-03-02

Similar Documents

Publication Publication Date Title
JP6388988B2 (en) Static ranking for search queries in online social networks
CN111149100B (en) Determining a paraphrasing interrelationship across documents based on resolution and identification of named entities
US8996452B2 (en) Generating a predictive model from multiple data sources
US10496752B1 (en) Consumer insights analysis using word embeddings
JP6483092B2 (en) Database sharding with an update layer
JP6151450B2 (en) Rewriting search queries in online social networks
US10650067B2 (en) Cloud-enabled architecture for on-demand native application crawling
US9703534B2 (en) Dynamic entity inference for developer integration of entity-based external functionality
US11556698B2 (en) Augmenting textual explanations with complete discourse trees
US10558759B1 (en) Consumer insights analysis using word embeddings
US10509863B1 (en) Consumer insights analysis using word embeddings
US9882949B1 (en) Dynamic detection of data correlations based on realtime data
US20170185653A1 (en) Predicting Knowledge Types In A Search Query Using Word Co-Occurrence And Semi/Unstructured Free Text
US20210294976A1 (en) Systems and Methods for Deploying Computerized Conversational Agents
US20140306978A1 (en) Application-tailored object re-use and recycling
WO2018004737A1 (en) Improving content delivery by monitoring user actions for predicting event performance
KR20170088944A (en) Searching for Offers and Advertisements on Online Social Networks
KR20220070181A (en) Method and system for detecting duplicated document using document similarity measuring model based on deep learning
CN114356747A (en) Display content testing method, device, equipment, storage medium and program product
CN111813816B (en) Data processing method, device, computer readable storage medium and computer equipment
KR20210107473A (en) System for providing story contents platfrom service with distribution of revenue between creator and various participants
KR102072738B1 (en) Method and system for filtering user channel contents by a business producer
US10831795B2 (en) Method and system for providing target information using application list
KR102277673B1 (en) Method and system for supporting collection based on search
US20230045424A1 (en) Methods and apparatus to extract information from uniform resource locators

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant