WO2020122339A1

WO2020122339A1 - 전자 장치 및 그의 제어 방법

Info

Publication number: WO2020122339A1
Application number: PCT/KR2019/008028
Authority: WO
Inventors: 김영준; 김찬묵; 정도형; 고광현
Original assignee: 삼성전자주식회사
Priority date: 2018-12-11
Filing date: 2019-07-02
Publication date: 2020-06-18
Also published as: US20210334321A1; EP3836069A4; KR20200071477A; EP3836069A1; US11531722B2

Abstract

본 개시에서는 전자 장치 및 그 제어 방법이 제공된다. 본 개시의 전자 장치는 적어도 하나의 명령을 포함하는 메모리 및 메모리와 연결되어 전자 장치를 제어하는 프로세서를 포함하며, 프로세서는 적어도 하나의 명령어를 실행함으로써, 사용자가 기설정된 기간 동안에 접속한 적어도 하나의 웹 사이트에 대응되는 URL(Uniform Resource Locator)을 적어도 하나의 세그먼트로 구분하고, 적어도 하나의 세그먼트 및 학습된 분류 모델에 기초하여, 복수의 카테고리에 따라 URL을 분류하고, 기설정된 기간 동안 사용자의 웹 사이트 접속 이력, 적어도 하나의 웹 사이트에 대한 접속 이력 및 분류 결과에 기초하여, 복수의 카테고리 중에서 사용자가 선호하는 웹 사이트의 카테고리를 판단할 수 있다. 본 개시의 전자 장치는 규칙 기반 모델 또는, 기계학습, 신경망 또는 딥러닝 알고리즘 중 적어도 하나에 따라 학습된 인공지능 모델을 이용할 수 있다.

Description

전자 장치 및 그의 제어 방법

본 개시는 전자 장치 및 그의 제어 방법에 관한 것으로, 보다 상세하게는 사용자 맞춤형 정보를 제공하기 위해 사용자의 선호도를 판단하는 전자 장치 및 그의 제어 방법에 관한 것이다.

최근 전자 기술의 발전으로 인해 사용자 단말의 사용자는 휴대 중인 사용자 단말을 통해 장소나 시간에 구애받지 않고 웹 사이트를 접속할 수 있게 되었다. 이에 따라, 사용자가 접속한 웹 사이트를 분석하여 사용자의 선호도를 판단하고, 사용자의 선호도에 따라 사용자별 맞춤형 광고를 제공하거나 마케팅 전략을 구축하는 것이 가능해졌다.

사용자가 접속한 웹 사이트를 분석하여 사용자의 선호도를 판단하기 위해, 사용자가 접속한 웹 사이트의 타이틀 및 컨텐츠에 포함된 텍스트로부터 단어를 추출하여 상기 웹 사이트의 카테고리를 분류하는 방법이 있다.

다만, 웹 사이트에 포함된 텍스트의 수에 따라 카테고리를 분류할 때 처리되는 데이터의 양이 결정되며, 결국 텍스트의 수가 증가하면 데이터를 처리하는데 소요되는 시간 또는 비용이 증가하게 된다는 문제가 있다. 특히, 처리되는 데이터가 대용량인 경우에는 카테고리를 분류하는 정확도가 낮아진다는 문제가 있다.

또한, 웹 사이트가 이미지만을 포함하는 등과 같이 웹 사이트가 텍스트를 포함하지 않는 경우에는 웹 사이트의 카테고리를 분류할 수 없게 되어 웹 사이트마다 편차가 발생한다는 문제가 있다.

한편, 텍스트에 복수의 단어가 포함된 경우, 텍스트로부터 복수의 단어를 추출하기 위해 n-gram 알고리즘이 사용될 수 있다. 이때, n-gram 알고리즘은 텍스트(또는 텍스트의 열)의 수가 m(m은 임의의 자연수)인 경우를 가정하면, 1부터 n(n은 임의의 자연수)까지의 텍스트의 열을 토큰으로 획득하고, 2부터 n+1까지 열을 토큰으로 획득하고, …, m-n+1부터 m까지의 열을 토큰으로 획득하여, 획득된 토큰으로부터 의미를 갖는 단어를 추출하도록 하는 알고리즘일 수 있다.

다만, n-gram 알고리즘의 경우 텍스트의 수가 증가하거나 n의 조합이 다양해질수록 획득된 토큰의 수가 증가하고, 이에 따라 토큰으로부터 단어를 추출하는데 처리되는 시간 또는 비용이 증가하게 된다는 문제가 있다.

본 개시는 상술한 필요성에 의해 안출된 것으로, 본 개시의 목적은 사용자가 접속한 웹 사이트의 URL을 카테고리로 분류하여 사용자의 선호도를 판단하는 전자 장치 및 그의 제어 방법을 제공함에 있다.

상기 목적을 달성하기 위한, 본 개시의 일 실시 예에 따른 전자 장치는 적어도 하나의 명령을 포함하는 메모리 및 메모리와 연결되어 전자 장치를 제어하는 프로세서를 포함하며, 프로세서는 적어도 하나의 명령어를 실행함으로써, 사용자가 기설정된 기간 동안에 접속한 적어도 하나의 웹 사이트에 대응되는 URL(Uniform Resource Locator)을 적어도 하나의 세그먼트로 구분하고, 적어도 하나의 세그먼트 및 학습된 분류 모델에 기초하여, 복수의 카테고리에 따라 URL을 분류하고, 기설정된 기간 동안 사용자의 웹 사이트 접속 이력, 적어도 하나의 웹 사이트에 대한 접속 이력 및 분류 결과에 기초하여, 복수의 카테고리 중에서 사용자가 선호하는 웹 사이트의 카테고리를 판단할 수 있다.

여기에서, 프로세서는 말뭉치(corpus)에 기초하여, 적어도 하나의 웹 사이트 각각에 대응되는 URL을 적어도 하나의 세그먼트로 각각 구분할 수 있다.

한편, 프로세서는 적어도 하나의 세그먼트에 대한 특징 값을 획득하고, 특징 값을 학습된 분류 모델에 대한 입력 데이터로서 사용하여 URL이 복수의 카테고리에 속하는 확률 값을 획득하고, 기설정된 기간 동안 사용자의 웹 사이트 접속 이력, 웹 사이트에 접속한 사용자의 접속 이력 및 확률 값에 기초하여, 복수의 카테고리 중에서 사용자가 선호하는 웹 사이트의 카테고리를 판단할 수 있다.

한편, 프로세서는 적어도 하나의 URL 각각에 대해, 기설정된 기간 동안에 사용자가 적어도 하나의 웹 사이트에 접속한 횟수에 대한 사용자가 특정 URL에 대응되는 웹 사이트에 접속한 횟수의 비율을 사용자의 웹 사이트 접속 이력으로 산출할 수 있다.

한편, 프로세서는 적어도 하나의 웹 사이트 각각에 대해, 기설정된 기간 동안에 웹 사이트에 접속한 전체 사용자의 접속 횟수에 대한 사용자가 웹 사이트에 접속한 횟수의 비율을 적어도 하나의 웹 사이트에 대한 접속 이력으로 산출할 수 있다.

한편, 프로세서는 기설정된 기간 동안 사용자의 웹 사이트 접속 이력, 적어도 하나의 웹 사이트에 대한 접속 이력 및 분류 결과에 기초하여 복수의 카테고리 각각에 대한 사용자의 선호도를 산출하고, 산출된 선호도에 기초하여 사용자가 선호하는 웹 사이트의 카테고리를 판단할 수 있다.

한편, 프로세서는 사용자가 선호하는 웹 사이트의 카테고리와 관련된 정보를 제공할 수 있다.

한편, 학습된 분류 모델은 복수의 URL 및 복수의 URL 각각이 속하는 카테고리에 대한 정보를 학습 데이터로서 이용하여 학습될 수 있다.

본 개시의 일 실시 예에 따른 전자 장치의 제어 방법은 사용자가 기설정된 기간 동안에 접속한 적어도 하나의 웹 사이트에 대응되는 URL(Uniform Resource Locator)을 적어도 하나의 세그먼트로 구분하는 단계; 적어도 하나의 세그먼트 및 학습된 분류 모델에 기초하여, 복수의 카테고리에 따라 URL을 분류하는 단계; 및 기설정된 기간 동안 사용자의 웹 사이트 접속 이력, 적어도 하나의 웹 사이트에 대한 접속 이력 및 분류 결과에 기초하여, 복수의 카테고리 중에서 사용자가 선호하는 웹 사이트의 카테고리를 판단할 수 있다.

여기에서, 구분하는 단계는 말뭉치(corpus)에 기초하여, 적어도 하나의 웹 사이트 각각에 대응되는 URL을 적어도 하나의 세그먼트로 각각 구분할 수 있다.

한편, 카테고리를 판단하는 단계는 적어도 하나의 세그먼트에 대한 특징 값을 획득하는 단계; 특징 값을 학습된 분류 모델에 대한 입력 데이터로서 사용하여 URL이 복수의 카테고리에 속하는 확률 값을 획득하는 단계; 및 기설정된 기간 동안 사용자의 웹 사이트 접속 이력, 웹 사이트에 접속한 사용자의 접속 이력 및 확률 값에 기초하여, 복수의 카테고리 중에서 사용자가 선호하는 웹 사이트의 카테고리를 판단하는 단계를 포함할 수 있다.

한편, 본 개시의 제어 방법은 적어도 하나의 URL 각각에 대해, 기설정된 기간 동안에 사용자가 적어도 하나의 웹 사이트에 접속한 횟수에 대한 사용자가 특정 URL에 대응되는 웹 사이트에 접속한 횟수의 비율을 사용자의 웹 사이트 접속 이력으로 산출하는 단계를 더 포함할 수 있다.

한편, 본 개시의 제어 방법은 적어도 하나의 웹 사이트 각각에 대해, 기설정된 기간 동안에 웹 사이트에 접속한 전체 사용자의 접속 횟수에 대한 사용자가 웹 사이트에 접속한 횟수의 비율을 적어도 하나의 웹 사이트에 대한 접속 이력으로 산출하는 단계를 더 포함할 수 있다.

한편, 카테고리를 판단하는 단계는 기설정된 기간 동안 사용자의 웹 사이트 접속 이력, 적어도 하나의 웹 사이트에 대한 접속 이력 및 분류 결과에 기초하여 복수의 카테고리 각각에 대한 사용자의 선호도를 산출하고, 산출된 선호도에 기초하여, 사용자가 선호하는 웹 사이트의 카테고리를 판단할 수 있다.

한편, 본 개시의 제어 방법은 사용자가 선호하는 웹 사이트의 카테고리와 관련된 정보를 제공하는 단계를 더 포함할 수 있다.

이상과 같은 본 개시의 다양한 실시 예에 따르면, 사용자가 접속한 웹 사이트의 URL을 카테고리로 분류하여 사용자의 선호도를 판단하는 전자 장치 및 그의 제어 방법을 제공할 수 있다.

또한, 본 개시의 일 실시 예에 따른 전자 장치 및 그의 제어 방법은 사용자가 접속한 웹 사이트를 특정한 카테고리로 분류할 때 그 처리 속도를 향상시키고 리소스의 소모를 줄일 수 있다. 이에 따라, 사용자의 선호도를 보다 신속하게 판단할 수 있는 전자 장치 및 그의 제어 방법을 제공할 수 있다.

또한, 본 개시의 일 실시 예에 따른 전자 장치 및 그의 제어 방법은 사용자가 접속한 웹 사이트를 특정한 카테고리로 분류할 때 웹 사이트의 컨텐츠 차이에 따라 발생하는 오차를 줄일 수 있다. 이에 따라, 보다 정확한 사용자 맞춤형 정보를 제공할 수 있는 전자 장치 및 그의 제어 방법을 제공할 수 있다.

도 1은 본 개시의 일 실시 예에 따른 전자 장치의 블록도이다.

도 2는 본 개시의 일 실시 예에 따른 URL을 카테고리로 분류하는 방법을 설명하기 위한 도면이다.

도 3은 본 개시의 일 실시 예에 따른 스코어를 산출하는 방법을 설명하기 위한 도면이다.

도 4는 본 개시의 일 실시 예에 따른 사용자가 선호하는 웹 사이트의 카테고리에 관련된 정보를 제공하는 방법을 설명하기 위한 도면이다.

도 5는 본 개시의 일 실시 예에 따른 파이프라인을 설명하기 위한 도면이다.

도 6은 본 개시의 일 실시 예에 따른 인공지능 모델을 생성하는 방법을 설명하기 위한 도면이다.

도 7은 본 개시의 일 실시 예에 따른 학습부 및 인식부를 나타내는 블록도이다.

도 8은 본 개시의 일 실시 예에 따른 전자 장치의 구성을 상세히 도시한 블록도이다.

도 9는 본 개시의 일 실시 예에 따른 흐름도를 설명하기 위한 도면이다.

본 개시를 설명함에 있어서, 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 개시의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그에 대한 상세한 설명은 생략한다. 덧붙여, 하기 실시 예는 여러 가지 다른 형태로 변형될 수 있으며, 본 개시의 기술적 사상의 범위가 하기 실시 예에 한정되는 것은 아니다. 오히려, 이들 실시 예는 본 개시를 더욱 충실하고 완전하게 하고, 당업자에게 본 개시의 기술적 사상을 완전하게 전달하기 위하여 제공되는 것이다.

본 개시에 기재된 기술을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 개시의 실시 예의 다양한 변경(modifications), 균등물(equivalents), 및/또는 대체물(alternatives)을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다.

본 개시에서 사용된 "제1," "제2," "첫째," 또는 "둘째,"등의 표현들은 다양한 구성요소들을, 순서 및/또는 중요도에 상관없이 수식할 수 있고, 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 뿐 상기 구성요소들을 한정하지 않는다.

본 개시에서, "A 또는 B," "A 또는/및 B 중 적어도 하나," 또는 "A 또는/및 B 중 하나 또는 그 이상"등의 표현은 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다. 예를 들면, "A 또는 B," "A 및 B 중 적어도 하나," 또는 "A 또는 B 중 적어도 하나"는, (1) 적어도 하나의 A를 포함, (2) 적어도 하나의 B를 포함, 또는 (3) 적어도 하나의 A 및 적어도 하나의 B 모두를 포함하는 경우를 모두 지칭할 수 있다.

본 개시에서 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "구성되다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

어떤 구성요소(예: 제1 구성요소)가 다른 구성요소(예: 제2 구성요소)에 "(기능적으로 또는 통신적으로) 연결되어((operatively or communicatively) coupled with/to)" 있다거나 "접속되어(connected to)" 있다고 언급된 때에는, 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로 연결되거나, 다른 구성요소(예: 제3 구성요소)를 통하여 연결될 수 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소(예: 제1 구성요소)가 다른 구성요소(예: 제2 구성요소)에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 상기 어떤 구성요소와 상기 다른 구성요소 사이에 다른 구성요소(예: 제 3 구성요소)가 존재하지 않는 것으로 이해될 수 있다.

본 개시에서 사용된 표현 "~하도록 구성된(또는 설정된)(configured to)"은 상황에 따라, 예를 들면, "~에 적합한(suitable for)," "~하는 능력을 가지는(having the capacity to)," "~하도록 설계된(designed to)," "~하도록 변경된(adapted to)," "~하도록 만들어진(made to)," 또는 "~를 할 수 있는(capable of)"과 바꾸어 사용될 수 있다. 용어 "~하도록 구성된(또는 설정된)"은 하드웨어적으로 "특별히 설계된(specifically designed to)" 것만을 반드시 의미하지 않을 수 있다. 대신, 어떤 상황에서는, "~하도록 구성된 장치"라는 표현은, 그 장치가 다른 장치 또는 부품들과 함께 "~할 수 있는" 것을 의미할 수 있다. 예를 들면, 문구 "A, B, 및 C를 수행하도록 구성된(또는 설정된) 프로세서"는 상기 동작을 수행하기 위한 전용 프로세서(예: 임베디드 프로세서), 또는 메모리 장치에 저장된 하나 이상의 소프트웨어 프로그램들을 실행함으로써, 상기 동작들을 수행할 수 있는 범용 프로세서(generic-purpose processor)(예: CPU 또는 application processor)를 의미할 수 있다.

본 개시의 다양한 실시 예들에 따른 전자 장치는, 예를 들면, 스마트폰(smartphone), 태블릿 PC(tablet personal computer), 이동 전화기(mobile phone), 영상 전화기, 전자책 리더기(e-book reader), 데스크탑 PC(desktop personal computer), 랩탑 PC(laptop personal computer), 넷북 컴퓨터(netbook computer), 워크스테이션(workstation), 서버, PDA(personal digital assistant), PMP(portable multimedia player), MP3 플레이어, 모바일 의료기기, 카메라(camera), 또는 웨어러블 장치(wearable device) 중 적어도 하나를 포함할 수 있다. 다양한 실시 예에 따르면, 웨어러블 장치는 액세서리형(예: 시계, 반지, 팔찌, 발찌, 목걸이, 안경, 콘택트 렌즈, 또는 머리 착용형 장치(head-mounted-device(HMD)), 직물 또는 의류 일체형(예: 전자 의복), 신체 부착형(예: 스킨 패드(skin pad) 또는 문신), 또는 생체 이식형(예: implantable circuit) 중 적어도 하나를 포함할 수 있다.

또한, 일 실시 예들에서, 전자 장치는 가전 제품(home appliance)일 수 있다. 가전 제품은, 예를 들면, 텔레비전, DVD(digital video disk) 플레이어, 오디오, 냉장고, 에어컨, 청소기, 오븐, 전자레인지, 세탁기, 공기 청정기, 셋톱 박스(set-top box), 홈 오토매이션 컨트롤 패널(home automation control panel), 보안 컨트롤 패널(security control panel), TV 박스(예: 삼성 HomeSync쪠, 애플TV쪠, 또는 구글 TV쪠), 게임 콘솔(예: Xbox쪠, PlayStation쪠), 전자 사전, 전자 키, 캠코더(camcorder), 또는 전자 액자 중 적어도 하나를 포함할 수 있다.

다른 실시 예에서, 전자 장치는, 각종 의료기기(예: 각종 휴대용 의료측정기기(혈당 측정기, 심박 측정기, 혈압 측정기, 또는 체온 측정기 등), MRA(magnetic resonance angiography), MRI(magnetic resonance imaging), CT(computed tomography), 촬영기, 또는 초음파기 등), 네비게이션(navigation) 장치, 위성 항법 시스템(GNSS(global navigation satellite system)), EDR(event data recorder), FDR(flight data recorder), 자동차 인포테인먼트(infotainment) 장치, 선박용 전자 장비(예: 선박용 항법 장치, 자이로 콤파스 등), 항공 전자기기(avionics), 보안 기기, 차량용 헤드 유닛(head unit), 산업용 또는 가정용 로봇, 금융 기관의 ATM(automatic teller's machine), 상점의 POS(point of sales), 또는 사물 인터넷 장치(internet of things)(예: 전구, 각종 센서, 전기 또는 가스 미터기, 스프링클러 장치, 화재경보기, 온도조절기(thermostat), 가로등, 토스터(toaster), 운동기구, 온수탱크, 히터, 보일러 등) 중 적어도 하나를 포함할 수 있다.

또 다른 실시 예에 따르면, 전자 장치는 가구(furniture) 또는 건물/구조물의 일부, 전자 보드(electronic board), 전자 사인 수신 장치(electronic signature receiving device), 프로젝터(projector), 또는 각종 계측 기기(예: 수도, 전기, 가스, 또는 전파 계측 기기 등) 중 적어도 하나를 포함할 수 있다. 다양한 실시 예에서, 전자 장치는 전술한 다양한 장치들 중 하나 또는 그 이상의 조합일 수 있다. 어떤 실시 예에 따른 전자 장치는 플렉서블 전자 장치일 수 있다. 또한, 본 문서의 실시 예에 따른 전자 장치는 전술한 기기들에 한정되지 않으며, 기술 발전에 따른 새로운 전자 장치를 포함할 수 있다.

본 개시의 일 실시 예에 따른 전자 장치는 사용자가 접속한 웹 사이트를 분석하여 사용자의 선호도를 판단하기 위해, 사용자가 접속한 웹 사이트의 URL(Uniform Resource Locator)에 포함된 텍스트로부터 사전적 의미를 갖는 단어를 추출하여 웹 사이트의 카테고리를 판단할 수 있다. 이때, 카테고리는 사용자의 선호도를 판단하기 위해 분야별, 주제별 등으로 웹 사이트를 구분하기 위한 항목이 될 수 있으며, 예를 들어 복수의 카테고리는 각각 축구, IT, 뉴스, 경제 등과 같은 항목이 될 수 있다.

여기서, URL은 웹 사이트(또는 웹 페이지)의 주소로서 텍스트를 포함 할 수 있다. 일반적으로, URL에 포함된 텍스트는 상기 웹 사이트의 주제, 목적, 성격 등을 나타낸다는 점에서, 카테고리를 분류하는 경우에 사용되는 소스로서 대표될 수 있다..

이하에서, 첨부된 도면을 이용하여 본 개시의 다양한 실시 예들에 대하여 구체적으로 설명한다.

도 1을 참조하면, 전자 장치(100)는 메모리(110) 및 프로세서(120)를 포함한다. 다만, 도 1에 도시된 전자 장치(100)의 구성들은 본 개시의 실시 예들을 구현하기 위한 예시적인 구성이며, 통상의 기술자에게 자명한 수준의 하드웨어/소프트웨어 구성들이 전자 장치(100)에 추가적으로 포함될 수 있으며, 구체적인 내용은 도 8과 함께 후술하여 설명하기로 한다.

메모리(110)는 적어도 하나의 명령을 포함할 수 있다. 구체적으로, 메모리(110)는 전자 장치(100)의 적어도 하나의 다른 구성요소 (예: 프로세서(120))가 동작하도록 하는 적어도 하나의 명령(또는 데이터)을 포함할 수 있다. 또한, 메모리(110)는 URL(Uniform Resource Locator)을 카테고리로 분류하도록 학습된 인공지능 모델(이하 학습된 분류 모델이라 한다)에 관련된 적어도 하나의 명령을 포함할 수 있다.

메모리(110)에는 URL이 복수의 카테고리에 따라 분류되어, URL 및 URL에 대응되는 복수의 카테고리 각각에 대한 확률 값이 저장될 수 있으며, 갱신될 수 있다.

메모리(110)는 비휘발성 메모리, 휘발성 메모리, 플래시메모리(flash-memory), 하드디스크 드라이브(HDD) 또는 솔리드 스테이트 드라이브(SSD) 등과 같은 저장 장치로서 구현될 수 있다. 메모리(110)는 프로세서(120)에 의해 액세스되며, 프로세서(120)에 의한 데이터의 독취/기록/수정/삭제/갱신 등이 수행될 수 있다. 본 개시의 메모리라는 용어는 메모리(110), 프로세서(120) 내의 RAM(미도시), ROM(미도시) 또는 전자 장치(100)에 장착되는 메모리 카드(미도시)(예를 들어, micro SD 카드, 메모리 스틱 등)를 포함할 수 있다.

프로세서(120)는 전자 장치(100)의 전반적인 동작을 제어할 수 있다. 프로세서(120)는 메모리(110)와 연결되어 전자 장치(100)를 제어할 수 있다.

프로세서(120)는 적어도 하나의 명령어를 실행함으로써, 사용자가 기설정된 기간 동안에 접속한 적어도 하나의 웹 사이트에 대응되는 URL(Uniform Resource Locator)을 적어도 하나의 세그먼트로 구분할 수 있다. 이때, 기설정된 기간은 예를 들어, 30분, 4시간, 3일, 2주, 1달 등과 같이 다양하게 설정된 기간으로서, 설정된 이후에도 변경될 수 있다. 이에 따라, 입력 데이터 또는 처리되는 데이터의 양을 조절하여 리소스 관리를 도모할 수 있다.

이때, 세그먼트는 말뭉치에 포함된 단어(word)일 수 있다. 여기서, 말뭉치는 언어 처리를 위해 텍스트를 컴퓨터가 판독할 수 있는 형태로 모아 놓은 언어 자료를 의미한다. 말뭉치는 통계 분석 및 가설 검증을 수행하거나 특정한 언어 영역 내에서 언어 규칙 발생의 검사와 그 규칙의 정당성 입증에 사용된다. 말뭉치는 단어(사전적 의미를 갖는 단어 또는 고유 명사 등을 포함) 및 문맥 정보(예: 단어의 사용 빈도수, 함께 쓰이는 단어 등) 등을 포함할 수 있다.

일 실시 예로서, 프로세서(120)는 말뭉치(corpus)에 기초하여, 적어도 하나의 웹 사이트 각각에 대응되는 URL을 적어도 하나의 세그먼트로 각각 구분할 수 있다.

예를 들어, URL 은 [samsungnetwork]이고 말뭉치는 [samsung], [net], [work], [network]를 포함하는 경우를 가정하면, 프로세서(120)는 말뭉치에 포함된 단어 및 문맥 정보에 기초하여 URL을 [samsung], [net], [work]와 같은 세그먼트로 구분하거나, [samsung], [network]와 같은 세그먼트로 구분할 수 있다.

프로세서(120)는 적어도 하나의 세그먼트 및 학습된 분류 모델에 기초하여, 복수의 카테고리에 따라 URL을 분류할 수 있다.

구체적으로, 프로세서(120)는 URL에 대응되는 적어도 하나의 세그먼트에 기초한 입력 데이터를 학습된 분류 모델에 입력하면 복수의 카테고리 중 상기 URL이 속하는 적어도 하나의 카테고리(또는 확률 값)를 획득하고, 획득된 카테고리에 따라 상기 URL을 카테고리로 분류한 분류 결과를 획득할 수 있다. 여기서, 분류 결과는 임계 값에 의해 확률 값이 필터링 된 결과 값을 의미할 수 있다. 예를 들어, 임계 값보다 작은 확률 값은 0으로 처리될 수 있다.

이때, 학습된 분류 모델은 URL에 대응되는 세그먼트(또는 특징 값)으로부터 상기 URL이 속하는 카테고리로 분류하거나 카테고리에 속하는 확률 값을 획득하도록 학습된 인공 지능 모델일 수 있으며, 신경망 모델, 유전자 모델, 확률 통계 모델 등으로 구현될 수 있다.

한편, 학습된 분류 모델은 복수의 URL 및 복수의 URL 각각이 속하는 카테고리에 대한 정보를 학습 데이터로서 이용하여 학습될 수 있다. 이때, 복수의 URL 각각이 속하는 카테고리에 대한 정보는 오픈 디렉터리 프로젝트(Open Directory Project, ODP)의 각 카테고리 별 로지스틱 회귀(logistic regression), 서포트 벡터 머신(support vector machine, SVM) 등의 방식을 이용하거나 크라우드 소싱 등과 같은 방식에 따라 웹 사이트(또는 URL)가 특정한 카테고리에 속한다고 기분류된 정보로서, 웹 사이트(또는 URL)이 특정한 카테고리에 속하는 확률 값을 포함할 수 있다. 예를 들어, URL이 특정한 카테고리에 속하는 확률 값(예: 0에서 1까지 중 하나의 값)은 1이 될 수 있으나, URL이 속하는 복수의 카테고리 중 관련성이 상대적으로 낮은 부수적인 카테고리의 경우 1보다 작은 값이 될 수도 있다.

일 실시 예로서, 프로세서(120)는 적어도 하나의 세그먼트에 대한 특징 값을 획득하고, 특징 값을 학습된 분류 모델에 대한 입력 데이터로서 사용하여 URL이 복수의 카테고리에 속하는 확률 값을 획득할 수 있다.

구체적으로, 프로세서(120)는 적어도 하나의 세그먼트를 학습된 분류 모델에 입력 값으로 사용하기 위해, 특징 추출(feature extraction)을 이용하여 적어도 하나의 세그먼트를 n차원(n은 자연수)의 공간 상의 점에 대응되는 하나의 특징 값으로 변환하여 특징 값을 획득할 수 있다. 이때, 프로세서(120)는 하나 또는 복수의 세그먼트를 하나의 특징 값(URL에 대응되는 특징 값)으로 변환할 수 있다(즉, URL 당 하나의 특징 값을 획득할 수 있다).

이 경우, 프로세서(120)는 URL에 대응되는 특징 값을 학습된 분류 모델에 대한 입력 데이터로서 사용하여, URL이 복수의 카테고리 각각에 속하는 확률 값을 획득할 수 있다. 일 예로서, URL이 복수의 카테고리 각각에 속하는 확률 값은 0에서 1까지 중 하나의 값이 될 수 있다.

그리고, 프로세서(120)는 URL이 복수의 카테고리 각각에 속하는 확률 값을 임계 값과 비교하여, 상기 URL을 복수의 카테고리 중에서 임계 값보다 크거나 같은 상기 확률 값을 갖는 카테고리로 분류할 수 있다. 이때, 임계 값은 URL을 카테고리로 분류하는 기준의 정도를 나타내며, 민감도를 의미할 수 있다. 예를 들어, 임계 값은 0.5 와 같이 설정될 수 있으며, 전자 장치(100)의 입력부(미도시)를 통해 설정된 임계 값은 변경될 수 있다.

이때, 프로세서(120)는 URL이 카테고리로 분류되면, 분류된 URL 및 URL에 대응되는 카테고리에 대한 확률 값을 메모리(110)에 저장하거나, 갱신할 수 있다.

프로세서(120)는 기설정된 기간 동안 사용자의 웹 사이트 접속 이력, 적어도 하나의 웹 사이트에 대한 접속 이력 및 분류 결과에 기초하여, 복수의 카테고리 중에서 사용자가 선호하는 웹 사이트의 카테고리를 판단할 수 있다.

이를 위해, 프로세서(120)는 전자 장치(100)의 통신부(미도시)를 통해 사용자가 웹 사이트를 접속한 횟수, 사용자가 웹 사이트를 접속한 일시, 사용자가 접속한 웹 사이트에 대응되는 URL, 사용자를 구별할 수 있는 사용자 정보 등을 외부 전자 장치로부터 수신할 수 있다.

이 경우, 프로세서(120)는 기설정된 기간 동안 사용자의 웹 사이트 접속 이력, 적어도 하나의 웹 사이트에 대한 접속 이력 및 분류 결과에 기초하여 복수의 카테고리 각각에 대한 사용자의 선호도를 산출하고, 산출된 선호도에 기초하여 사용자가 선호하는 웹 사이트의 카테고리를 판단할 수 있다.

일 실시 예로서, 프로세서(120)는 기설정된 기간 동안 사용자의 웹 사이트 접속 이력, 웹 사이트에 접속한 사용자의 접속 이력 및 확률 값에 기초하여, 복수의 카테고리 중에서 사용자가 선호하는 웹 사이트의 카테고리를 판단할 수 있다.

이때, 확률 값은 URL이 카테고리에 속할 확률 값으로서, 임계 값보다 크거나 같은 확률 값을 의미할 수 있다. 즉, 임계 값보다 작은 확률 값은 0으로 처리될 수 있다.

일 실시 예에서, 프로세서(120)는 적어도 하나의 URL 각각에 대해, 기설정된 기간 동안에 사용자가 적어도 하나의 웹 사이트에 접속한 횟수에 대한 사용자가 특정 URL에 대응되는 웹 사이트에 접속한 횟수의 비율을 사용자의 웹 사이트 접속 이력으로 산출할 수 있다.

예를 들어, 프로세서(120)는 하기의 수학식 1의 (1)을 이용하여, 특정한 웹 사이트 A에 대응되는 URL에 대해, 기설정된 기간 동안에 제1 사용자가 접속한 전체 웹 사이트 중 특정한 웹 사이트 A에 접속한 횟수의 비율을 제1 사용자의 웹 사이트 접속 이력으로 산출할 수 있다.

여기서, Count(ID-1)은 특정한 사용자인 제1 사용자(ID-1)를 기준으로 기설정된 기간 동안 제1 사용자(ID-1)가 접속한 전체 웹 사이트에 대한 접속 횟수를 의미하고, Count(ID-1, URL-A)는 제1 사용자(ID-1)가 웹 사이트 A(URL-A)에 접속한 횟수를 의미할 수 있다.

한편, 웹 사이트 A(URL-A)에 대한 제1 사용자(ID-1)의 웹 사이트 접속 이력은 수학식 1의 (1)와 같이 Freq1(ID-1, URL-A)가 되고, 제1 사용자(ID-1)의 웹 사이트 전체에 대한 웹 사이트 접속 이력은 수학식 1의 (2)와 같이 "1"이 될 수 있다.

일 실시 예에서, 프로세서(120)는 적어도 하나의 웹 사이트 각각에 대해, 기설정된 기간 동안에 웹 사이트에 접속한 전체 사용자의 접속 횟수에 대한 사용자가 웹 사이트에 접속한 횟수의 비율을 적어도 하나의 웹 사이트에 대한 접속 이력으로 산출할 수 있다.

예를 들어, 프로세서(120)는 하기의 수학식 2의 (1)을 이용하여, 특정한 웹 사이트에 대응되는 URL에 대해, 기설정된 기간 동안에 특정한 웹 사이트에 접속한 전체 사용자 중 특정한 사용자가 접속한 횟수의 비율을 적어도 하나의 웹 사이트에 대한 접속 이력으로 산출할 수 있다.

여기서, Count(URL-A)은 특정한 웹 사이트 A(URL-A)를 기준으로 기설정된 기간 동안 웹 사이트 A(URL-A)에 접속한 전체 사용자가 접속한 횟수를 의미하고, Count(URL-A, ID-1)는 웹 사이트 A(URL-A)에 제1 사용자(ID-1)가 접속한 횟수를 의미할 수 있다.

한편, 제1 사용자(ID-1)의 웹 사이트A(URL-A)에 대한 웹 사이트 접속 이력은 수학식 2의 (1)와 같이 Freq2(URL-A, ID-1)가 되고, 웹 사이트 A(URL-A)에 대한 전체 사용자의 웹 사이트 접속 이력은 수학식 2의 (2)와 같이 "1"이 될 수 있다.

일 실시 예에서, 프로세서(120)는 기설정된 기간 동안 사용자의 웹 사이트 접속 이력, 적어도 하나의 웹 사이트에 대한 접속 이력 및 분류 결과에 기초하여, 복수의 카테고리 각각에 대한 사용자의 선호도를 산출할 수 있다.

예를 들어, 프로세서(120)는 하기의 수학식 3을 이용하여, 기설정된 기간 동안 제1 사용자의 웹 사이트 접속 이력, 적어도 하나의 웹 사이트에 대한 접속 이력 및 확률 값에 기초하여, 복수의 카테고리 각각에 대한 제1 사용자의 선호도(또는 스코어)를 산출할 수 있다.

여기서, Freq1(ID-1,URL-A)는 제1 사용자(ID-1)의 전체 웹 사이트 중 웹 사이트 A(URL-A)에 대한 제1 사용자(ID-1)의 웹 사이트 접속 이력을, Freq2(URL-A, ID-1)는 웹 사이트A(URL-A)에 접속한 전체 사용자 중 제1 사용자(ID-1)의 웹 사이트A(URL-A)에 대한 웹 사이트 접속 이력을 의미할 수 있다.

이때, Prob(URL-A,Cat-a)는 웹 사이트 A(URL-A)가 카테고리 a(Cat-a)에 속할 확률 값이 임계 값보다 크거나 같은 경우의 확률 값을 의미할 수 있다. 예를 들어, 웹 사이트 A(URL-A)가 카테고리 a(Cat-a)에 속할 확률 값 "0.7"이 임계 값(예: 0.5)보다 크거나 같은 경우에 Prob(URL-A,Cat-a)는 "0.7"이 될 수 있으며, 웹 사이트 B(URL-B)가 카테고리 a(Cat-a)에 속할 확률 값 "0.2"가 임계 값(예: 0.5)보다 작은 경우에 Prob(URL-B,Cat-a)는 "0"이 될 수 있다.

이 경우, 선호도 Score(ID-1, Cat-a)는 웹 사이트의 카테고리 a(Cat-a)에 대해 제1 사용자(ID-1)가 선호하는 정도를 나타낼 수 있다.

프로세서(120)는 사용자가 선호하는 웹 사이트의 카테고리와 관련된 정보를 제공할 수 있다.

도 2는 본 개시의 일 실시 예에 따른 URL을 카테고리로 분류하는 방법을 설명하기 위한 도면이다. 도 2를 참조하여, 사용자가 접속한 URL은 [http://www.animenewsnetwork.com/reviews/display.php?id=6]와 같은 경우를 가정한다.

프로세서(120)는 사용자가 접속한 웹 사이트에 대응되는 URL 등을 외부 전자 장치로부터 전자 장치(100)의 통신부(미도시)를 통해 수신할 수 있다(S210). 이때, 외부 전자 장치는 사용자의 사용자 단말(예: PC, 스마트폰, 태블릿 PC, 랩탑 PC, PDA 등) 또는 외부 서버 등과 같은 다양한 전자 장치일 수 있으며, 전자 장치(100)와 다양한 방식의 유/무선 통신을 수행하여 다양한 데이터를 송수신할 수 있다. 한편, 사용자는 외부 전자 장치의 사용자를 의미하는 것이나, 이에 한하지 아니하며 본 개시의 전자 장치(100)의 사용자로 해석될 수도 있다. 예를 들어, 프로세서(120)는 외부 전자 장치로부터 사용자가 접속한 웹 사이트에 대응되는 [http://www.animenewsnetwork.com/reviews/display.php?id=6] 와 같은 URL을 수신할 수 있다.

프로세서(120)는 수신된 URL에 포함된 기호에 기초하여 수신된 URL에서 적어도 하나의 토큰을 획득할 수 있다(S220). 구체적으로, 프로세서(120)는 수신된 URL에서 기호의 위치를 기준으로 구분하여 기호를 제외한 나머지 텍스트를 별개의 토큰으로서 획득할 수 있다. 이때, 기호는 구분자로서 [/], [_], [-], [=], [:], [.], [?] 등을 포함할 수 있다. 예를 들어, 프로세서(120)는 [http://www.animenewsnetwork.com/reviews/display.php?id=6]와 같은 URL에서 기호의 위치를 기준으로 구분하여 기호를 제외한 나머지 텍스트를 [http], [www], [animenewsnetwork], [com], [reviews], [display], [php], [id], [6]와 같은 토큰으로서 획득할 수 있다.

프로세서(120)는 적어도 하나의 토큰에서 쿼리 스트링(query string)을 제거할 수 있다(S230). 이때, 쿼리 스트링은 데이터를 전달하기 위한 URL의 일부분을 의미할 수 있다. 예를 들어, 프로세서(120)는 [id], [6] 와 같은 쿼리 스트링을 제거할 수 있다.

프로세서(120)는 쿼리 스트링이 제거된 적어도 하나의 토큰에서 기설정된 단어를 제거할 수 있다(S240). 이때, 기설정된 단어는 상기 웹 사이트의 주제, 목적, 성격 등과 무관하게 URL에 공통적으로 사용되는 텍스트를 의미할 수 있으며, 설정된 이후에도 변경될 수 있다. 예를 들어, 프로세서(120)는 쿼리 스트링이 제거된 적어도 하나의 토큰에서 기설정된 단어[http], [www], [com], [php]를 제거할 수 있다.

프로세서(120)는 말뭉치에 기초하여, 쿼리 스트링 및 기설정된 단어가 제거된 토큰에서 적어도 하나의 세그먼트로 구분할 수 있다(S250).

구체적으로, 프로세서(120)는 말뭉치에 기초하여 쿼리 스트링 및 기설정된 단어가 제거된 토큰에서 적어도 하나의 단어를 검출하고, 검출된 하나의 단어가 하나의 세그먼트에 대응되도록 쿼리 스트링 및 기설정된 단어가 제거된 토큰을 적어도 하나의 세그먼트로 구분할 수 있다. 이때 단어 사전에는 사전적 의미를 갖는 단어가 포함될 수 있으며, 전자 장치(100)의 메모리(110) 또는 외부 전자 장치에 단어 사전이 기저장되어 있을 수 있다.

예를 들어, 프로세서(120)는 쿼리 스트링 및 기설정된 단어가 제거된 토큰 [animenewsnetwork], [reviews], [display] 중에서, 사전적 의미를 갖는 복수의 단어가 합쳐진 토큰 [animenewsnetwork]를 3개의 세그먼트 [anime], [news], [network]로 구분할 수 있다. 이에 따라, 프로세서(120)는 상기 웹 페이지의 URL로부터 세그먼트[anime], [news], [network], [reviews], [display]를 획득할 수 있다.

이상과 같은 본 개시의 일 실시 예에 따른 전자 장치 및 그의 제어 방법은 사용자가 접속한 웹 사이트를 특정한 카테고리로 분류할 때 그 처리 속도를 향상시키고 리소스의 소모를 줄일 수 있다. 이에 따라, 사용자의 선호도를 보다 신속하게 판단할 수 있는 전자 장치 및 그의 제어 방법을 제공할 수 있다.

도 3에 도시된 예시적인 데이터를 참조하여 선호도를 산출하는 과정을 설명하기로 한다.

예를 들어 도 3의 (a) 및 (b)에 도시된 바와 같이, 확률 값 테이블(310), 분류 결과 테이블(320) 및 사용자별 URL 접속 횟수 테이블(330)에 포함된 숫자로 가정하고 설명하도록 한다.

확률 값 테이블(310)은 웹 사이트 A(URL-A), 웹 사이트 B(URL-B) 및 웹 사이트 C(URC-C) 각각이 카테고리 a(cat-a) 및 카테고리 b(cat-b)에 속하는 확률 값을 포함할 수 있다. 일 예로서, 웹 사이트 A(URL-A)가 카테고리 a(cat-a)에 속할 확률은 "0.849", 웹 사이트 A(URL-A)가 카테고리 b(cat-b)에 속할 확률은 "0.116"이 될 수 있다.

분류 결과 테이블(320)은 확률 값 테이블(310)의 확률 값이 임계 값에 의해 필터링된 분류 결과 값을 포함할 수 있다. 임계 값인 "0.5"인 경우 임계 값 보다 작은 확률 값은 "0"의 분류 값으로 처리될 수 있다. 일 예로서, 웹 사이트 A(URL-A)가 카테고리 a(cat-a)에 분류된 분류 결과 값은 "0.849", 웹 사이트 A(URL-A)가 카테고리 b(cat-b)에 분류된 분류 결과 값은 "0"이 될 수 있다.

사용자별 URL 접속 횟수 테이블(330)은 제1 사용자(ID-1) 및 제2 사용자(ID-2)가 각각 웹 사이트 A(URL-A), 웹 사이트 B(URL-B) 및 웹 사이트 C(URC-C)에 접속한 횟수를 포함할 수 있다. 일 예로서, 기설정된 기간 동안 제1 사용자(ID-1)가 웹 사이트 A(URL-A)에 접속한 횟수는 86회, 제1 사용자(ID-1)가 웹 사이트 B(URL-B)에 접속한 횟수는 11회가 될 수 있다.

도 3의 (c)를 참조하여, 사용자의 웹 사이트 접속 이력 테이블(340)은, 수학식 1의 (1)을 이용하여 산출된 사용자가 적어도 하나의 웹 사이트에 접속한 횟수에 대한 사용자가 특정 URL에 대응되는 웹 사이트에 접속한 횟수의 비율을 포함할 수 있다. 일 예로서, 프로세서(120)는 기설정된 기간 동안 제1 사용자(ID-1)가 접속한 전체 웹 사이트에 대한 접속 횟수 161회 (웹 사이트 A에 86회, 웹 사이트 B에 11회, 웹 사이트 C에 64회) 중 웹 사이트 A에 접속한 횟수 86회의 비율인 0.534(86/161)를 Freq1(ID-1, URL-A)로서 산출할 수 있다.

적어도 하나의 웹 사이트에 대한 접속 이력 테이블(350)은, 수학식 2의 (1)을 이용하여 산출된 특정한 웹 사이트에 대응되는 URL에 대해, 기설정된 기간 동안에 특정한 웹 사이트에 접속한 전체 사용자 중 특정한 사용자가 접속한 횟수의 비율을 포함할 수 있다. 일 예로서, 프로세서(120)는 웹 사이트 A에 대응되는 URL에 대해, 기설정된 기간 동안에 웹 사이트 A에 접속한 전체 사용자의 접속 횟수 93회(제1 사용자가 86회, 제2 사용자가 7회) 중 제1 사용자가 접속한 횟수 86회의 비율인 "0.925"(86/93)를 Freq2(URL-A, ID-1)로서 산출할 수 있다.

도 3의 (d)를 참조하여, 카테고리 a에 대한 선호도 테이블(360), 카테고리 b에 대한 선호도 테이블(370)은 수학식 3을 이용하여 산출된 복수의 카테고리 각각에 대한 웹 사이트 별 사용자의 선호도를 포함할 수 있다. 선호도 테이블(380)은 수학식 3을 이용하여 산출된 복수의 카테고리 각각에 대한 사용자의 선호도를 포함할 수 있다.

일 예로서, 프로세서(120)는 Freq1(ID-1, URL-A) x Freq2(URL-A, ID-1) x Prob(URL-A, cat-a) + Freq1(ID-1, URL-B) x Freq2(URL-B, ID-1) x Prob(URL-B, cat-a) + Freq1(ID-1, URL-C) x Freq2(URL-C, ID-1) x Prob(URL-C, cat-a) = 0.534 x 0.925 x 0.849 + 0.068 x 0.102 x 0 + 0.398 x 0.547 x 0.721 = 0.419 + 0 + 0.157 = "0.576" 을 제1 사용자의 카테고리 a에 대한 선호도로서 산출할 수 있다.

일 실시 예에서, 프로세서(120)는 사용자가 선호하는 웹 사이트의 카테고리와 관련된 정보를 제공할 수 있다.

구체적으로, 프로세서(120)는 복수의 카테고리 각각에 대응되는 선호도에 따라, 가장 높은 선호도에 대응되는 카테고리를 사용자가 선호하는 웹 사이트의 카테고리로 판단하고, 사용자가 선호하는 웹 사이트의 카테고리와 관련된 정보를 사용자의 외부 전자 장치로 제공할 수 있다. 이때, 사용자가 선호하는 웹 사이트의 카테고리와 관련된 정보는 사용자 선호도 기반의 사용자 맞춤형 광고 또는 컨텐츠 등을 포함할 수 있다.

이 경우, 프로세서(120)는 산출된 선호도에 대응되는 카테고리에 관련된 정보를 선호도가 높은 순서로 우선적으로 제공할 수 있다.

예를 들어, 도 4의 (a) 및 (b)를 참조하면, 가장 높은 선호도를 갖는 카테고리가 커피이고, 두번째로 높은 선호도를 갖는 카테고리가 야구인 경우를 가정한다.

프로세서(120)는 산출된 선호도에 기초하여, 가장 높은 선호도에 대응되는 카테고리인 음료를 제1 사용자가 선호하는 웹 사이트의 제1 선호 카테고리라고 판단하고, 두번째로 높은 선호도에 대응되는 카테고리인 야구를 제1 사용자가 선호하는 웹 사이트의 제2 선호 카테고리라고 판단할 수 있다.

그리고, 프로세서(120)는 제1 사용자가 웹 사이트를 요청하는 신호가 수신되면, 도 4의 (a)와 같이 웹 사이트의 광고 배너(410)에 제1 선호 카테고리인 커피와 관련되는 이미지(광고 등)가 표시되도록 하는 사용자가 선호하는 웹 사이트의 카테고리와 관련된 정보를 제1 사용자의 외부 전자 장치로 우선적으로 전송할 수 있다.

이후, 프로세서(120)는 제1 사용자가 웹 페이지를 요청하는 신호가 다시 수신되면, 도 4의 (b)와 같이 웹 사이트의 광고 배너(420)에 제2 선호 카테고리인 커피와 관련되는 이미지(광고 등)가 표시되도록 하는 사용자가 선호하는 웹 사이트의 카테고리와 관련된 정보를 제1 사용자의 외부 전자 장치로 전송할 수 있다.

한편, 도 4의 (a) 및 (b)는 동일한 웹 사이트의 광고 배너인 것으로 도시하였으나 이는 일 실시 예일 뿐이며, 다른 웹 사이트(예: 검색 엔진, 포털 사이트, 뉴스, 어플리케이션 스토어, VOD 서비스 화면 등)의 광고 배너가 될 수도 있다.

한편, 프로세서(120)는 사용자가 선호하는 웹 사이트의 카테고리와 관련된 정보를 사용자의 외부 전자 장치에게 제공하는 것으로 설명하였으나, 이는 일 실시 예일 뿐이고, 프로세서(120)는 본 개시의 전자 장치(100)에게 제공하거나, 다른 중간 매개 장치를 통해 사용자의 외부 전자 장치로 제공하는 것 또한 가능하다.

도 5를 참조하여, 프로세서(120)는 URL 비교 모듈(520), 전처리 모듈(531), 특징 추출 모듈(533), URL 분류 모듈(535), 임계 값 비교 모듈(537), 카테고리 분류 모듈(540), 사용자 관심 스코어 생성 모듈(550)을 포함할 수 있으며, 프로세서(120) 에 포함된 각 모듈들이 도 5의 파이프라인에 따른 동작을 수행할 수 있다. 다만, 이는 일 실시 예일뿐이고, 이와 같은 모듈들은 메모리(110)에 구분되어 저장되며 프로세서(120)가 각각의 모듈에 포함된 명령어에 따른 동작을 수행할 수도 있다.

이하에서는 설명의 편의를 위해, 프로세서(120)에 포함된 각 모듈들이 동작을 수행하는 것으로 가정하도록 한다.

먼저, 사용자가 접속한 웹 사이트에 대응되는 URL(510)이 외부 전자 장치로부터 수신되는 경우, URL 비교 모듈(520)은 수신된 URL(510)이 메모리(110)에 저장된 URL에 매칭되는지 여부를 판단한다. 이때, 메모리(110)에는 URL이 복수의 카테고리에 따라 분류되어, URL 및 URL에 대응되는 복수의 카테고리 각각에 대한 확률 값이 기저장될 수 있다.

일 실시 예로서, 수신된 URL(510)이 메모리(110)에 저장된 URL에 매칭되는 경우, URL 비교 모듈(520)은 메모리(110)에 저장된 복수의 URL 중 수신된 URL(510)과 매칭되는 URL을 검색하여, 검색된 URL과 매칭되는 카테고리에 대한 확률 값을 획득하고, 수신된 URL(510)을 검색된 URL에 매칭되는 카테고리로 분류할 수 있다.

다른 실시 예로서, 수신된 URL(510)이 메모리(110)에 저장된 URL에 매칭되지 않는 경우, 상술한 도 2의 S220, S230, S240, S250 단계에 대한 설명이 동일하게 적용될 수 있다. 구체적으로, 전처리 모듈(531)은 수신된 URL(510)에 포함된 기호에 기초하여 수신된 URL(510)에서 적어도 하나의 토큰을 획득할 수 있다. 전처리 모듈(531)은 적어도 하나의 토큰에서 쿼리 스트링(query string) 및 기설정된 단어를 제거할 수 있다. 전처리 모듈(531)은 말뭉치에 기초하여, 쿼리 스트링 및 기설정된 단어가 제거된 토큰에서 적어도 하나의 세그먼트로 구분할 수 있다. 한편, 이는 일 실시 예일 뿐이고, 전처리 모듈(531)에서 수행되는 각 동작은 별도 모듈로 구분되어 수행될 수 있다.

이 경우, 특징 추출 모듈(533)은 전처리 모듈(531)에서 구분된 적어도 하나의 세그먼트에 대한 특징 값을 획득하고, URL 분류 모듈(535)은 특징 추출 모듈(533)에서 획득된 특징 값을 학습된 분류 모델에 대한 입력 데이터로서 사용하여 복수의 카테고리에 따라 URL이 속하는 확률 값을 획득할 수 있고, 임계 값 비교 모듈(537)은 URL 분류 모듈(535)에서 획득된 확률 값을 임계 값과 비교할 수 있고, 카테고리 분류 모듈(540)은 URL 분류 모듈(535)에서 비교한 결과로서, 임계 값보다 크거나 같은 확률 값을 갖는 카테고리를 수신된 URL(510)에 대한 카테고리로 분류할 수 있다(S537).

상술한 실시 예에서, 카테고리 분류 모듈(540)에 의해 수신된 URL(510)이 카테고리가 분류되면(S540), 사용자 관심 스코어 생성 모듈(550)은 기설정된 기간 동안 사용자의 웹 사이트 접속 이력, 적어도 하나의 웹 사이트에 대한 접속 이력 및 분류 결과에 기초하여, 복수의 카테고리 각각에 대한 사용자의 선호도를 산출할 수 있다.

한편, 카테고리 분류 모듈(540)은 수신된 URL(510)이 메모리(110)에 저장된 URL에 매칭되지 않는 경우에, 수신된 URL(510)이 카테고리로 분류되면(S540) 분류된 URL 및 URL에 대응되는 카테고리에 대한 확률 값을 메모리(110)에 저장하거나, 갱신할 수 있다.

이상과 같은, 본 개시의 일 실시 예에 따른 전자 장치 및 그의 제어 방법은 사용자가 접속한 웹 사이트를 특정한 카테고리로 분류할 때 그 처리 속도를 향상시키고 리소스의 소모를 줄일 수 있다. 이에 따라, 사용자의 선호도를 보다 신속하게 판단할 수 있는 전자 장치 및 그의 제어 방법을 제공할 수 있다.

도 6은 본 개시의 일 실시 예에 따른 인공지능 모델을 생성(또는 학습)하기 위한 방법을 설명하기 위한 도면이다.

도 6을 참조하여, 프로세서(120)는 복수의 URL 및 복수의 URL 각각이 속하는 카테고리에 대한 정보가 수신되면, 수신된 정보로부터 복수의 URL 및 복수의 URL 각각이 속하는 카테고리로 기분류된 확률 값을 획득할 수 있다(S610).

다음으로, 프로세서(120)는 전처리 단계로서 복수의 URL 각각을 적어도 하나의 세그먼트로 각각 구분할 수 있다(S620). 이는 상술한 도 2의 S220, S230, S240, S250 단계에 대한 설명이 동일하게 적용될 수 있다.

구체적으로, 프로세서(120)는 수신된 URL에 포함된 기호에 기초하여 수신된 URL에서 적어도 하나의 토큰을 획득할 수 있다. 프로세서(120)는 적어도 하나의 토큰에서 쿼리 스트링(query string) 및 기설정된 단어를 제거할 수 있다. 프로세서(120)는 말뭉치에 기초하여, 쿼리 스트링 및 기설정된 단어가 제거된 토큰에서 적어도 하나의 세그먼트로 구분할 수 있다.

다음으로, 프로세서(120)는 적어도 하나의 세그먼트에 대한 특징 값을 획득하고(S630), 특징 값을 입력 데이터로서 사용하여 복수의 URL 각각이 속하는 카테고리로 기분류된 확률 값이 출력될 수 있도록 하는 학습된 분류 모델을 생성할 수 있다(S640).

도 7의 (a)를 참조하면, 프로세서(120)는 학습부(121) 및 인식부(122) 중 적어도 하나를 포함할 수 있다. 이때, 프로세서(120)는 본 개시의 전자 장치(100)의 프로세서(120) 또는 데이터 학습 서버의 프로세서에 대응될 수 있다.

학습부(121)는 URL(또는 세그먼트)을 카테고리로 분류하기 위한 판단 기준을 갖는 분류 모델을 생성하거나 학습시킬 수 있다.

일 예로, 학습부(121)는 ODP와 같이 URL이 카테고리로 기분류된 정보 또는 분류 모델을 통해 URL이 카테고리로 분류된 정보 등과 같은 학습 데이터를 이용하여 URL이 어떤 카테고리에 속하는 것인지 판단하는 판단 기준을 갖는 분류 모델을 학습 또는 갱신시킬 수 있다.

인식부(122)는 URL에 대응되는 데이터를 학습된 분류 모델의 입력 데이터로 사용하여, URL이 속하는 카테고리를 추정할 수 있다.

일 예로, 인식부(122)는 URL에 포함된 적어도 하나의 세그먼트에 대한 특징 값을 학습된 분류 모델의 입력 데이터로 사용하여 URL이 속하는 카테고리에 대한 확률 값을 획득(또는, 추정, 추론)할 수 있다.

학습부(121)의 적어도 일부 및 인식부(122)의 적어도 일부는, 소프트웨어 모듈로 구현되거나 적어도 하나의 하드웨어 칩 형태로 제작되어 전자 장치에 탑재될 수 있다. 예를 들어, 학습부(121) 및 인식부(122) 중 적어도 하나는 인공 지능(AI; artificial intelligence)을 위한 전용 하드웨어 칩 형태로 제작될 수도 있고, 또는 기존의 범용 프로세서(예: CPU 또는 application processor) 또는 그래픽 전용 프로세서(예: GPU)의 일부로 제작되어 전술한 각종 전자 장치 또는 객체 인식 장치에 탑재될 수도 있다. 이 때, 인공 지능을 위한 전용 하드웨어 칩은 확률 연산에 특화된 전용 프로세서로서, 기존의 범용 프로세서보다 병렬처리 성능이 높아 기계 학습과 같은 인공 지능 분야의 연산 작업을 빠르게 처리할 수 있다. 학습부(121) 및 인식부(122)가 소프트웨어 모듈(또는, 인스트럭션(instruction) 포함하는 프로그램 모듈)로 구현되는 경우, 소프트웨어 모듈은 컴퓨터로 읽을 수 있는 판독 가능한 비일시적 판독 가능 기록매체(non-transitory computer readable media)에 저장될 수 있다. 이 경우, 소프트웨어 모듈은 OS(Operating System)에 의해 제공되거나, 소정의 애플리케이션에 의해 제공될 수 있다. 또는, 소프트웨어 모듈 중 일부는 OS(Operating System)에 의해 제공되고, 나머지 일부는 소정의 애플리케이션에 의해 제공될 수 있다.

이 경우, 학습부(121) 및 인식부(122)는 하나의 전자 장치에 탑재될 수도 있으며, 또는 별개의 전자 장치들에 각각 탑재될 수도 있다. 예를 들어, 학습부(121) 및 인식부(122) 중 하나는 본 개시의 전자 장치(100)에 포함되고, 나머지 하나는 외부의 서버에 포함될 수 있다. 또한, 학습부(121) 및 인식부(122)는 유/무선 방식의 통신을 수행하여, 학습부(121)가 구축한 모델 정보를 인식부(122)로 제공할 수도 있고, 인식부(122)로 입력된 데이터가 추가 학습 데이터로서 학습부(121)로 제공될 수도 있다.

도 7의 (b)를 참조하면, 일 실시예에 따른 학습부(121)는 학습 데이터 획득부(121-1) 및 모델 학습부(121-4)를 포함할 수 있다. 또한, 학습부(121)는 학습 데이터 전처리부(121-2), 학습 데이터 선택부(121-3) 및 모델 평가부(121-5) 중 적어도 하나를 선택적으로 더 포함할 수 있다.

학습 데이터 획득부(121-1)는 URL(또는 세그먼트)을 카테고리로 분류하기 위한 분류 모델에 필요한 학습 데이터를 획득할 수 있다. 본 문서의 실시예로, 학습 데이터 획득부(121-1)는 객체를 포함하는 전체 이미지, 객체 영역에 대응하는 이미지, 객체 정보 및 컨텍스트 정보 중 적어도 하나를 학습 데이터로서 획득할 수 있다. 학습 데이터는 학습부(121) 또는 학습부(121)의 제조사가 수집 또는 테스트한 데이터가 될 수도 있다.

모델 학습부(121-4)는 학습 데이터를 이용하여, 분류 모델이 URL(또는 세그먼트)을 카테고리로 어떻게 분류할 지에 관한 판단 기준을 갖도록 학습시킬 수 있다. 예로, 모델 학습부(121-4)는 학습 데이터 중 적어도 일부를 판단 기준으로 이용하는 지도 학습(supervised learning)을 통하여, 분류 모델을 학습시킬 수 있다. 또는, 모델 학습부(121-4)는, 예를 들어, 별다른 지도 없이 학습 데이터를 이용하여 스스로 학습함으로써, 상황의 판단을 위한 판단 기준을 발견하는 비지도 학습(unsupervised learning)을 통하여, 분류 모델을 학습시킬 수 있다. 또한, 모델 학습부(121-4)는, 예를 들어, 학습에 따른 상황 판단의 결과가 올바른 지에 대한 피드백을 이용하는 강화 학습(reinforcement learning)을 통하여, 분류 모델을 학습시킬 수 있다. 또한, 모델 학습부(121-4)는, 예를 들어, 오류 역전파법(error back-propagation) 또는 경사 하강법(gradient descent)을 포함하는 학습 알고리즘 등을 이용하여 분류 모델을 학습시킬 수 있다

또한, 모델 학습부(121-4)는 입력 데이터를 이용하여 URL(또는 세그먼트)을 카테고리로 분류하기 위하여 어떤 학습 데이터를 이용해야 하는 지에 대한 선별 기준을 학습할 수도 있다.

분류 모델이 학습되면, 모델 학습부(121-4)는 학습된 분류 모델을 저장할 수 있다. 이 경우, 모델 학습부(121-4)는 학습된 분류 모델을 전자 장치(100)의 메모리(110)에 저장할 수 있다. 또는, 모델 학습부(121-4)는 학습된 분류 모델을 전자 장치(100)와 유/무선 네트워크로 연결되는 서버의 메모리에 저장할 수도 있다.

학습부(121)는 분류 모델의 분석 결과를 향상시키거나, 분류 모델의 생성에 필요한 자원 또는 시간을 절약하기 위하여, 학습 데이터 전처리부(121-2) 및 학습 데이터 선택부(121-3)를 더 포함할 수도 있다.

학습 데이터 전처리부(121-2)는 상황 판단을 위한 학습에 획득된 데이터가 이용될 수 있도록, 획득된 데이터를 전처리할 수 있다. 학습 데이터 전처리부(121-2)는 모델 학습부(121-4)가 상황 판단을 위한 학습을 위하여 획득된 데이터를 이용할 수 있도록, 획득된 데이터를 기 설정된 포맷으로 가공할 수 있다.

학습 데이터 선택부(121-3)는 학습 데이터 획득부(121-1)에서 획득된 데이터 또는 학습 데이터 전처리부(121-2)에서 전처리된 데이터 중에서 학습에 필요한 데이터를 선택할 수 있다. 선택된 학습 데이터는 모델 학습부(121-4)에 제공될 수 있다. 학습 데이터 선택부(121-3)는 기 설정된 선별 기준에 따라, 획득되거나 전처리된 데이터 중에서 학습에 필요한 학습 데이터를 선택할 수 있다. 또한, 학습 데이터 선택부(121-3)는 모델 학습부(121-4)에 의한 학습에 의해 기 설정된 선별 기준에 따라 학습 데이터를 선택할 수도 있다.

학습부(121)는 데이터 분류 모델의 분석 결과를 향상시키기 위하여, 모델 평가부(121-5)를 더 포함할 수도 있다.

모델 평가부(121-5)는 분류 모델에 평가 데이터를 입력하고, 평가 데이터로부터 출력되는 분석 결과가 소정 기준을 만족하지 못하는 경우, 모델 학습부(121-4)로 하여금 다시 학습하도록 할 수 있다. 이 경우, 평가 데이터는 분류 모델을 평가하기 위한 기 정의된 데이터일 수 있다.

예를 들어, 모델 평가부(121-5)는 평가 데이터에 대한 학습된 분류 모델의 분석 결과 중에서, 분석 결과가 정확하지 않은 평가 데이터의 개수 또는 비율이 미리 설정된 임계치를 초과하는 경우 소정 기준을 만족하지 못한 것으로 평가할 수 있다.

한편, 학습된 분류 모델이 복수 개가 존재하는 경우, 모델 평가부(121-5)는 각각의 학습된 분류 모델에 대하여 소정 기준을 만족하는지를 평가하고, 소정 기준을 만족하는 모델을 최종 분류 모델로서 결정할 수 있다. 이 경우, 소정 기준을 만족하는 모델이 복수 개인 경우, 모델 평가부(121-5)는 평가 점수가 높은 순으로 미리 설정된 어느 하나 또는 소정 개수의 모델을 최종 분류 모델로서 결정할 수 있다.

도 7의 (c)를 참조하면, 일 실시예에 따른 인식부(122)는 인식 데이터 획득부(122-1) 및 인식 결과 제공부(122-4)를 포함할 수 있다.

또한, 인식부(122)는 인식 데이터 전처리부(122-2), 인식 데이터 선택부(122-3) 및 모델 갱신부(122-5) 중 적어도 하나를 선택적으로 더 포함할 수 있다.

인식 데이터 획득부(122-1)는 상황 판단에 필요한 데이터를 획득할 수 있다. 인식 결과 제공부(122-4)는 인식 데이터 획득부(122-1)에서 획득된 데이터를 입력 값으로 학습된 분류 모델에 적용하여 상황을 판단할 수 있다. 인식 결과 제공부(122-4)는 데이터의 분석 목적에 따른 분석 결과를 제공할 수 있다. 인식 결과 제공부(122-4)는 후술할 인식 데이터 전처리부(122-2) 또는 인식 데이터 선택부(122-3)에 의해 선택된 데이터를 입력 값으로 분류 모델에 적용하여 분석 결과를 획득할 수 있다. 분석 결과는 분류 모델에 의해 결정될 수 있다.

인식부(122)는 분류 모델의 분석 결과를 향상시키거나, 분석 결과의 제공을 위한 자원 또는 시간을 절약하기 위하여, 인식 데이터 전처리부(122-2) 및 인식 데이터 선택부(122-3)를 더 포함할 수도 있다.

인식 데이터 전처리부(122-2)는 상황 판단을 위해 획득된 데이터가 이용될 수 있도록, 획득된 데이터를 전처리할 수 있다. 인식 데이터 전처리부(122-2)는 인식 결과 제공부(122-4)가 상황 판단을 위하여 획득된 데이터를 이용할 수 있도록, 획득된 데이터를 기 정의된 포맷으로 가공할 수 있다.

인식 데이터 선택부(122-3)는 인식 데이터 획득부(122-1)에서 획득된 데이터 또는 인식 데이터 전처리부(122-2)에서 전처리된 데이터 중에서 상황 판단에 필요한 데이터를 선택할 수 있다. 선택된 데이터는 인식 결과 제공부(122-4)에게 제공될 수 있다. 인식 데이터 선택부(122-3)는 상황 판단을 위한 기 설정된 선별 기준에 따라, 획득되거나 전처리된 데이터 중에서 일부 또는 전부를 선택할 수 있다. 또한, 인식 데이터 선택부(122-3)는 모델 학습부(121-4)에 의한 학습에 의해 기 설정된 선별 기준에 따라 데이터를 선택할 수도 있다.

모델 갱신부(122-5)는 인식 결과 제공부(122-4)에 의해 제공되는 분석 결과에 대한 평가에 기초하여, 분류 모델이 갱신되도록 제어할 수 있다. 예를 들어, 모델 갱신부(122-5)는 인식 결과 제공부(122-4)에 의해 제공되는 분석 결과를 모델 학습부(121-4)에게 제공함으로써, 모델 학습부(121-4)가 분류 모델을 추가 학습 또는 갱신하도록 요청할 수 있다.

도 8을 참조하면, 전자 장치(100)는 메모리(110), 프로세서(120) 외에도 통신부(130), 마이크(140), 입출력포트(150), 디스플레이(160) 및 스피커(170)를 중 하나를 포함할 수 있다.

프로세서(120)는 RAM(123), ROM(124), 그래픽 처리부(125), 메인 CPU(126), 제1 내지 n 인터페이스(127-1~127-n), 버스(128)를 포함할 수 있다. 이때, RAM(123), ROM(124), 그래픽 처리부(125), 메인 CPU(126), 제1 내지 n 인터페이스(127-1~127-n) 등은 버스(128)를 통해 서로 연결될 수 있다.

통신부(130)는 다양한 유형의 통신 방식에 따라 다양한 유형의 외부 기기와 통신을 수행하여 다양한 유형의 데이터를 송수신할 수 있다. 통신부(130)는 무선 통신을 수행하는 블루투스 칩(131), 와이파이 칩(132), 무선 통신 칩(133) 및 NFC 칩(134), 유선 통신을 수행하는 이더넷 모듈(미도시) 및 USB 모듈(미도시) 중 적어도 하나를 포함할 수 있다. 이 경우, 유선 통신을 수행하는 이더넷 모듈(미도시) 및 USB 모듈(미도시)은 입출력포트(150)를 통하여 외부 기기와 통신을 수행할 수 있다.

마이크(140)는 전자 장치(100)에 내장된 것으로 사용자의 음성을 직접 수신할 수 있으며, 디지털 변환부(미도시)에 의해 아날로그 신호인 사용자의 음성을 디지털로 변환하여 오디오 신호를 획득할 수 있다.

입출력포트(150)는 전자 장치(100)가 외부 장치(미도시)와 이미지 및/또는 음성에 대한 신호를 송신 및/또는 수신할 수 있도록, 전자 장치(100) 및 외부 장치(미도시)를 유선으로 연결해주는 구성이다.

이를 위해, 입출력포트(150)는 HDMI 포트, 디스플레이 포트, RGB 포트, DVI(Digital Visual Interface) 포트, 썬더볼트 및 컴포넌트 포트 등 유선 포트로 구현될 수 있다.

일 예로, 전자 장치(100)가 이미지 및/또는 음성을 출력할 수 있도록, 전자 장치(100)는 입출력포트(150)를 통해 이미지 및/또는 음성에 대한 신호를 외부 장치(미도시)로부터 수신할 수 있다. 다른 예로, 외부 장치(미도시)가 이미지 및/또는 음성을 출력할 수 있도록, 전자 장치(100)는 입출력포트(150)를 통해 특정한 이미지 및/또는 음성에 대한 신호를 외부 장치로 송신할 수 있다.

이와 같이, 입출력 포트(150)를 통해 이미지 및/또는 음성에 대한 신호가 일방향으로 전송될 수 있다. 다만, 이는 일 실시 예일 뿐, 입출력 포트(150)를 통해 이미지 및/또는 음성에 대한 신호가 양방향으로 전송될 수 있음은 물론이다.

디스플레이(160)는 영상 처리부(미도시)에서 처리한 영상 데이터를 디스플레이 영역(또는 디스플레이)에 디스플레이할 수 있다. 디스플레이 영역은 전자 장치(100)의 하우징의 일면에 노출된 디스플레이(160)의 적어도 일부를 의미할 수 있다. 디스플레이(110)의 적어도 일부는 플렉서블 디스플레이(flexible display)의 형태로 전자 장치(160)의 전면 영역 및, 측면 영역 및 후면 영역 중 적어도 하나에 결합될 수도 있다. 플렉서블 디스플레이는 종이처럼 얇고 유연한 기판을 통해 손상 없이 휘거나 구부리거나 말 수 있는 것을 특징으로 할 수 있다.

스피커(170)는 전자 장치(100)에 내장된 것으로 오디오 처리부(미도시)에 의해 디코딩이나 증폭, 노이즈 필터링과 같은 다양한 처리 작업이 수행된 각종 오디오 데이터뿐만 아니라 각종 알림 음이나 음성 메시지를 직접 소리로 출력할 수 있다.

입력부(미도시)는 다양한 사용자 입력을 수신하여 프로세서(120)로 전달할 수 있다. 입력부(미도시)는 예를 들면, 터치 패널, (디지털) 펜 센서 또는 키를 포함할 수 있다. 터치 패널은, 예를 들면, 정전식, 감압식, 적외선 방식, 또는 초음파 방식 중 적어도 하나의 방식을 사용할 수 있다. 또한, 터치 패널은 제어 회로를 더 포함할 수도 있다. 터치 패널은 택타일 레이어(tactile layer)를 더 포함하여, 사용자에게 촉각 반응을 제공할 수 있다. (디지털) 펜 센서는 예를 들면, 터치 패널의 일부이거나, 별도의 인식용 쉬트를 포함할 수 있다. 키는 예를 들면, 물리적인 버튼, 광학식 키 또는 키패드를 포함할 수 있다. 또는, 입력부(미도시)는 키보드, 마우스 등과 같은 외부 장치(미도시)로부터 유선으로 연결되거나 또는 무선으로 연결되어 사용자 입력을 수신할 수 있다.

도 9를 참조하면, 먼저 사용자가 기설정된 기간 동안에 접속한 적어도 하나의 웹 사이트에 대응되는 URL(Uniform Resource Locator)을 적어도 하나의 세그먼트로 구분할 수 있다(S910). 여기에서, 구분하는 단계는 말뭉치(corpus)에 기초하여, 적어도 하나의 웹 사이트 각각에 대응되는 URL을 적어도 하나의 세그먼트로 각각 구분할 수 있다.

다음으로, 적어도 하나의 세그먼트 및 학습된 분류 모델에 기초하여, 복수의 카테고리에 따라 URL을 분류할 수 있다(S920). 여기에서, 학습된 분류 모델은 복수의 URL 및 복수의 URL 각각이 속하는 카테고리에 대한 정보를 학습 데이터로서 이용하여 학습될 수 있다.

다음으로, 기설정된 기간 동안 사용자의 웹 사이트 접속 이력, 적어도 하나의 웹 사이트에 대한 접속 이력 및 분류 결과에 기초하여, 복수의 카테고리 중에서 사용자가 선호하는 웹 사이트의 카테고리를 판단할 수 있다(S930).

여기에서, 카테고리를 판단하는 단계는 적어도 하나의 세그먼트에 대한 특징 값을 획득하고, 특징 값을 학습된 분류 모델에 대한 입력 데이터로서 사용하여 URL이 복수의 카테고리에 속하는 확률 값을 획득하고, 기설정된 기간 동안 사용자의 웹 사이트 접속 이력, 웹 사이트에 접속한 사용자의 접속 이력 및 확률 값에 기초하여, 복수의 카테고리 중에서 사용자가 선호하는 웹 사이트의 카테고리를 판단할 수 있다.

한편, 본 개시의 일 실시 예에서, 적어도 하나의 URL 각각에 대해, 기설정된 기간 동안에 사용자가 적어도 하나의 웹 사이트에 접속한 횟수에 대한 사용자가 특정 URL에 대응되는 웹 사이트에 접속한 횟수의 비율을 사용자의 웹 사이트 접속 이력으로 산출할 수 있다.

한편, 본 개시의 일 실시 예에서, 적어도 하나의 웹 사이트 각각에 대해, 기설정된 기간 동안에 웹 사이트에 접속한 전체 사용자의 접속 횟수에 대한 사용자가 웹 사이트에 접속한 횟수의 비율을 적어도 하나의 웹 사이트에 대한 접속 이력으로 산출할 수 있다.

한편, 본 개시의 일 실시 예에서, 기설정된 기간 동안 사용자의 웹 사이트 접속 이력, 적어도 하나의 웹 사이트에 대한 접속 이력 및 분류 결과에 기초하여 복수의 카테고리 각각에 대한 사용자의 선호도를 산출하고, 산출된 선호도에 기초하여, 사용자가 선호하는 웹 사이트의 카테고리를 판단할 수 있다.

한편, 본 개시의 일 실시 예에서, 사용자가 선호하는 웹 사이트의 카테고리와 관련된 정보를 제공할 수 있다.

본 개시의 다양한 실시 예들은 기기(machine)(예: 컴퓨터)로 읽을 수 있는 저장 매체(machine-readable storage media에 저장된 명령어를 포함하는 소프트웨어로 구현될 수 있다. 기기는 저장 매체로부터 저장된 명령어를 호출하고, 호출된 명령어에 따라 동작이 가능한 장치로서, 개시된 실시 예들에 따른 전자 장치(예: 전자 장치(100))를 포함할 수 있다. 상기 명령이 프로세서에 의해 실행될 경우, 프로세서가 직접, 또는 상기 프로세서의 제어 하에 다른 구성요소들을 이용하여 상기 명령에 상기하는 기능을 수행할 수 있다. 명령은 컴파일러 또는 인터프리터에 의해 생성 또는 실행되는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장매체는 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서, '비일시적'은 저장매체가 신호(signal)를 포함하지 않으며 실재(tangible)한다는 것을 의미할 뿐 데이터가 저장매체에 반영구적 또는 임시적으로 저장됨을 구분하지 않는다.

다양한 실시 예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 온라인으로 배포될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.

다양한 실시 예들에 따른 구성 요소(예: 모듈 또는 프로그램) 각각은 단수 또는 복수의 개체로 구성될 수 있으며, 전술한 상기 서브 구성 요소들 중 일부 서브 구성 요소가 생략되거나, 또는 다른 서브 구성 요소가 다양한 실시 예에 더 포함될 수 있다. 대체적으로 또는 추가적으로, 일부 구성 요소들(예: 모듈 또는 프로그램)은 하나의 개체로 통합되어, 통합되기 이전의 각각의 상기 구성 요소에 의해 수행되는 기능을 동일 또는 유사하게 수행할 수 있다. 다양한 실시 예들에 따른, 모듈, 프로그램 또는 다른 구성 요소에 의해 수행되는 동작들은 순차적, 병렬적, 반복적 또는 휴리스틱하게 실행되거나, 적어도 일부 동작이 다른 순서로 실행되거나, 생략되거나, 또는 다른 동작이 추가될 수 있다.

Claims

전자 장치에 있어서,

적어도 하나의 명령을 포함하는 메모리; 및

상기 메모리와 연결되어 상기 전자 장치를 제어하는 프로세서;를 포함하며,

상기 프로세서는, 상기 적어도 하나의 명령어를 실행함으로써,

사용자가 기설정된 기간 동안에 접속한 적어도 하나의 웹 사이트에 대응되는 URL(Uniform Resource Locator)을 적어도 하나의 세그먼트로 구분하고,

상기 적어도 하나의 세그먼트 및 학습된 분류 모델에 기초하여, 복수의 카테고리에 따라 상기 URL을 분류하고,

상기 기설정된 기간 동안 상기 사용자의 웹 사이트 접속 이력, 상기 적어도 하나의 웹 사이트에 대한 접속 이력 및 상기 분류 결과에 기초하여, 상기 복수의 카테고리 중에서 상기 사용자가 선호하는 웹 사이트의 카테고리를 판단하는, 전자 장치.
제1항에 있어서,

상기 프로세서는,

말뭉치(corpus)에 기초하여, 상기 적어도 하나의 웹 사이트 각각에 대응되는 URL을 적어도 하나의 세그먼트로 각각 구분하는, 전자 장치.
제1항에 있어서,

상기 프로세서는,

상기 적어도 하나의 세그먼트에 대한 특징 값을 획득하고,

상기 특징 값을 상기 학습된 분류 모델에 대한 입력 데이터로서 사용하여 상기 URL이 상기 복수의 카테고리에 속하는 확률 값을 획득하고,

상기 기설정된 기간 동안 상기 사용자의 웹 사이트 접속 이력, 상기 웹 사이트에 접속한 사용자의 접속 이력 및 상기 확률 값에 기초하여, 상기 복수의 카테고리 중에서 상기 사용자가 선호하는 웹 사이트의 카테고리를 판단하는, 전자 장치.
제1항에 있어서,

상기 프로세서는,

상기 적어도 하나의 URL 각각에 대해, 상기 기설정된 기간 동안에 상기 사용자가 상기 적어도 하나의 웹 사이트에 접속한 횟수에 대한 상기 사용자가 특정 URL에 대응되는 웹 사이트에 접속한 횟수의 비율을 상기 사용자의 웹 사이트 접속 이력으로 산출하는, 전자 장치.
제1항에 있어서,

상기 프로세서는,

상기 적어도 하나의 웹 사이트 각각에 대해, 상기 기설정된 기간 동안에 웹 사이트에 접속한 전체 사용자의 접속 횟수에 대한 상기 사용자가 상기 웹 사이트에 접속한 횟수의 비율을 상기 적어도 하나의 웹 사이트에 대한 접속 이력으로 산출하는, 전자 장치.
제1항에 있어서,

상기 프로세서는,

상기 기설정된 기간 동안 상기 사용자의 웹 사이트 접속 이력, 상기 적어도 하나의 웹 사이트에 대한 접속 이력 및 상기 분류 결과에 기초하여 상기 복수의 카테고리 각각에 대한 사용자의 선호도를 산출하고,

상기 산출된 선호도에 기초하여 상기 사용자가 선호하는 웹 사이트의 카테고리를 판단하는, 전자 장치.
제1항에 있어서,

상기 프로세서는,

상기 사용자가 선호하는 웹 사이트의 카테고리와 관련된 정보를 제공하는, 전자 장치.
제1항에 있어서,

상기 학습된 분류 모델은,

복수의 URL 및 상기 복수의 URL 각각이 속하는 카테고리에 대한 정보를 학습 데이터로서 이용하여 학습되는, 전자 장치.
전자 장치의 제어 방법에 있어서,

사용자가 기설정된 기간 동안에 접속한 적어도 하나의 웹 사이트에 대응되는 URL(Uniform Resource Locator)을 적어도 하나의 세그먼트로 구분하는 단계;

상기 적어도 하나의 세그먼트 및 학습된 분류 모델에 기초하여, 복수의 카테고리에 따라 상기 URL을 분류하는 단계; 및

상기 기설정된 기간 동안 상기 사용자의 웹 사이트 접속 이력, 상기 적어도 하나의 웹 사이트에 대한 접속 이력 및 상기 분류 결과에 기초하여, 상기 복수의 카테고리 중에서 상기 사용자가 선호하는 웹 사이트의 카테고리를 판단하는, 제어 방법.
제9항에 있어서,

상기 구분하는 단계는,

말뭉치(corpus)에 기초하여, 상기 적어도 하나의 웹 사이트 각각에 대응되는 URL을 적어도 하나의 세그먼트로 각각 구분하는, 제어 방법.
제9항에 있어서,

상기 카테고리를 판단하는 단계는,

상기 적어도 하나의 세그먼트에 대한 특징 값을 획득하는 단계;

상기 특징 값을 상기 학습된 분류 모델에 대한 입력 데이터로서 사용하여 상기 URL이 상기 복수의 카테고리에 속하는 확률 값을 획득하는 단계; 및

상기 기설정된 기간 동안 상기 사용자의 웹 사이트 접속 이력, 상기 웹 사이트에 접속한 사용자의 접속 이력 및 상기 확률 값에 기초하여, 상기 복수의 카테고리 중에서 상기 사용자가 선호하는 웹 사이트의 카테고리를 판단하는 단계;를 포함하는, 제어 방법.
제9항에 있어서,

상기 적어도 하나의 URL 각각에 대해, 상기 기설정된 기간 동안에 상기 사용자가 상기 적어도 하나의 웹 사이트에 접속한 횟수에 대한 상기 사용자가 특정 URL에 대응되는 웹 사이트에 접속한 횟수의 비율을 상기 사용자의 웹 사이트 접속 이력으로 산출하는 단계;를 더 포함하는, 제어 방법.
제9항에 있어서,

상기 적어도 하나의 웹 사이트 각각에 대해, 상기 기설정된 기간 동안에 웹 사이트에 접속한 전체 사용자의 접속 횟수에 대한 상기 사용자가 상기 웹 사이트에 접속한 횟수의 비율을 상기 적어도 하나의 웹 사이트에 대한 접속 이력으로 산출하는 단계;를 더 포함하는, 제어 방법.
제9항에 있어서,

상기 카테고리를 판단하는 단계는,

상기 기설정된 기간 동안 상기 사용자의 웹 사이트 접속 이력, 상기 적어도 하나의 웹 사이트에 대한 접속 이력 및 상기 분류 결과에 기초하여 상기 복수의 카테고리 각각에 대한 사용자의 선호도를 산출하고,

상기 산출된 선호도에 기초하여, 상기 사용자가 선호하는 웹 사이트의 카테고리를 판단하는, 제어 방법.
제9항에 있어서,

상기 사용자가 선호하는 웹 사이트의 카테고리와 관련된 정보를 제공하는 단계;를 더 포함하는, 제어 방법.