WO2022250233A1

WO2022250233A1 - 컨텐츠를 분석하고 평가하는 방법 및 장치

Info

Publication number: WO2022250233A1
Application number: PCT/KR2021/019154
Authority: WO
Inventors: 한준규
Original assignee: 삼성전자 주식회사
Priority date: 2021-05-24
Filing date: 2021-12-16
Publication date: 2022-12-01

Abstract

본 개시의 일 실시예에 따른 디스플레이 장치가, 컨텐츠를 분석하고 평가하는 방법은, 디스플레이 장치 사용자의 음성 입력을 획득하는 단계; 획득된 음성 입력의 해석 결과에 기초하여 사용자 인텐트를 결정하는 단계; 사용자 인텐트에 기초하여, 레퍼런스 데이터를 획득하는 단계; 디스플레이 장치와 연결된 외부 장치로부터 제출 컨텐츠를 획득하는 단계; 제출 컨텐츠에 포함된 오브젝트 중에서, 레퍼런스 데이터와 비교될 적어도 하나의 타겟 오브젝트를 결정하는 단계; 및 적어도 하나의 타겟 오브젝트와 레퍼런스 데이터를 비교함으로써, 제출 컨텐츠를 평가하는 단계;를 포함한다.

Description

컨텐츠를 분석하고 평가하는 방법 및 장치

본 개시의 실시예들은 컨텐츠를 분석하고 평가하는 방법 및 그 장치에 대한 것으로, 보다 상세하게는, 디스플레이 장치 사용자의 의도 및 컨텍스트에 기초하여 외부 장치로부터 수신된 컨텐츠를 분석하고 평가하는 방법 및 장치에 관한 것이다.

일부 예에서, 대면 수업 및/또는 대면 회의는 원격(비접촉 또는 무접촉 등) 수업 또는 원격 회의로 전환되었다. 원격 수업 및/또는 원격 회의는 시간과 공간적 측면에서 유용하기 때문에 대면 수업 및/또는 대면 회의보다 바람직할 수 있다. 원격 수업 또는 원격 회의의 경우 참가자들은 PC, 노트북, 또는 태블릿 등과 같은 통신 장치를 이용하여 비접촉(contact-free)으로 수업 또는 회의에 참여할 수 있다.

원격 수업 및/또는 회의의 참가자는 서로 다른 공간에 있으므로 원격 회의의 진행자 및/또는 참가자는 다른 사람의 컨텐츠를 실시간으로 확인하기 어려운 문제가 있다. 예를 들어, 원격 수업의 경우 선생님은 학생이 다른 컨텐츠를 이용하고 있는 지 여부의 판단이 어렵다. 또한, 비대면 상황이 아니더라도, 다른 참여자의 컨텐츠를 실시간으로 확인하고 평가하는 것은 회의 및 수업 진행 흐름에 방해가 된다.

따라서, 장치 사용자의 관여가 없이, 장치 사용자의 의도 및 상황을 판단하여, 다른 참여자의 장치와 관련된 컨텐츠를 평가할 수 있는 방법이 필요하다.

본 개시의 일 실시예에 따른 디스플레이 장치가, 컨텐츠를 분석하고 평가하는 방법은, 사용자의 음성 입력을 획득하는 단계; 획득된 음성 입력의 해석 결과에 기초하여 사용자 인텐트를 결정하는 단계; 사용자 인텐트에 기초하여, 레퍼런스 데이터를 획득하는 단계; 디스플레이 장치와 연결된 외부 장치로부터 제출 컨텐츠를 획득하는 단계; 제출 컨텐츠에 포함된 오브젝트 중에서, 레퍼런스 데이터와 비교될 적어도 하나의 타겟 오브젝트를 결정하는 단계; 및 적어도 하나의 타겟 오브젝트와 레퍼런스 데이터를 비교함으로써, 제출 컨텐츠를 평가하는 단계;를 포함한다.

본 개시의 일 실시예에 따른 디스플레이 장치는, 디스플레이; 사용자의 음성 입력을 획득하는 음성 수신부; 디스플레이 장치와 연결된 외부 장치로부터 제출 컨텐츠를 획득하는 통신부, 적어도 하나의 명령어(instruction)를 포함하는 프로그램을 저장하는 저장부; 및 저장부에 저장된 적어도 하나의 명령어를 실행하는 적어도 하나의 프로세서를 포함하고, 프로세서는 적어도 하나의 명령어를 실행함으로써, 음성 수신부를 통해 획득된 사용자의 음성 입력의 해석 결과에 기초하여 사용자 인텐트를 판단하고, 사용자 인텐트에 기초하여, 레퍼런스 데이터를 획득하고, 제출 컨텐츠에 포함된 오브젝트 중에서, 레퍼런스 데이터와 비교될 적어도 하나의 타겟 오브젝트를 결정하고, 적어도 하나의 타겟 오브젝트와 레퍼런스 데이터를 비교함으로써, 제출 컨텐츠를 평가한다.

본 개시의 일 실시예에 따른 디스플레이 장치가, 컨텐츠를 분석하는 방법은, 디스플레이 장치와 연결된 복수의 외부 장치로부터 수신된 복수의 컨텐츠 각각에 포함된 복수의 오브젝트 세트를 획득하는 단계; 복수의 오브젝트 세트의 해석 결과에 기초하여 사용자 인텐트를 결정하는 단계; 및 사용자 인텐트에 기초하여 복수의 컨텐츠 각각을 평가하는 단계;를 포함한다. 방법.

본 개시의 일 실시예에 따른 디스플레이 장치는, 디스플레이; 디스플레이 장치와 연결된 복수의 외부 장치로부터 복수의 컨텐츠 각각을 수신하는 통신부, 적어도 하나의 명령어(instruction)를 포함하는 프로그램을 저장하는 저장부; 및 저장부에 저장된 적어도 하나의 명령어를 실행하는 적어도 하나의 프로세서를 포함하고, 프로세서는 적어도 하나의 명령어를 실행함으로써, 복수의 컨텐츠 각각에 포함된 복수의 오브젝트 세트를 획득하고, 복수의 오브젝트 세트의 해석 결과에 기초하여 사용자 인텐트를 판단하고, 사용자 인텐트에 기초하여, 복수의 컨텐츠 각각을 평가한다.

한편, 본 개시의 일 실시예에 따르면, 전술한 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.

본 개시의 일 실시예에 의하면, 디스플레이 장치가 디스플레이 장치 사용자의 의도 및 컨텍스트에 기초하여 외부 장치로부터 수신된 컨텐츠를 평가함으로써, 사용자의 개입 없이 컨텐츠에 대한 평가가 가능하다. 또한, 원격 수업 등으로 서로 다른 공간에 위치하는 경우라도 외부 장치의 사용자가 의도적 또는 비의도적으로 적절하지 않은 컨텐츠를 이용하고 있는 상황을 판단하고 피드백 할 수 있다.

도 1은 본 개시의 일 실시예에 따른 외부 장치의 컨텐츠를 평가하는 시스템의 예시를 나타내는 도면이다.

도 2는 본 개시의 일 실시예에 따른 디스플레이 장치의 블록도이다.

도 3은 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하는 방법의 제1 동작 흐름도이다.

도 4는 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하는 방법을 나타내는 제1 도면이다.

도 5는 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하는 방법의 제2 동작 흐름도이다.

도 6은 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하는 방법의 제1 순서도이다.

도 7은 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하는 방법을 나타내는 제2 도면이다.

도 8은 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하는 방법의 제3 동작 흐름도이다.

도 9는 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하는 방법의 제2 순서도이다.

도 10은 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하는 방법의 제4 동작 흐름도이다.

도 11은 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하는 방법을 설명하기 위한 도면이다.

도 12는 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하는 방법의 제3 순서도이다.

도 13은 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하는 방법의 제4 순서도이다.

본 명세서 전체에 걸쳐 “a, b, 또는 c 중 적어도 하나”및 “a, b, 및 c 중 적어도 하나”또는 이와 유사한 표현은 a만, b만, c만, a와 b, a와 c, b와 c, a, b, c 모두, 또는 이들의 변형이며, 이들의 모든 조합을 포함한다.

이하, 본 개시의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.

실시예를 설명함에 있어서 본 개시가 속하는 기술 분야에 익히 알려져 있고 본 개시와 직접적으로 관련이 없는 기술 내용에 대해서는 설명을 생략한다. 이는 불필요한 설명을 생략함으로써 본 개시의 요지를 흐리지 않고 더욱 명확히 전달하기 위함이다.

마찬가지 이유로 첨부 도면에 있어서 일부 구성요소는 과장되거나 생략되거나 개략적으로 도시되었다. 또한, 각 구성요소의 크기는 실제 크기를 전적으로 반영하는 것이 아니다. 각 도면에서 동일한 또는 대응하는 구성요소에는 동일한 참조 번호를 부여하였다.

본 개시의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시 예들을 참조하면 명확해질 것이다. 그러나 본 개시는 이하에서 개시되는 실시 예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시 예들은 본 개시가 완전하도록 하고, 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 본 개시의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 개시는 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.

이 때, 처리 흐름도 도면들의 각 블록과 흐름도 도면들의 조합들은 컴퓨터 프로그램 인스트럭션들에 의해 수행될 수 있음을 이해할 수 있을 것이다. 이들 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수용 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서에 탑재될 수 있으므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서를 통해 수행되는 그 인스트럭션들이 흐름도 블록(들)에서 설명된 기능들을 수행하는 수단을 생성하게 된다. 이들 컴퓨터 프로그램 인스트럭션들은 특정 방식으로 기능을 구현하기 위해 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 지향할 수 있는 컴퓨터 이용 가능 또는 컴퓨터 판독 가능 메모리에 저장되는 것도 가능하므로, 그 컴퓨터 이용가능 또는 컴퓨터 판독 가능 메모리에 저장된 인스트럭션들은 흐름도 블록(들)에서 설명된 기능을 수행하는 인스트럭션 수단을 내포하는 제조 품목을 생산하는 것도 가능하다. 컴퓨터 프로그램 인스트럭션들은 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에 탑재되는 것도 가능하므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에서 일련의 동작 단계들이 수행되어 컴퓨터로 실행되는 프로세스를 생성해서 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 수행하는 인스트럭션들은 흐름도 블록(들)에서 설명된 기능들을 실행하기 위한 단계들을 제공하는 것도 가능하다.

또한, 각 블록은 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 실행 예들에서는 블록들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들은 사실 실질적으로 동시에 수행되는 것도 가능하고 또는 그 블록들이 때때로 해당하는 기능에 따라 역순으로 수행되는 것도 가능하다.

이 때, 본 실시예에서 사용되는 '~부'라는 용어는 소프트웨어 또는 FPGA또는 ASIC과 같은 하드웨어 구성요소를 의미하며, '~부'는 어떤 역할들을 수행한다. 그렇지만 '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. '~부'는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들, 및 변수들을 포함한다. 구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로 더 분리될 수 있다. 뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU들을 재생시키도록 구현될 수도 있다. 또한 실시예에서 ‘~부’는 하나 이상의 프로세서를 포함할 수 있다.

본 개시 전체에서 어떤 부분이 어떤 구성요소를 “포함”한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 본 명세서에 기재된 “~부”, “~모듈” 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.

명세서 전체에서, 어떤 부분이 다른 부분과 “연결”되어 있다고 할 때, 이는 “직접적으로 연결”되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 “전기적으로 연결”되어 있는 경우도 포함한다.

본 명세서에서 사용된 표현 “~하도록 구성된(또는 설정된)(configured to)”은 상황에 따라, 예를 들면, “~에 적합한(suitable for)”, “~하는 능력을 가지는(having the capacity to)”, “~하도록 설계된(designed to)”, “~하도록 변경된(adapted to)”, “~하도록 만들어진(made to)”, 또는 “~를 할 수 있는(capable of)”과 바꾸어 사용될 수 있다. 용어 “~하도록 구성된(또는 설정된)”은 하드웨어적으로 “특별히 설계된(specifically designed to)” 것만을 반드시 의미하지 않을 수 있다. 대신, 어떤 상황에서는, “~하도록 구성된 시스템”이라는 표현은, 그 시스템이 다른 장치 또는 부품들과 함께 “~할 수 있는” 것을 의미할 수 있다. 예를 들면, 문구 “A, B, 및 C를 수행하도록 구성된(또는 설정된) 프로세서”는 해당 동작을 수행하기 위한 전용 프로세서(예: 임베디드 프로세서), 또는 메모리에 저장된 하나 이상의 소프트웨어 프로그램들을 실행함으로써, 해당 동작들을 수행할 수 있는 범용 프로세서(generic-purpose processor)(예: CPU 또는 application processor)를 의미할 수 있다.

이하 첨부된 도면을 참고하여 본 개시를 상세히 설명하기로 한다.

도 1을 참조하면, 외부 장치의 컨텐츠를 평가하는 시스템은 디스플레이 장치(1000) 및 적어도 하나의 외부 장치(200-1 내지 200-N)을 포함할 수 있다.

디스플레이 장치(1000)는 시각적인 정보를 전달할 수 있도록 동작하는 장치를 의미하며, 시각적인 정보를 제공하기 위한 디스플레이 및 시각적인 정보와 함께 제공될 수 있는 청각적인 정보를 제공하기 위한 스피커를 포함할 수 있다. 또한, 디스플레이 장치(1000)는 디스플레이 장치(1000) 사용자의 입력(100)을 수신하기 위한 입력부(1300)를 포함할 수 있다. 시각적인 정보는 촬영된 스틸컷, 그래픽 이미지, 동영상 및 특정 목적을 위해 작성된 컨텐츠(예를 들어, 교육용 컨텐츠)에 포함되는 시각 정보를 포함할 수 있고, 디스플레이 장치(1000)는 텔레비전, 모니터, 및 전자칠판을 포함할 수 있으나, 이에 제한되는 것은 아니다.

디스플레이 장치(1000)는 적어도 하나의 외부 장치(200-1 내지 200-N)로 소정의 컨텐츠를 전송하거나, 적어도 하나의 외부 장치(200-1 내지 200-N)로부터 소정의 컨텐츠를 수신할 수 있다. 또한, 디스플레이 장치(1000)는 소정의 주기마다, 디스플레이 장치(1000)의 사용자(100)의 입력에 따라, 또는 적어도 하나의 외부 장치(200-1 내지 200-N)의 사용자(미도시)의 입력에 따라 적어도 하나의 외부 장치(200-1 내지 200-N)로부터 소정의 컨텐츠를 수신할 수 있다.

디스플레이 장치(1000)는 적어도 하나의 외부 장치(200-1 내지 200-N)로부터 수신된 소정의 컨텐츠를 평가할 수 있다.

적어도 하나의 외부 장치(200-1 내지 200-N)는 디스플레이 장치(1000)와 적어도 하나의 네트워크(300-1 내지 300-N)를 통해 연결되어 있으며, 디스플레이 장치(1000)로부터 소정의 컨텐츠를 수신하여 적어도 하나의 외부 장치(200-1 내지 200-N)의 사용자에게 제공하거나, 디스플레이 장치(1000)로 소정의 컨텐츠를 전송하도록 동작하는 장치를 의미한다. 적어도 하나의 외부 장치(200-1 내지 200-N)는 휴대폰, 태블릿, 및 랩톱 컴퓨터를 포함할 수 있으나, 이에 제한되는 것은 아니다.

디스플레이 장치(1000) 및 적어도 하나의 외부 장치(200-1 내지 200-N) 를 통신 연결하는 네트워크(300-1 내지 300-N)는 근거리 통신망(Local Area Network; LAN), 광역 통신망(Wide Area Network; WAN) 또는 부가가치 통신망(Value Added Network; VAN) 등과 같은 유선 네트워크나 이동 통신망(mobile radio communication network) 또는 위성 통신망 등과 같은 모든 종류의 무선 네트워크로 구현될 수 있다. 또한, 네트워크는 근거리 통신망(Local Area Network; LAN), 광역 통신망(Wide Area Network; WAN), 부가가치 통신망(Value Added Network; VAN), 이동 통신망(mobile radio communication network) 또는 위성 통신망 중 적어도 둘 이상의 상호 조합을 포함할 수 있으며, 도 1에 도시된 각 네트워크 구성 주체(예를 들어, 디스플레이 장치 1000, 적어도 하나의 외부 장치 200)가 서로 원활하게 통신을 할 수 있도록 하는 포괄적인 의미의 데이터 통신망이며, 유선 인터넷, 무선 인터넷 및 모바일 무선 통신망을 포함한다. 무선 통신은 예를 들어, 무선 랜(Wi-Fi), 블루투스, 블루투스 저 에너지(Bluetooth low energy), 지그비, WFD(Wi-Fi Direct), UWB(ultra wideband), 적외선 통신(IrDA, infrared Data Association), NFC(Near Field Communication) 등이 있을 수 있으나, 이에 한정되는 것은 아니다.

도 1은 디스플레이 장치(1000)의 사용자(100, 예를 들어, 호스트)가 적어도 하나의 외부 장치(200)를 사용하여 하나 이상의 외부 사용자(예: 참가자)에게 컨텐츠를 표시하는 실시예를 나타낸다. 예를 들어, 도 1에 도시된 시스템 환경은 수업을 진행하는 경우일 수 있으나 이에 제한되는 것은 아니며 다른 환경에서도 이용될 수 있다. 특히, 본 개시는 디스플레이된 컨텐츠를 분석하고 평가해야하는 모든 환경에 적용될 수 있다.

예를 들어, 디스플레이 장치(1000)의 사용자(100)는 선생님교사이고, 적어도 하나의 외부 장치(200-1 내지 200-N)의 외부 사용자들은 학생일 수 있다. 이러한 경우, 교사는 수업을 진행하기 위하여 수업 내용과 관련된 컨텐츠를 디스플레이 장치(1000)에 디스플레이할 수 있다.

교사가 수업 내용과 관련된 컨텐츠를 디스플레이 장치(1000)에 디스플레이하고 수업을 진행하던 중 디스플레이 장치(1000)에 디스플레이된 컨텐츠와 관련된 질문을 하거나 문제를 제출하는 경우를 가정한다. 교사는 디스플레이 장치(1000)에 디스플레이된 컨텐츠와 관련된 질문을 하거나 답안를 제출할 것을 요청하는 음성을 발화할 수 있다.

본 개시의 일 실시예에 따르면, 교사의 음성을 획득한 디스플레이 장치(1000)는 적어도 하나의 외부 장치(200-1 내지 200-N)로 현재의 컨텐츠를 전송할 수 있다. 적어도 하나의 외부 장치(200-1 내지 200-N)는 디스플레이 장치(1000)로부터 전송된 컨텐츠를 디스플레이할 수 있다. 또한, 적어도 하나의 외부 장치(200-1 내지 200-N)는 선생님의 질문 또는 문제에 대한 학생들의 입력이 획득되는 것에 대한 응답하여 제출할 컨텐츠(예를 들어, 제출 컨텐츠)를 디스플레이 장치(1000)로 전송(제출)할 수 있다. 제출 컨텐츠는, 적어도 하나의 외부 장치(200-1 내지 200-N)의 사용자인 학생들(예를 들어, 외부 사용자)의 입력에 기초하여 생성될 수 있고, 교사의 질문 및/또는 퀴즈에 대한 답변을 포함할 수 있다. 디스플레이 장치(1000)는 교사의 음성 발화 분석에 기초하여 질문 또는 문제와 관련된 인텐트를 식별하고, 식별된 인텐트에 기초하여 학생들이 제출한 답변을 평가할 수 있다.

예를 들어, 교사가 수업을 진행하던 중 학생들에게 답변을 제출할 것을 요청하는 경우, 교사는 학생들에게 답변을 제출할 것을 요청하는 음성을 발화할 수 있다.

본 개시의 일 실시예에 따르면, 교사의 음성을 획득한 디스플레이 장치(1000)는 적어도 하나의 외부 장치(200-1 내지 200-N)로 답변 제출 요청을 전송할 수 있다. 답변 제출 요청을 수신한 적어도 하나의 외부 장치(200-1 내지 200-N)는 학생들의 답변(예를 들어, 제출 컨텐츠)이 획득되면(예를 들어, 외부 장치(200-1 내지 200-N)의 해당 학생이 교사의 요청에 대한 답변을 제공) 학생들의 답변을 디스플레이 장치(1000)로 전송할 수 있다. 이 때, 답변 제출 요청을 수신한 적어도 하나의 외부 장치(200-1 내지 200-N)는 디스플레이에 답변을 제출할 것을 요구하는 사용자 인터페이스(예를 들어, 팝업 창)를 디스플레이할 수 있다. 디스플레이 장치(1000)는 교사의 음성 발화 분석에 기초하여 요청과 관련된 인텐트를 식별하고, 식별된 인텐트에 기초하여 학생들이 제출한 답변을 평가할 수 있다.

교사가 적어도 하나의 외부 장치(200-1 내지 200-N)의 화면을 모니터링하고자 하는 경우를 가정한다.

교사와 학생이 서로 마주보도록 배치된 환경 또는 원격 수업 등으로 서로 다른 공간에 있는 경우, 교사는 학생의 화면을 볼 수 없으므로 학생이 수업과 관련없는 컨텐츠를 화면에 디스플레이하거나 수업 이외의 다른 목적으로 적어도 하나의 외부 장치(200-1 내지 200-N)를 사용하더라도, 교사는 이를 확인할 수 없다.

본 개시의 일 실시예에 따르면, 교사가 설정한 소정의 주기마다, 또는 교사의 입력(예를 들어 모니터링 요청 커맨드)가 획득되면, 디스플레이 장치(1000)는 적어도 하나의 외부 장치(200-1 내지 200-N)로 현재 화면 공유 요청을 전송할 수 있다. 현재 화면 공유 요청을 수신한 적어도 하나의 외부 장치(200-1 내지 200-N)는 적어도 하나의 외부 장치(200-1 내지 200-N)에 디스플레이된 현재 화면을 디스플레이 장치(1000)로 전송할 수 있다. 디스플레이 장치(1000)는 적어도 하나의 외부 장치(200-1 내지 200-N)에 디스플레이된 현재 화면에 디스플레이된 컨텐츠 또는 디스플레이 장치(1000)에 디스플레이된 컨텐츠에 기초하여 적어도 하나의 외부 장치(200-1 내지 200-N)에 디스플레이된 컨텐츠 각각을 평가할 수 있다.

예를 들어, 교사가 특정 외부 장치(예를 들어, 200-1) 의 화면을 다른 학생들에게 공유(예를 들어, 디스플레이 장치(1000)의 화면에 특정 외부 장치(예를 들어, 200-1) 의 화면을 디스플레이)하여, 특정 외부 장치(예를 들어, 200-1) 의 화면을 수업 자료로 활용하고자 하는 경우를 가정한다.

교사와 학생이 서로 마주보도록 배치된 환경 또는 원격 수업 등으로 서로 다른 공간에 있는 경우, 어떤 학생이 수업과 관련없는 컨텐츠를 화면에 디스플레이하거나 수업 이외의 다른 목적으로 적어도 하나의 외부 장치(200-1 내지 200-N)를 사용하고 있다면 해당 학생의 화면은 공유가 부적절할 수 있다.

본 개시의 일 실시예에 따르면, 교사의 입력(예를 들어 모니터링 요청 커맨드)가 획득되면, 디스플레이 장치(1000)는 특정 외부 장치(예를 들어, 200-1)로 현재 화면 공유 요청을 전송할 수 있다. 현재 화면 공유 요청을 수신한 특정 외부 장치(예를 들어, 200-1)는 특정 외부 장치(예를 들어, 200-1)에 디스플레이된 현재 화면을 디스플레이 장치(1000)로 전송할 수 있다. 디스플레이 장치(1000)는 특정외부 장치(예를 들어, 200-1)에 디스플레이된 현재 화면에 디스플레이된 컨텐츠 또는 디스플레이 장치(1000)에 디스플레이된 컨텐츠에 기초하여 특정 외부 장치(예를 들어, 200-1)에 디스플레이된 컨텐츠를 평가하여 공유하기 적합한지 여부를 판단할 수 있다. 디스플레이 장치(1000)는, 특정 외부 장치(예를 들어, 200-1)에 디스플레이된 컨텐츠의 공유가 적합한지 여부를 판단한 결과, 특정 외부 장치(예를 들어, 200-1)에 디스플레이된 컨텐츠의 공유가 부적합한 것으로 판단된 경우, 특정 외부 장치(예를 들어, 200-1)에 디스플레이된 컨텐츠는 디스플레이 장치(1000)화면에 디스플레이하지 않을 수 있다. 또는, 디스플레이 장치(1000)는, 특정 외부 장치(예를 들어, 200-1)에 디스플레이된 컨텐츠의 공유가 적합한지 여부를 판단한 결과, 특정 외부 장치(예를 들어, 200-1)에 디스플레이된 컨텐츠의 공유가 적합한 것으로 판단된 경우 특정 외부 장치(예를 들어, 200-1)에 디스플레이된 컨텐츠는 디스플레이 장치(1000)화면에 디스플레이할 수 있다.

도 2를 참조하면, 디스플레이 장치(1000)는 프로세서(1100), 통신부(1200), 입력부(1300), 출력부(1400), 및 저장부(1500)를 포함할 수 있다. 그러나 도시된 구성요소 모두가 필수구성요소인 것은 아니다. 도시된 구성요소보다 많은 구성요소에 의해 디스플레이 장치(1000)가 구현될 수도 있고, 그보다 적은 구성요소에 의해서도 공기 디스플레이 장치(1000)는 구현될 수 있다. 또한, 도 2에 도시된 둘 이상의 구성요소는 하나의 구성요소에 의해 구현될 수 있고, 도 2에 도시된 하나의 구성요소는 복수의 분산 구성요소로 구현될 수 있다. 도 2에 도시된 구성요소의 세트는 도2에 도시된 구성요소들의 다른 세트에 의해 수행되는 것으로 설명된 하나 이상의 기능을 수행할 수도 있다.

이하 상기 구성요소들에 대해 차례로 살펴본다.

통신부(1200)는, 디스플레이 장치(1000)와 서버 장치(미도시), 디스플레이 장치(1000)와 외부 장치(예를 들어, 도 1의 외부 장치 또는 다른 통신 장치) 간의 통신을 하게 하는 하나 이상의 구성요소를 포함할 수 있다. 예를 들어, 통신부(1200)는, 근거리 통신부, 및/또는 방송 수신부를 포함할 수 있다.

근거리 통신부(short-range wireless communication unit)는, 블루투스 통신부, BLE(Bluetooth Low Energy) 통신부, 근거리 무선 통신부(Near Field Communication unit), RFID(radio-frequency identification) 통신부, WLAN(와이파이) 통신부, 지그비(Zigbee) 통신부, 적외선(IrDA, infrared Data Association) 통신부, WFD(Wi-Fi Direct) 통신부, UWB(ultra wideband) 통신부, 및/또는 Ant+ 통신부 등을 포함할 수 있으나, 이에 한정되는 것은 아니다.

방송 수신부는, 방송 채널을 통하여 외부로부터 방송 신호 및/또는 방송 관련된 정보를 수신한다. 방송 채널은 위성 채널, 지상파 채널을 포함할 수 있다. 구현 예에 따라서 디스플레이 장치(1000)는 방송 수신부를 포함하지 않을 수도 있다.

통신부(1200)는 외부 장치(예를 들어, 서버 장치, 도 1의 외부 장치, 다른 통신 장치)로부터 컨텐츠를 획득할 수 있다. 통신부(1200)는 유선 또는 무선 통신을 통해 외부 장치(미도시)로부터 컨텐츠를 획득할 수 있다. 여기서, 외부 장치(미도시)는 서버 장치, 모바일 단말, 웨어러블 장치(예컨대, 시계, 밴드, 안경, 마스크 등), 가전 기기(예컨대, TV, 데스크 탑 PC, 노트북, DVD 장치, 세탁기, 냉장고 등) 등을 포함할 수 있으나, 이에 한정되는 것은 아니다. 외부 장치로부터 획득되는 컨텐츠는 멀티미디어 파일, 비디오 파일 및 오디오 파일을 포함할 수 있다.

입력부(1300)는, 디스플레이 장치(1000)의 사용자(100)가 디스플레이 장치(1000)를 제어하기 위한 데이터 및/또는 명령을입력하도록 구성된다. 예를 들어, 입력부(1300)에는 키 패드(key pad), 돔 스위치 (dome switch), 터치 패드(접촉식 정전 용량 방식, 압력식 저항막 방식, 적외선 감지 방식, 표면 초음파 전도 방식, 적분식 장력 측정 방식, 피에조 효과 방식 등), 조그 휠, 조그 스위치 등이 있을 수 있으나 이에 한정되는 것은 아니다.

본 개시의 일 실시예에 의하면, 입력부(1300)는 전원 버튼, 밝기 설정 버튼, 예약 설정 버튼, 모드 변경 버튼, 음량 조정 버튼 등을 포함하는 버튼부를 포함할 수 있다.

입력부(1300)는, 사용자의 음성 입력을 수신하기 위한 음성 수신부(1310)를 포함한다. 예를 들어, 음성 수신부(1310)는 적어도 하나의 마이크로폰(미도시)을 포함할 수 있다. 음성 수신부(1310)는, 디스플레이 장치(1000) 외부의 음향 신호를 입력 받아 전기적인 음성 데이터로 처리한다. 예를 들어, 마이크로폰은 외부 장치(예를 들어, 스피커) 및/또는 디스플레이 장치(1000)의 사용자(100)로부터 음향 신호(예컨대, 음성 명령)를 수신할 수 있다. 마이크로폰은 외부의 음향 신호를 입력 받고 처리하는 과정에서 발생 되는 잡음(noise)을 제거하기 위한 다양한 잡음 제거 알고리즘을 이용할 수 있다.

출력부(1400)는, 오디오 신호 또는 비디오 신호의 출력하도록 구성된다. 출력부(1400)는 디스플레이부(1410) 외에도 복수의 스피커(미도시)를 포함할 수 있다.

디스플레이부(1410)와 터치패드가 레이어 구조를 이루어 터치스크린으로 구성되는 경우, 디스플레이부(1410)는 출력 장치 이외에 입력 장치로도 사용될 수 있다. 디스플레이부(1410)는 액정 디스플레이부(liquid crystal display), 박막 트랜지스터 액정 디스플레이부(thin film transistor-liquid crystal display), 유기 발광 다이오드(organic light-emitting diode), 플렉시블 디스플레이부(flexible display), 3차원 디스플레이부(3D display), 전기영동 디스플레이부(electrophoretic display) 중에서 적어도 하나를 포함할 수 있다. 그리고 디스플레이 장치(1000)의 구현 형태에 따라 디스플레이 장치(1000)는 디스플레이부(1410)를 2개 이상 포함할 수도 있다.

출력부(1400)는, 통신부(1200)로부터 수신되거나 저장부(1500)에 저장된 오디오 데이터를 출력할 수 있다. 예를 들어, 출력부(1400)는 입체 음향 신호를 출력할 수도 있다. 예를 들어, 복수의 스피커는 우측 채널 스피커, 좌측 채널 스피커, 모노 채널 스피커 중 적어도 하나로 구현될 수 있다. 또한, 복수의 스피커는 디스플레이 장치 (1000)에서 수행되는 기능(예를 들어, 알림음, 안내 음성, 가이드 음성)과 관련된 음향 신호를 출력할 수 있다.

저장부(1500)는, 후술할 프로세서(1100)에 의해 실행될 프로그램을 저장할 수 있다. 저장부(1500)는 디스플레이 장치(1000)의 동작을 제어하기 위한 적어도 적어도 하나의 명령어들(instruction)을 포함하는 프로그램을 저장할 수 있다.

저장부(1500)에는 프로세서(1100)가 판독할 수 있는 명령어들 및 프로그램 코드(program code)가 저장될 수 있다. 일 실시예에서, 프로세서(1100)는 저장부(1500)에 저장된 프로그램의 명령어들 또는 코드들을 실행하도록 구현될 수 있다. 저장부(1500)는 디스플레이 장치(1000)로 입력되거나 디스플레이 장치(1000)로부터 출력되는 데이터를 저장할 수 있다.

저장부(1500)는 예를 들어, 플래시 메모리(flash memory), 하드디스크(hard disk), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어, SD 또는 XD 메모리 등), 램(RAM, Random Access Memory), SRAM(Static Random Access Memory), 롬(ROM, Read-Only Memory), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장 매체를 포함할 수 있다.

저장부(1500)에 저장된 프로그램들은 그 기능에 따라 복수 개의 모듈들로 분류될 수 있다. 예를 들어, 저장부(1500)는 오브젝트 추출 모듈(1510), 인텐트 결정 모듈(1520), 및 컨텐츠 평가 모듈(1530)을 포함할 수 있다. 인텐트 결정 모듈(1520)은 음성 분석 모듈(1521), 및 영상 분석 모듈(1522)을 포함할 수 있으며, 컨텐츠 평가 모듈은 레퍼런스 데이터 획득 모듈(1531) 및 타겟 오브젝트 결정 모듈(1532)을 포함할 수 있다.

프로세서(1100)는, 디스플레이 장치(1000)의 전반적인 동작을 제어할 수 있다. 프로세서(1100)는 본 개시의 일 실시예에 따른 동작들을 수행할 수 있다. 예를 들어, 프로세서(1100)는 저장부(1500)에 저장된 프로그램들을 실행함으로써, 통신부(1200), 입력부(1300), 출력부(1400) 등을 전반적으로 제어할 수 있다.

프로세서(1100)는 산술, 로직 및 입출력 연산과 시그널 프로세싱을 수행하는 하드웨어 구성요소로 구성될 수 있다. 프로세서(1100)는 예를 들어, 중앙 처리 장치(Central Processing Unit), 마이크로 프로세서(microprocessor), 그래픽 프로세서(Graphic Processing Unit), ASICs(Application Specific Integrated Circuits), DSPs(Digital Signal Processors), DSPDs(Digital Signal Processing Devices), PLDs(Programmable Logic Devices), 및 FPGAs(Field Programmable Gate Arrays) 중 적어도 하나로 구성될 수 있으나, 이에 제한되는 것은 아니다.

본 개시의 일 실시예에 의하면, 프로세서(1100)는 학습 네트워크 모델을 생성하기 위한 인공지능(AI) 프로세서를 포함할 수 있으나, 이에 한정되는 것은 아니다. 본 개시의 일 실시예에 의하면, AI 프로세서는 프로세서(1100)와 별도의 칩으로 구현될 수도 있다. 본 개시의 일 실시예에 의하면, AI 프로세서는 범용 칩일 수도 있다.

본 개시의 일 실시예에서, 프로세서(1100)는 저장부(1500)에 저장된 하나 이상의 명령어들을 실행함으로써, 입력부(1400)의 음성 수신부(1410)를 통해 획득된 사용자의 음성 입력 해석 결과에 기초하여 사용자 인텐트를 판단하고, 사용자 인텐트에 기초하여 레퍼런스 데이터를 획득하고, 통신부(1200)를 통해 수신된 디스플레이 장치(1000)와 연결된 외부 장치의 제출 컨텐츠에 포함된 오브젝트 중에서, 레퍼런스 데이터와 비교될 적어도 하나의 타겟 오브젝트를 결정하고, 적어도 하나의 타겟 오브젝트와 레퍼런스 데이터를 비교함으로써 제출 컨텐츠를 평가할 수 있다.

본 개시의 일 실시예에서, 프로세서(1100)는 저장부(1500)에 저장된 하나 이상의 명령어들을 실행함으로써, 통신부(1200)를 통해 수신된 디스플레이 장치(1000)와 연결된 복수의 외부 장치로부터 수신된 컨텐츠 각각에 포함된 복수의 오브젝트 세트를 결정하고, 복수의 오브젝트 세트의 해석 결과에 기초하여 사용자 인텐트를결정하고, 사용자 인텐트에 기초하여 복수의 컨텐츠 각각을 평가할 수 있다.

본 개시의 일 실시예에서, 프로세서(1100)는 저장부(1500)에 저장된 프로그램들 중 오브젝트 추출 모듈(1510)의 적어도 하나의 명령어들을 실행함으로써, 외부 장치로부터 수신된 제출 컨텐츠에 포함되는 오브젝트 및 디스플레이 장치(1000)가 외부 장치로 공유하는 컨텐츠인, 레퍼런스 컨텐츠에 포함되는 오브젝트를 추출할 수 있다.

본 개시의 일 실시예에서, 프로세서(1100)는 저장부(1500)에 저장된 프로그램들 중 인텐트 결정 모듈(1520)의 적어도 하나의 명령어들을 실행함으로써, 사용자 음성 입력의 음성 분석 결과 및 레퍼런스 컨텐츠와 제출 컨텐츠에 포함되는 영상의 영상 분석 결과에 기초하여 사용자 인텐트를 결정할 수 있다.

본 개시의 일 실시예에서, 프로세서(1100)는 저장부(1500)에 저장된 프로그램들 중 음성 분석 모듈(1521)의 적어도 하나의 명령어들을 실행함으로써, 음성 수신부(1310)에서 수신된 사용자 음성 입력을 해석할 수 있다.

음성 분석 모듈(1521)을 이용하여 사용자의 음성 입력에 포함된 의도를 파악할 때, 인공 지능(Artificial Intelligence, AI) 기술이 활용될 수 있으며, 룰(Rule) 기반의 자연어 이해 기술(Natural Language Understanding, NLU)이 활용될 수도 있다.

음성 분석 모듈(1521)은 발화 데이터, 및 발화 데이터에 대응되는 동작들을 활용하여 사용자 인텐트를 결정할 수 있다. 또한, 음성 분석 모듈(1521)은 음성 입력 해석에 기초하여 결정되는 사용자 인텐트 결정 모델을 생성 또는 업데이트할 수 있다.

발화 데이터는, 컨텐츠 평가를 위하여 사용자가 발화하는 음성에 관련된 데이터로서, 사용자의 발화를 나타내는 데이터일 수 있다. 발화 데이터는 디스플레이 장치(1000)의 동작과 관련된 사용자의 의도를 해석하는데 이용되는 데이터일 수 있다. 발화 데이터는, 예를 들어, 텍스트 형식의 발화문 또는 NLU 모델의 출력 값의 형식을 가지는 발화 파라미터 중 적어도 하나를 포함할 수 있다. 발화 파라미터는, NLU 모델로부터 출력되는 데이터로서, 인텐트 및 파라미터를 포함할 수 있다. 인텐트는 NLU 모델을 이용하여 텍스트를 해석함으로써 결정되는 정보로서, 사용자의 발화 의도를 나타낼 수 있다. 인텐트는, 예를 들어, 사용자가 의도하는 디바이스의 동작을 나타내는 정보일 수 있다. 인텐트는, 사용자의 발화 의도를 나타내는 정보(이하, 의도 정보)뿐 아니라, 사용자의 의도를 나타내는 정보에 대응하는 수치 값을 포함할 수 있다. 수치 값은, 텍스트가 특정 의도를 나타내는 정보와 관련될 확률을 나타낼 수 있다. NLU 모델을 이용하여 텍스트를 해석한 결과, 사용자의 의도를 나타내는 정보가 복수 개 획득되는 경우, 각 의도 정보에 대응되는 수치 값이 최대인 의도 정보가 인텐트로 결정될 수 있다. 또한, 파라미터는 인텐트와 관련된 디바이스의 세부 동작들을 결정하기 위한 변수(variable) 정보일 수 있다. 파라미터는 인텐트와 관련된 정보이며, 하나의 인텐트에 복수 종류의 파라미터가 대응될 수 있다. 파라미터는 디바이스의 동작 정보를 결정하기 위한 변수 정보뿐만 아니라, 텍스트가 그 변수 정보와 관련될 확률을 나타내는 수치 값을 포함할 수 있다. 자연어 이해 모델을 이용하여 텍스트를 해석한 결과, 파라미터를 나타내는 변수 정보가 복수 개 획득될 수 있다. 이 경우, 각 변수 정보에 대응되는 수치 값이 최대인 변수 정보가 파라미터로 결정될 수 있다.

또한, 본 개시의 일 실시예에서, 프로세서(1100)는 저장부(1500)에 저장된 프로그램들 중 영상 분석 모듈(1522)의 적어도 하나의 명령어들을 실행함으로써, 오브젝트 추출 모듈(1510)에서 추출된 오브젝트들에 기초하여 레퍼런스 컨텐츠 또는 제출 컨텐츠에 포함되는 영상을 해석할 수 있다.

본 개시의 일 실시예에 따르면, 영상 분석 모듈(1522)은 사용자의 의도를 이해하기 위하여, 인공 지능 기술 및/또는 딥러닝 기반의 영상 분석 기술을 사용할 수 있다.

영상 분석 모듈(1522)은 디스플레이 장치(1000)에 디스플레이된 컨텐츠 및 적어도 하나의 외부 장치로부터 수신된 컨텐츠를 분석하여, 디스플레이 장치(1000)에 디스플레이된 컨텐츠 및 적어도 하나의 외부 장치로부터 수신된 컨텐츠에 포함되는 오브젝트를 추출하고 분석할 수 있다.

영상 분석 모듈(1522)은 영상 인식(image recognition)을 통해 영상에서 오브젝트(객체), 장소, 사람, 글씨, 및 이미지 등을 식별할 수 있으며, 영상 인식 결과에 기초하여 이미지를 분류하고, 오브젝트를 검출(detection)할 수 있다.

영상 분석 모듈(1522)은 분류 모델(classification model)을 이용하여 영상을 분류할 수 있다. 인공 지능 기술을 활용한 분류 모델은 판별 모델(discriminative model)과 생성 모델(generative model)을 포함할 수 있으며, 생성 모델은 클래스의 분포에 기초하여 입력 데이터로부터 결과가 도출될 확률을 계산한다.

영상 분석 모듈(1522)은 바운딩 박스를 이용하거나 그리드(grid)에 대한 클래스 확률 맵(class probability map)을 이용하여 오브젝트를 검출할 수 있으며, 영상 분석 모듈(1522)은 검출 대상 오브젝트의 좌표 및 크기를 획득할 수 있다.

영상에 하나의 오브젝트만 포함된 경우 오브젝트 추출은 분류 단계 및 위치 파악(localization) 단계를 포함할 수 있으며, 영상에 복수의 오브젝트가 포함된 경우 오브젝트 추출은 분류 단계, 오브젝트 검출 단계, 및 분할(segmentation) 단계가 포함될 수 있다.

분류는 한장의 이미지 중 가장 큰 비중을 차지하는 이미지 하나를 인식하여, 정의된 클래스에 따라 유형을 분류하는 것이다. 오브젝트 검출은 하나의 이미지에 여러 개의 오브젝트가 존재할 경우 각 오브젝트의 특성 및 클래스를 분류해 사각형의 박스 형태로 각 오브젝트의 유형 및 위치정보를 획득하는 것이다. 분할은 오브젝트 검출을 통해 검출된 오브젝트의 형상을 픽셀 단위로 정확한 형태로 디스플레이하는 것이다. 분할은 오브젝트의 외곽선을 추출하는 과정을 포함할 수 있다.

영상 분석 모듈(1522)은 디스플레이 장치(1000)에 디스플레이된 컨텐츠 및 적어도 하나의 외부 장치로부터 수신된 컨텐츠에 포함되는 오브젝트의 분석 결과에 기초하여 사용자 인텐트를 결정할 수 있다. 또한, 영상 분석 모듈(1522)은 오브젝트 분석에 기초하여 결정되는 사용자 인텐트 결정 모델을 생성 또는 업데이트할 수 있다.

영상 분석 모듈(1522)은 디스플레이 장치(1000)에 디스플레이된 컨텐츠 및 적어도 하나의 외부 장치로부터 수신된 컨텐츠에 포함되는 오브젝트 각각의 분류에 기초하여, 디스플레이 장치(1000)에 디스플레이된 컨텐츠 및 적어도 하나의 외부 장치로부터 수신된 컨텐츠에 포함되는 오브젝트 각각에 대한 적어도 하나의 카테고리를 결정할 수 있다. 적어도 하나의 카테고리는 서로 계층 관계(hierarchical relationship)를 가질 수 있다.

인텐트는 영상 분석 결과 획득된 오브젝트의 카테고리에 기초하여 결정되는 정보로서, 디스플레이 장치(1000)의 사용자(100)가 디스플레이 장치(1000)를 이용하는 목적 또는 적어도 하나의 외부 장치의 사용자에게 전달하려고 하는 내용이나 주제를 나타낼 수 있다.

예를 들어, 디스플레이 장치(1000)에 디스플레이된 컨텐츠 및 적어도 하나의 외부 장치로부터 수신된 컨텐츠에 포함된 오브젝트들을 검출하고, 오브젝트들의 분류에 기초하여, 가장 많은 오브젝트들이 속한 카테고리를 사용자 인텐트와 관련된 카테고리로 결정할 수 있다.

예를 들어, 디스플레이 장치(1000)에 디스플레이된 컨텐츠에 우주와 관련된 오브젝트들이 다수 포함되어 있는 경우, 영상 분석 모듈(1522)은 디스플레이 장치(1000)에 디스플레이된 컨텐츠에 포함된 오브젝트들의 카테고리를 ‘과학’으로, 하위 카테고리는 ‘지구과학’으로 결정할 수 있다. 또한, 특정 외부 장치로부터 수신된 컨텐츠에 원소와 관련된 오브젝트들이 다수 포함되어 있는 경우, 영상 분석 모듈(1522)은 해당 외부 장치로부터 수신된 컨텐츠에 포함된 오브젝트들의 카테고리를 ‘과학’으로, 하위 카테고리는 ‘화학’으로 결정할 수 있다.

본 개시의 일 실시예에 따르면, 음성 분석 모듈(1521) 또는 영상 분석 모듈(1522)은 별도의 서버에 포함될 수 있다.

음성 수신부(1310)에서 수신된 사용자 음성 입력의 음성 분석 결과에 기초하여 사용자 인텐트를 결정하는 구체적인 방법은, 도 3 내지 도 9에 대한 설명에서 서술한다. 또한, 오브젝트 추출 모듈(1510)에서 추출된 오브젝트들에 기초하여 레퍼런스 컨텐츠 또는 제출 컨텐츠에 포함되는 영상의 영상 분석 결과에 기초하여 사용자 인텐트를 결정하는 구체적인 방법은 도 10 내지 도 13에 대한 설명에서 서술한다.

본 개시의 일 실시예에서, 프로세서(1100)는 저장부(1500)에 저장된 프로그램들 중 컨텐츠 평가 모듈(1530)의 적어도 하나의 명령어들을 실행함으로써, 레퍼런스 데이터와 타겟 오브젝트의 비교 결과에 기초하여 제출 컨텐츠를 평가할 수 있다.

본 개시의 일 실시예에서, 프로세서(1100)는 저장부(1500)에 저장된 프로그램들 중 레퍼런스 데이터 획득 모듈(1531)의 적어도 하나의 명령어들을 실행함으로써, 인텐트 결정 모듈(1520)에서 결정된 사용자 인텐트에 기초하여 레퍼런스 데이터를 획득할 수 있다. 또한 본 개시의 일 실시예에서, 프로세서(1100)는 저장부(1500)에 저장된 프로그램들 중 타겟 오브젝트 결정 모듈(1532)의 적어도 하나의 명령어들을 실행함으로써, 레퍼런스 데이터 획득 모듈(1531)에서 결정된 레퍼런스 데이터와 비교될 타겟 오브젝트를 결정할 수 있다.

본 개시에 따른 각 실시예에서 레퍼런스 데이터를 획득하는 구체적인 방법 및 타겟 오브젝트를 결정하는 구체적인 방법은 도 3 내지 도 13에 대한 설명에서 서술한다.

도 3은 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하는 방법의 동작 흐름도이다.

도 3을 참조하면, 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하기 위한 시스템은, 디스플레이 장치(1000), 및 적어도 하나의 외부 장치(200-1 내지 200-N)를 포함할 수 있다.

도 3에 도시된 외부 장치의 컨텐츠를 평가하는 시스템은 도 1 및 도 2를 참조하여 전술한 시스템 및 장치의 아키텍처와 많은 면에서 유사할 수 있으며, 위에 언급되지 않은 추가 기능이 포함될 수 있다. 전술한 시스템 및 장치의 구성 요소에 대한 일부 설명은 생략되거나 간결하게 기재될 수 있다. 디스플레이 장치(1000)는 시각적인 정보를 전달할 수 있도록 동작하는 장치를 의미하며, 디스플레이 장치(1000)는 적어도 하나의 외부 장치(200-1 내지 200-N)로 소정의 컨텐츠를 전송하거나, 적어도 하나의 외부 장치(200-1 내지 200-N)로부터 소정의 컨텐츠를 수신할 수 있다. 디스플레이 장치(1000)는 적어도 하나의 외부 장치(200-1 내지 200-N)로부터 수신된 소정의 컨텐츠를 평가할 수 있다.

본 개시의 일 실시예에서, 적어도 하나의 외부 장치(200-1 내지 200-N)는 디스플레이 장치(1000)와 네트워크(300-1 내지 300-N)를 통해 연결되어 있다. 결과적으로 적어도 하나의 외부 장치(200-1 내지 200-N)는 네트워크(300-1 내지 300-N)를 통해 디스플레이 장치(1000)로부터 소정의 컨텐츠를 수신할 수 있다. 다른 실시예에서, 적어도 하나의 외부 장치(200-1 내지 200-N)는 적어도 하나의 외부 장치(200-1 내지 200-N)의 외부 사용자에게 소정의 컨텐츠를 제공하거나, 디스플레이 장치(1000)로 소정의 컨텐츠를 전송하도록 동작할 수 있다.

디스플레이 장치(1000)와 적어도 하나의 외부 장치(200-1 내지 200-N)는 각각 네트워크(미도시)로 연결되어 있다.

동작 301에서, 디스플레이 장치(1000)는 디스플레이 장치 사용자의 음성 입력을 획득할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000) 사용자의 음성은 디스플레이 장치(1000)의 입력부(1300, 예를 들어, 음성 수신부 1310)를 통해 수신될 수 있다. 본 개시의 일 실시예에 따르면, 사용자의 음성 입력은 디스플레이 장치(1000)에 입력되는 복수의 사용자 음성 입력 중에서, 화자 인식을 통해 인식된 디스플레이 장치 사용자의 음성일 수 있다.

화자 인식 동작은 수신된 음성을 분석하여 사용자를 구별하고, 미리 저장된 사용자의 음성 정보와 비교하여 화자를 인식 동작을 포함할 수 있다. 다수의 사용자가 발화하는 교실 또는 회의실과 같은 환경에서, 동시에 다수의 사용자의 음성이 수신되는 경우, 디스플레이 장치(1000)는 수신된 음성 중 화자 인식을 통해 인식된 디스플레이 장치 사용자의 음성만을 이용할 수 있다.

동작 302에서, 디스플레이 장치(1000)는 사용자 음성 입력 해석 결과에 기초하여 사용자 인텐트를 판단할 수 있다.

본 개시의 일 실시예에 따르면, 수신된 사용자 음성 입력은 디스플레이 장치(1000)의 음성 분석 모듈(1522) 또는 외부 서버(미도시)를 이용하여 해석될 수 있다.

인텐트는 NLU 모델을 이용하여 음성 입력에 대응되는 텍스트를 해석함으로써 결정되는 정보로서, 음성 입력의 발화 의도를 나타낼 수 있다.

사용자 인텐트는 오브젝트 인식을 이용하여 컨텐츠에 포함되는 오브젝트를 해석함으로써 결정되는 정보로서, 디스플레이 장치(1000)의 사용자(100)가 디스플레이 장치(1000)를 이용하는 목적 또는 적어도 하나의 외부 장치의 사용자에게 전달하려고 하는 내용이나 주제를 나타낼 수 있다.

본 개시의 일 실시예에 따르면, 사용자 인텐트는, 디스플레이 장치(1000) 사용자가 의도하는 디스플레이 장치의 동작 또는 외부 장치의 동작을 나타내는 정보일 수 있다. 본 개시의 일 실시예에 따르면, 사용자 인텐트는 사용자 음성에 포함된 의도, 지시의 포함 여부, 지시의 종류, 및 컨텐츠의 주제 중 적어도 하나를 포함할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는 음성 입력을 수신하고 이를 실시간으로 분석하여, 음성 분석 결과 사용자의 음성 입력에 소정의 지시(예를 들어, 지시어, 제안, 요구어 등)가 포함되지 않는 것으로 판단되면 대기 상태를 유지하고 사용자의 음성 입력에 소정의 지시가 포함되는 것으로 판단되면 이후 동작을 수행하도록 구성될 수 있다.

동작 303에서, 디스플레이 장치(1000)는 사용자 인텐트에 기초하여 레퍼런스 데이터를 획득할 수 있다.

예를 들어, 사용자 인텐트가 적어도 하나의 외부 장치(200-1 내지 200-N)로 레퍼런스 컨텐츠를 공유하고, 적어도 하나의 외부 장치(200-1 내지 200-N)로부터 대응되는 제출 컨텐츠를 수신하여 채점(평가)하는 것이라면, 디스플레이 장치(1000)는 레퍼런스 컨텐츠에서 추출된 오브젝트 중 정답 오브젝트를 레퍼런스 데이터로 결정할 수 있다.

이와 같은 경우 레퍼런스 컨텐츠는, 디스플레이 장치(1000)가 적어도 하나의 외부 장치(200-1 내지 200-N)로 공유한 컨텐츠로, 디스플레이 장치(1000)는 동작 304 이전에 레퍼런스 컨텐츠를 적어도 하나의 외부 장치(200-1 내지 200-N)로 전송한다.

다른 예로, 사용자 인텐트가 레퍼런스 컨텐츠 없이 적어도 하나의 외부 장치(200-1 내지 200-N)로부터 수신된 제출 컨텐츠를 평가하는 것이라면, 디스플레이 장치(1000)는 사용자의 음성 입력에 포함된 키워드에 기초하여 결정된 소정의 카테고리에 포함되는 데이터를 레퍼런스 데이터로 결정할 수 있다. 이 때, 레퍼런스 데이터는 데이터베이스에 포함되는 데이터들 중, 선택될 수 있으며, 데이터 베이스는 디스플레이 장치(1000) 또는 외부 서버(미도시)에 위치할 수 있다.

동작 304에서, 적어도 하나의 외부 장치(200-1 내지 200-N)는 제출 컨텐츠(제출 컨텐츠 1 내지 제출 컨텐츠 N)를 생성할 수 있다.

동작 304-1에서, 제1 외부 장치(200-1)는 디스플레이 장치(1000) 사용자의 음성 발화에 대응한 제1 외부 장치(200-1) 사용자의 입력에 기초하여 제출 컨텐츠1을 생성할 수 있다.

동작 304-N에서, 제N 외부 장치(200-N)는 디스플레이 장치(1000) 사용자의 음성 발화에 대응한 제N 외부 장치(200-N) 사용자의 입력에 기초하여 제출 컨텐츠N을 생성할 수 있다.

예를 들어, 사용자 인텐트가 적어도 하나의 외부 장치(200-1 내지 200-N)로 레퍼런스 컨텐츠를 공유하고, 적어도 하나의 외부 장치(200-1 내지 200-N)로부터 대응되는 제출 컨텐츠를 수신하여 채점(평가)하는 것이라면, 제출 컨텐츠(제출 컨텐츠 1 내지 제출 컨텐츠 N)는 레퍼런스 컨텐츠에 소정의 입력이 추가된 컨텐츠일 수 있다.

다른 예를 들어, 사용자 인텐트가 레퍼런스 컨텐츠 없이 적어도 하나의 외부 장치(200-1 내지 200-N)로부터 수신된 제출 컨텐츠를 평가하는 것이라면, 제출 컨텐츠(제출 컨텐츠 1 내지 제출 컨텐츠 N)는 제출 컨텐츠(제출 컨텐츠 1 내지 제출 컨텐츠 N)는 외부 장치(200-1 내지 200-N) 사용자의 입력 그 자체가 될 수 있다.

동작 305에서, 적어도 하나의 외부 장치(200-1 내지 200-N)는 제출 컨텐츠를 디스플레이 장치(1000)로 전송할 수 있다.

본 개시의 일 실시예에 따르면, 동작 305-1에서 제1 외부 장치는 제출 컨텐츠1을 디스플레이 장치(1000)로 전송하고, 동작 305-N에서 제N 외부 장치는 제출 컨텐츠N을 디스플레이 장치(1000)로 전송할 수 있다.

동작 306에서, 디스플레이 장치(1000)는 제출 컨텐츠에 포함되는 오브젝트들 중, 레퍼런스 데이터와 비교할 적어도 하나의 타겟 오브젝트를 결정할 수 있다.

예를 들어, 사용자 인텐트가 적어도 하나의 외부 장치(200-1 내지 200-N)로 레퍼런스 컨텐츠를 공유하고, 적어도 하나의 외부 장치(200-1 내지 200-N)로부터 대응되는 제출 컨텐츠를 수신하여 채점(평가)하는 것이라면, 타겟 오브젝트는 제출 컨텐츠(제출 컨텐츠 1 내지 제출 컨텐츠 N) 각각에 포함된 오브젝트 중, 사용자 입력이 추가된 오브젝트일 수 있다.

다른 예를 들어, 사용자 인텐트가 레퍼런스 컨텐츠 없이 적어도 하나의 외부 장치(200-1 내지 200-N)로부터 수신된 제출 컨텐츠를 평가하는 것이라면, 타겟 오브젝트는 제출 컨텐츠에 포함된 오브젝트 전체일 수 있다.

동작 307에서, 디스플레이 장치(1000)는 레퍼런스 데이터와 적어도 하나의 타겟 오브젝트를 비교하여, 수신된 제출 컨텐츠 각각을 평가할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는 컨텐츠 평가에 대한 정보를 적어도 하나의 외부 장치(200-1 내지 200-N) 중 적어도 하나로 전달할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는 적어도 하나의 타겟 오브젝트와 레퍼런스 데이터의 비교 결과에 대한 점수를 획득하고, 비교 결과에 대한 점수가 소정의 임계값 이하인 경우 컨텐츠 평가에 대한 정보를 적어도 하나의 외부 장치(200-1 내지 200-N) 중 적어도 하나로 전달할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000) 또는 적어도 하나의 외부 장치(200-1 내지 200-N)는 컨텐츠 평가에 대한 정보를 디스플레이부(1410)에 디스플레이하여 각 장치의 사용자가 컨텐츠 평가 결과를 확인하도록 할 수 있다.

도 4는 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하는 방법을 나타내는 도면이다.

도 4를 참조하면, 디스플레이 장치(1000)의 사용자는, 적어도 하나의 외부 장치(200-1 내지 200-N)의 사용자에게 소정의 지시를 포함하는 음성을 발화하고, 디스플레이 장치(1000)를 이용하여 레퍼런스 컨텐츠(400)를 공유할 수 있다.

예를 들어, 디스플레이 장치(1000)의 사용자인 교사가 “화면 중 행성에 해당하는 것에 동그라미해서 결과물을 공유해 주세요.”라는 음성을 발화한 경우, 디스플레이 장치(1000)의 음성 수신부(1310)는 디스플레이 장치(1000) 사용자의 음성 입력을 획득할 수 있다. 이 때, 레퍼런스 컨텐츠(400)는 행성에 해당하는 오브젝트를 포함하는 이미지일 수 있다.

음성 입력을 획득한 디스플레이 장치(1000)는, 인텐트 결정 모듈(1520)의 음성 분석 모듈(1521)을 이용하여 획득된 사용자 음성 입력을 해석할 수 있다. 다른 실시예에 따르면, 디스플레이 장치(1000)는 획득된 음성 입력을 외부 서버로 전달하고, 외부 서버로부터 음성 입력 해석 결과를 획득할 수 있다.

인텐트 결정 모듈(1520)는 음성 입력 해석 결과에 기초하여 사용자 인텐트를 결정할 수 있다. 인텐트는 NLU 모델을 이용하여 음성 입력에 대응되는 텍스트를 해석함으로써 결정되는 정보로서, 음성 입력의 발화 의도를 나타낼 수 있다.

사용자 인텐트는 디스플레이 장치(1000)의 동작 및/또는 외부 장치(200-1 내지 200-N)의 동작과 같이 디스플레이 장치(1000) 사용자가 의도하는 동작을 나타내는 정보일 수 있다. 본 개시의 일 실시예에 따르면, 사용자 인텐트는 사용자 음성에 포함된 발화 의도, 지시의 포함 여부, 지시의 종류, 및 컨텐츠의 주제 중 적어도 하나를 포함할 수 있다.

도 4에 도시된 실시예에서, 디스플레이 장치(1000) 사용자의 인텐트는 적어도 하나의 외부 장치(200-1 내지 200-N) 사용자인 학생들이, 디스플레이 장치(1000)로부터 공유되는 레퍼런스 컨텐츠(400)에 포함되는 복수의 오브젝트 중 ‘행성’에 해당하는 오브젝트에 ‘동그라미’한 결과물인, ‘제출 컨텐츠1 내지 제출 컨텐츠N’을 ‘수신’하여 ‘평가’하는 것이다.

다시 말해, 사용자 음성에 포함된 발화 의도는, ‘제출 컨텐츠1 내지 제출 컨텐츠N’을 ‘수신’하여 ‘평가’하는 것이고, 사용자 음성에는 디스플레이 장치(1000)로부터 공유되는 레퍼런스 컨텐츠(400)에 ‘표시’하여 ‘제출(공유)’하는 취지의 지시가 ‘포함’된다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는 사용자 음성 입력을 모니터링 할 수 있고, 소정의 주기마다 사용자 인텐트를 업데이트 할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는 사용자 음성 입력에 소정의 키워드가 포함된 경우, 사용자 음성 입력을 해석하도록 동작할 수 있다.

도 4에 도시된 실시예에서, 디스플레이 장치(1000)는, 사용자 발화 음성에 포함된 지시어, 즉 ‘해주세요’라는 음성 입력을 트리거로 하여, 모니터링 중이던 사용자 음성 입력 해석을 시작할 수 있다. 이 때, 디스플레이 장치(1000)는 지시어가 수신된 시간을 기준으로 그 이전 소정의 시간부터 지시어가 수신된 시간까지의 음성 입력을 해석하여 사용자 인텐트를 결정할 수 있다. 예를 들어, 모니터링 시간이 10초이고 디스플레이 장치 사용자의 지시어가 12:05:30에 수신되었다면, 디스플레이 장치(1000)는 12:05:20부터 12:05:30까지의 사용자 음성 입력을 해석하여 사용자 인텐트를 결정할 수 있다. 모니터링 시간은 디스플레이 장치(1000)에 설정된 값이거나 디스플레이 장치(1000)의 사용자가 설정한 값일 수 있다.

도 5는 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하는 방법의 동작 흐름도이다.

도 5를 참조하면, 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하기 위한 시스템은, 디스플레이 장치(1000), 및 적어도 하나의 외부 장치(200-1 내지 200-N)를 포함할 수 있다.

도 5에 도시된 외부 장치의 컨텐츠를 평가하는 시스템은 도 1 내지 도 3을 참조하여 전술한 시스템 및 장치의 아키텍처와 많은 면에서 유사할 수 있으며, 위에 언급되지 않은 추가 기능이 포함될 수 있다. 전술한 시스템 및 장치의 구성 요소에 대한 일부 설명은 생략되거나 간결하게 기재될 수 있다.동작 501에서, 디스플레이 장치(1000)는 레퍼런스 컨텐츠를 획득할 수 있다.

동작 502에서, 디스플레이 장치(1000)는 레퍼런스 컨텐츠(500-1 내지 500-N)를 적어도 하나의 외부 장치(200-1 내지 200-N)로 전송(예를 들어, 공유)할 수 있다.

동작 503에서, 디스플레이 장치(1000)는 디스플레이 장치 사용자의 음성 입력을 획득할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000) 사용자(100)의 음성은 디스플레이 장치(1000)의 입력부를 통해 수신될 수 있다. 본 개시의 일 실시예에 따르면, 사용자(100)의 음성 입력은 디스플레이 장치(1000)에 입력되는 복수의 사용자 음성 입력 중에서, 화자 인식을 통해 인식된 디스플레이 장치 사용자의 음성일 수 있다.

동작 504에서, 디스플레이 장치(1000)는 사용자 음성 입력 해석 결과에 기초하여 사용자 인텐트를 판단할 수 있다.

본 개시의 일 실시예에 따르면, 수신된 사용자 음성 입력은 디스플레이 장치(1000)의 음성 분석 모듈 또는 외부 서버를 이용하여 해석될 수 있다. 인텐트는 NLU 모델을 이용하여 음성 입력에 대응되는 텍스트를 해석함으로써 결정되는 정보로서, 음성 입력의 발화 의도를 나타낼 수 있다.

도 4를 참조하면, 디스플레이 장치(1000)의 사용자의 음성 입력 해석 결과, 레퍼런스 컨텐츠에 포함되는 오브젝트들 중 ‘행성’에 해당하는 것에 ‘동그라미’된 결과물의 ‘공유’를 ‘지시’했다면, 사용자 인텐트를 결정하기 위한 주요 정보는 ‘행성’, ‘동그라미’, ‘공유’, ‘지시’일 수 있다.

도 5를 참조하면, 동작 505에서, 디스플레이 장치(1000)는 사용자 인텐트에 기초하여 레퍼런스 데이터를 획득할 수 있다.

도 4를 참조하면, 레퍼런스 컨텐츠는 16개의 오브젝트를 포함하고, 전자 장치는 레퍼런스 컨텐츠에 포함되는 16개의 오브젝트 중 9개의 오브젝트를 사용자 인텐트에 기초하여 9개의 정답 오브젝트들이 레퍼런스 데이터로 결정할 수 있다. 이 때, 정답 오브젝트들은 ‘수성(Mercury)’, ‘금성(Venus)’, ‘지구(Earth)’, ‘화성(Mars)’, ‘목성(Jupiter)’, ‘토성(Saturn)’, ‘천왕성(Uranus)’, ‘해왕성(Neptune)’, 및 ‘명왕성(Pluto)’ 에 해당한다.

도 5를 참조하면, 동작 506에서, 적어도 하나의 외부 장치(200-1 내지 200-N)는 제출 컨텐츠(제출 컨텐츠 507-1 내지 제출 컨텐츠 507-N)를 생성할 수 있다.

적어도 하나의 외부 장치(200-1 내지 200-N) 각각은, 디스플레이 사용자의 음성 발화에 대응한 적어도 하나의 외부 장치(200-1 내지 200-N) 사용자의 입력에 기초하여 제출 컨텐츠(제출 컨텐츠 507-1 내지 제출 컨텐츠 507-N)를 생성할 수 있다.

예를 들어, 사용자 인텐트가 적어도 하나의 외부 장치(200-1 내지 200-N)로 레퍼런스 컨텐츠를 공유하고, 적어도 하나의 외부 장치(200-1 내지 200-N)로부터 대응되는 제출 컨텐츠를 수신하여 채점(평가)하는 것이라면, 제출 컨텐츠(제출 컨텐츠 507-1 내지 제출 컨텐츠 507-N)는 레퍼런스 컨텐츠에 소정의 입력이 추가된 컨텐츠일 수 있다.

동작 507에서, 적어도 하나의 외부 장치(200-1 내지 200-N)는 제출 컨텐츠를 디스플레이 장치(1000)로 전송할 수 있다.

동작 508에서, 디스플레이 장치(1000)는 제출 컨텐츠(제출 컨텐츠 507-1 내지 제출 컨텐츠 507-N)에 포함되는 오브젝트들 중, 레퍼런스 데이터와 비교할 적어도 하나의 타겟 오브젝트를 결정할 수 있다.

본 개시의 일 실시예에 따르면, 소정의 입력은 사용자 인텐트에 기초하여 결정될 수 있다. 예를 들어, 디스플레이 장치(1000) 사용자가 표시 방법으로 ‘동그라미’를 의도하였다면, 디스플레이 장치(1000)는 제출 컨텐츠(제출 컨텐츠 1 내지 제출 컨텐츠 N) 각각에 포함된 오브젝트 중 사용자 입력으로 ‘동그라미’가 추가된 오브젝트를 타겟 오브젝트로 결정할 수 있다.

도 4를 참조하면, 제1 외부 장치의 타겟 오브젝트는 제출 데이터 500-1에 포함된 오브젝트 중 동그라미가 입력된 ‘수성(Mercury)’, ‘금성(Venus)’, ‘지구(Earth)’, ‘화성(Mars)’, ‘목성(Jupiter)’, ‘토성(Saturn)’, ‘천왕성(Uranus)’, ‘해왕성(Neptune)’, 및 ‘명왕성(Pluto)’로 모두 9개의 오브젝트를 포함할 수 있다. 또한, 제N 외부 장치의 타겟 오브젝트는 제출 데이터 500-N에 포함된 오브젝트 중 동그라미가 입력된 ‘수성(Mercury)’, ‘금성(Venus)’, ‘지구(Earth)’, ‘화성(Mars)’, ‘목성(Jupiter)’, ‘토성(Saturn)’, ‘천왕성(Uranus)’, ‘해왕성(Neptune)’, ‘명왕성(Pluto)’, 및 ‘달(Moon)’로 모두 10개의 오브젝트를 포함할 수 있다. 본 개시의 실시예에서, 도 4의 제출 데이터(500-1)는 도 5의 제출 컨텐츠(507-1)에 해당할 수 있고, 도 4의 제출 데이터(500-N)는 도 5의 제출 컨텐츠(507-N)에 대응할 수 있다. 5.

도 5를 참조하면, 동작 509에서, 디스플레이 장치(1000)는 레퍼런스 데이터와 적어도 하나의 타겟 오브젝트를 비교하여, 수신된 제출 컨텐츠 각각을 평가할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)의 프로세서(1100)는 컨텐츠 평가에 대한 정보를 적어도 하나의 외부 장치(200-1 내지 200-N) 중 적어도 하나로 피드백할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)의 프로세서(1100)는 적어도 하나의 타겟 오브젝트와 레퍼런스 데이터의 비교 결과에 대한 점수를 획득하고, 비교 결과에 대한 점수가 소정의 임계값 이하인 경우 컨텐츠 평가에 대한 정보를 적어도 하나의 외부 장치(200-1 내지 200-N) 중 적어도 하나로 피드백할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)의 프로세서(1100)는 디스플레이 장치의 출력부(1400)에 컨텐츠 평가에 대한 정보를 출력할 수 있다. 예를 들어, 디스플레이 장치(1000) 는 컨텐츠 평가에 대한 정보를 디스플레이 장치의 디스플레이부(1410)에 디스플레이할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)의 프로세서(1100)는 적어도 하나의 타겟 오브젝트와 레퍼런스 데이터의 비교 결과에 대한 점수를 획득하고, 비교 결과에 대한 점수가 소정의 임계값 이하인 경우 컨텐츠 평가에 대한 정보를 디스플레이 장치의 디스플레이부(1410)에 디스플레이할 수 있다.

도 6은 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하는 방법의 순서도이다.

도 6을 참조하면, 본 개시의 일 실시예에 따른 디스플레이 장치(1000)는 시각적인 정보를 전달할 수 있도록 동작하는 장치를 의미하며, 디스플레이 장치(1000)는 네트워크(300)로 연결된 외부 장치(200)로 소정의 컨텐츠를 전송하거나, 외부 장치(200)로부터 소정의 컨텐츠를 수신할 수 있다. 디스플레이 장치(1000)는 외부 장치(200)로부터 수신된 소정의 컨텐츠를 평가할 수 있다.

도 6에 도시된 외부 장치의 컨텐츠를 평가하는 시스템은 도 1 내지 도 5를 참조하여 전술한 시스템 및 장치의 아키텍처와 많은 면에서 유사할 수 있으며, 위에 언급되지 않은 추가 기능이 포함될 수 있다. 전술한 시스템 및 장치의 구성 요소에 대한 일부 설명은 생략되거나 간결하게 기재될 수 있다.

동작 601에서, 디스플레이 장치(1000)는 디스플레이 장치 사용자의 음성 입력을 획득할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000) 사용자의 음성은 디스플레이 장치(1000)의 입력부(1300)를 통해 수신될 수 있다. 본 개시의 일 실시예에 따르면, 사용자의 음성 입력은 디스플레이 장치(1000)에 입력되는 복수의 사용자 음성 입력 중에서, 화자 인식을 통해 인식된 디스플레이 장치 사용자의 음성일 수 있다.

동작 602에서, 디스플레이 장치(1000)는 사용자 음성 입력 해석 결과에 기초하여 사용자 인텐트를 판단할 수 있다.

본 개시의 일 실시예에 따르면, 수신된 사용자 음성 입력은 디스플레이 장치(1000)의 음성 분석 모듈(1522) 또는 외부 서버(미도시)를 이용하여 해석될 수 있다. 인텐트는 NLU 모델을 이용하여 음성 입력에 대응되는 텍스트를 해석함으로써 결정되는 정보로서, 음성 입력의 발화 의도를 나타낼 수 있다.

본 개시의 일 실시예에 따르면, 사용자 인텐트는, 디스플레이 장치(1000)의 동작 및/또는 외부 장치(200-1 내지 200-N)의 동작과 같이 디스플레이 장치(1000) 사용자가 의도하는 동작 또는 외부 장치의 동작을 나타내는 정보일 수 있다. 본 개시의 일 실시예에 따르면, 사용자 인텐트는 사용자 음성에 포함된 의도, 지시의 포함 여부, 지시의 종류, 및 컨텐츠의 주제 중 적어도 하나를 포함할 수 있다.

동작 603에서, 디스플레이 장치(1000)는 사용자 인텐트에 기초하여 레퍼런스 데이터를 획득할 수 있다.

본 개시의 일 실시예에 따르면, 사용자 인텐트가 외부 장치로 레퍼런스 컨텐츠를 공유하고, 외부 장치로부터 대응되는 제출 컨텐츠를 수신하여 채점(평가)하는 것이라면, 디스플레이 장치(1000)는 레퍼런스 컨텐츠에서 추출된 오브젝트 중 정답 오브젝트를 레퍼런스 데이터로 결정할 수 있다.

이와 같은 경우 레퍼런스 컨텐츠는, 디스플레이 장치(1000)가 외부 장치로 공유한 컨텐츠로, 디스플레이 장치(1000)는 외부 장치가 제출 컨텐츠(예를 들어, 도 5의 제출 컨텐츠 507-1 내지 제출 컨텐츠 507-N)를 생성하기 이전에 레퍼런스 컨텐츠를 외부 장치로 전송한다.

동작 604에서, 디스플레이 장치(1000)는 디스플레이 장치(1000)와 연결된 외부 장치로부터 제출 컨텐츠를 획득할 수 있다.

본 개시의 일 실시예에 따르면, 외부 장치는 제출 컨텐츠를 디스플레이 장치(1000)로 전송하고, 디스플레이 장치(1000)는 외부 장치로부터 제출 컨텐츠를 수신할 수 있다.

본 개시의 일 실시예에 따르면, 사용자 인텐트가 외부 장치로 레퍼런스 컨텐츠를 공유하고, 외부 장치로부터 대응되는 제출 컨텐츠를 수신하여 채점(평가)하는 것이라면, 제출 컨텐츠는 레퍼런스 컨텐츠에 소정의 입력이 추가된 컨텐츠일 수 있다.

동작 605에서, 디스플레이 장치(1000)는 제출 컨텐츠에 포함되는 오브젝트들 중, 레퍼런스 데이터와 비교할 적어도 하나의 타겟 오브젝트를 결정할 수 있다.

예를 들어, 사용자 인텐트가 외부 장치(200)로 레퍼런스 컨텐츠를 공유하고, 외부 장치로부터 대응되는 제출 컨텐츠를 수신하여 채점(평가)하는 것이라면, 타겟 오브젝트는 제출 컨텐츠에 포함된 오브젝트 중, 사용자 입력이 추가된 오브젝트일 수 있다.

동작 606에서, 디스플레이 장치(1000)는 레퍼런스 데이터와 적어도 하나의 타겟 오브젝트를 비교하여, 수신된 제출 컨텐츠를 평가할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는 컨텐츠 평가에 대한 정보를 외부 장치로 전달할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는 적어도 하나의 타겟 오브젝트와 레퍼런스 데이터의 비교 결과에 대한 점수를 획득하고, 비교 결과에 대한 점수가 소정의 임계값 이하인 경우 컨텐츠 평가에 대한 정보를 외부 장치로 전달할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000) 또는 외부 장치는 컨텐츠 평가에 대한 정보를 디스플레이부(1410)에 디스플레이하여 각 외부 장치의 사용자가 컨텐츠 평가 결과를 확인하도록 할 수 있다.

도 7은 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하는 방법을 나타내는 도면이다.

도 7에 도시된 외부 장치의 컨텐츠를 평가하는 방법의 예시는 도 4를 참조하여 전술한 예시적인 방법과 많은 면에서 유사할 수 있으며, 위에 언급되지 않은 추가 기능이 포함될 수 있다. 전술한 방법의 구성 요소에 대한 일부 설명은 생략되거나 간결하게 기재될 수 있다.

도 7을 참조하면, 디스플레이 장치(1000)의 사용자는, 적어도 하나의 외부 장치(200-1 내지 200-N)의 사용자에게 소정의 지시를 포함하는 음성을 발화할 수 있다.

예를 들어, 디스플레이 장치(1000)의 사용자인 교사가 “가을 풍경을 그려보세요.”라는 음성을 발화한 경우, 디스플레이 장치(1000)의 음성 수신부(1310)는 디스플레이 장치(1000) 사용자의 음성 입력을 획득할 수 있다.

음성 입력을 획득한 디스플레이 장치(1000)는, 인텐트 결정 모듈(1520)의 음성 분석 모듈(1521)을 이용하여 획득된 사용자 음성 입력을 해석할 수 있다. 다른 실시예에 따르면, 디스플레이 장치(1000)는 획득된 음성 입력을 외부 서버로 전달하고, 외부 서버로부터 음성 입력 해석 결과를 획득할 수 있다. 인텐트 결정 모듈(1520)는 음성 입력 해석 결과에 기초하여 사용자 인텐트를 결정할 수 있다.

도 7에 도시된 실시예에서, 디스플레이 장치(1000) 사용자의 인텐트는 적어도 하나의 외부 장치(200-1 내지 200-N) 사용자인 학생들이, ‘가을 풍경’에 대한 ‘그림’인 ‘제출 컨텐츠1 내지 제출 컨텐츠N’을 ‘수신’하여 ‘평가’하는 것이다. 다시 말해, 사용자 음성에 포함된 발화 의도는, ‘제출 컨텐츠1 내지 제출 컨텐츠N’을 ‘수신’하여 ‘평가’하는 것이고, 사용자 음성에는 ‘가을 풍경’을 ‘그려’ ‘제출(공유)’하는 취지의 지시가 ‘포함’된다.

도 7에 도시된 실시예에서, 디스플레이 장치(1000)는, 사용자 발화 음성에 포함된 지시어, 즉 ‘그려보세요’라는 음성 입력을 트리거로 하여, 모니터링 중이던 사용자 음성 입력 해석을 시작할 수 있다.

도 8은 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하는 방법의 동작 흐름도이다.

도 8을 참조하면, 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하기 위한 시스템은, 디스플레이 장치(1000), 및 적어도 하나의 외부 장치(200-1 내지 200-N)를 포함할 수 있다.

도 8에 도시된 외부 장치의 컨텐츠를 평가하는 시스템은 도 1 내지 도 6을 참조하여 전술한 시스템 및 장치의 아키텍처와 많은 면에서 유사할 수 있으며, 위에 언급되지 않은 추가 기능이 포함될 수 있다. 전술한 시스템 및 장치의 구성 요소에 대한 일부 설명은 생략되거나 간결하게 기재될 수 있다.

동작 801에서, 디스플레이 장치(1000)는 디스플레이 장치 사용자의 음성 입력을 획득할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치 사용자의 음성은 디스플레이 장치(1000)의 입력부(1300), 예를 들어, 음성 수신부 1310),를 통해 수신될 수 있다. 본 개시의 일 실시예에 따르면, 사용자의 음성 입력은 디스플레이 장치(1000)에 입력되는 복수의 사용자 음성 입력 중에서, 화자 인식을 통해 인식된 디스플레이 장치 사용자의 음성일 수 있다.

동작 802에서, 디스플레이 장치(1000)는 사용자 음성 입력 해석 결과에 기초하여 사용자 인텐트를 판단할 수 있다.

본 개시의 일 실시예에 따르면, 수신된 사용자 음성 입력은 디스플레이 장치(1000)의 음성 분석 모듈 또는 외부 서버를 이용하여 해석될 수 있다. 사용자 인텐트는 NLU 모델을 이용하여 음성 입력에 대응되는 텍스트를 해석함으로써 결정되는 정보로서, 음성 입력의 발화 의도를 나타낼 수 있다.

도 7을 참조하면, 디스플레이 장치(1000)의 사용자의 음성 입력 해석 결과, ‘가을’, ‘풍경’을 ‘그릴 것’을 ‘지시’했다면, 사용자 인텐트를 결정하기 위한 주요 정보는 ‘가을’, ‘풍경’, ‘그림’, ‘지시’일 수 있다.

도 8을 참조하면, 동작 803에서, 디스플레이 장치(1000)는 사용자 인텐트에 기초하여 레퍼런스 카테고리를 결정할 수 있다.

도 7을 참조하면, 사용자 인텐트를 결정하기 위한 주요 정보는 ‘가을’, ‘풍경’, ‘그림’, ‘지시’이고, 이 중 ‘가을’, ‘풍경’, 및 ‘그림’에 대응되는 카테고리가 레퍼런스 카테고리로 결정될 수 있다. 이 때, 레퍼런스 카테고리는 소정의 데이터베이스(DB)에 포함되는 데이터들의 분류 카테고리에 따라 달라질 수 있으며, 소정의 데이터베이스(DB)는 디스플레이 장치(1000) 외부에 존재할 수 있다.

도 8을 참조하면, 동작 804에서, 디스플레이 장치(1000)는 DB 데이터 중 레퍼런스 카테고리에 포함되는 데이터를 레퍼런스 데이터로 결정할 수 있다.

도 7을 참조하면, ‘가을’ 및 ‘풍경’에 대응되는 카테고리가 레퍼런스 카테고리로 결정되었으므로, 디스플레이 장치(1000)는 DB 데이터 중 ‘가을’ 카테고리로 분류된 이미지(그림) 및 ‘풍경’ 카테고리로 분류된 이미지(그림)를 레퍼런스 데이터로 결정할 수 있다.

도 8을 참조하면, 동작 805에서, 적어도 하나의 외부 장치(200-1 내지 200-N)는 제출 컨텐츠(제출 컨텐츠 1 내지 제출 컨텐츠 N)를 생성할 수 있다.

적어도 하나의 외부 장치(200-1 내지 200-N) 각각은, 디스플레이 사용자의 음성 발화에 대응한 적어도 하나의 외부 장치(200-1 내지 200-N) 사용자의 입력에 기초하여 제출 컨텐츠(제출 컨텐츠 806-1 내지 제출 컨텐츠 806-N)를 생성할 수 있다.

동작 806에서, 적어도 하나의 외부 장치(200-1 내지 200-N)는 제출 컨텐츠(제출 컨텐츠 806-1 내지 제출 컨텐츠 806-N)를 디스플레이 장치(1000)로 전송할 수 있다.

도 7을 참조하면, 사용자 인텐트가 ‘가을’ ‘풍경’에 대한 그림인 제출 컨텐츠를 수신하여 채점(평가)하는 것이라면, 제출 컨텐츠(제출 컨텐츠 806-1 내지 제출 컨텐츠 806-N)는 적어도 하나의 외부 장치(200-1 내지 200-N) 사용자가 자유롭게 그린 ‘가을 풍경 그림’일 수 있다.

도 8을 참조하면, 동작 807에서, 디스플레이 장치(1000)는 제출 컨텐츠(305)에 포함되는 오브젝트들 중, 레퍼런스 데이터와 비교할 적어도 하나의 타겟 오브젝트를 결정할 수 있다.

도 7을 참조하면, 사용자 인텐트가 ‘가을’ ‘풍경’에 대한 그림인 제출 컨텐츠를 수신하여 채점(평가)하는 것이라면, 타겟 오브젝트는 제출 컨텐츠(제출 컨텐츠 1 내지 제출 컨텐츠 N)는 적어도 하나의 외부 장치(200-1 내지 200-N) 사용자가 자유롭게 그린 ‘가을 풍경 그림’ 각각에 포함된 오브젝트 중, ‘그림’에 해당하는 오브젝트일 수 있다.

도 8을 참조하면, 디스플레이 장치(1000)는 레퍼런스 데이터와 적어도 하나의 타겟 오브젝트를 비교하여, 수신된 제출 컨텐츠 각각을 평가할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)의 프로세서(1100)는 컨텐츠 평가에 대한 정보를 디스플레이 장치(1000)의 출력부(1400)에 출력할 수 있다. 예를 들어, 디스플레이 장치(1000)는 컨텐츠 평가에 대한 정보를 디스플레이부(1410)에 디스플레이할 수 있다.

도 9는 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하는 방법의 순서도이다.

도 9를 참조하면, 본 개시의 일 실시예에 따른 디스플레이 장치(1000)는 시각적인 정보를 전달할 수 있도록 구성된 장치를 의미하며, 디스플레이 장치(1000)는 네트워크(300)로 연결된 외부 장치(200)로 소정의 컨텐츠를 전송하거나, 외부 장치(200)로부터 소정의 컨텐츠를 수신할 수 있다. 디스플레이 장치(1000)는 외부 장치(200)로부터 수신된 소정의 컨텐츠를 평가할 수 있다.

도 9에 도시된 외부 장치의 컨텐츠를 평가하는 시스템은 도 1 내지 도 8을 참조하여 전술한 시스템 및 장치의 아키텍처와 많은 면에서 유사할 수 있으며, 위에 언급되지 않은 추가 기능이 포함될 수 있다. 전술한 시스템 및 장치의 구성 요소에 대한 일부 설명은 생략되거나 간결하게 기재될 수 있다.동작 901에서, 디스플레이 장치(1000)는 디스플레이 장치(1000) 사용자(100)의 음성 입력을 획득할 수 있다.

동작 902에서, 디스플레이 장치(1000)는 사용자 음성 입력 해석 결과에 기초하여 사용자 인텐트를 판단할 수 있다.

동작 903에서, 디스플레이 장치(1000)는 사용자 인텐트에 기초하여 레퍼런스 카테고리를 결정할 수 있다.

도 7을 참조하면, 사용자 인텐트를 결정하기 위한 주요 정보는 ‘가을’, ‘풍경’, ‘그림’, ‘지시’이고, 이 중 ‘가을’, ‘풍경’, 및 ‘그림’에 대응되는 카테고리가 레퍼런스 카테고리로 결정될 수 있다. 이 때, 레퍼런스 카테고리는 소정의 데이터베이스(DB)에 포함되는 데이터들의 분류 카테고리에 따라 달라질 수 있으며, 소정의 데이터베이스(DB)는 디스플레이 장치(1000) 외부에 저장될 수 있다.

도 9를 참조하면, 동작 904에서, 디스플레이 장치(1000)는 DB 데이터 중 레퍼런스 카테고리에 포함되는 데이터를 레퍼런스 데이터로 결정할 수 있다.

도 9를 참조하면, 동작 905에서, 디스플레이 장치(1000)는 외부 장치(200)로부터 제출 컨텐츠를 수신할 수 있다.

외부 장치(200)는 디스플레이 장치(1000) 사용자의 음성 발화에 대응하여 생성된 제출 컨텐츠를 디스플레이 장치(1000)로 전송하고, 디스플레이 장치(1000)는 디스플레이 사용자의 음성 발화에 대응하여 외부 장치에서 생성된 제출 컨텐츠를 수신한다.

도 7을 참조하면, 사용자 인텐트가 ‘가을’ ‘풍경’에 대한 그림인 제출 컨텐츠를 수신하여 채점(평가)하는 것이라면, 제출 컨텐츠(제출 컨텐츠 1 내지 제출 컨텐츠 N)는 적어도 하나의 외부 장치(200-1 내지 200-N) 사용자가 자유롭게 그린 ‘가을 풍경 그림’일 수 있다.

도 9를 참조하면, 동작 906에서, 디스플레이 장치(1000)는 제출 컨텐츠에 포함되는 오브젝트들 중, 레퍼런스 데이터와 비교할 적어도 하나의 타겟 오브젝트를 결정할 수 있다.

도 7의 실시예에서, 사용자 인텐트가 ‘가을’ ‘풍경’에 대한 그림인 제출 컨텐츠를 수신하여 채점(평가)하는 것이라면, 타겟 오브젝트는 제출 컨텐츠(제출 컨텐츠 1 내지 제출 컨텐츠 N)는 적어도 하나의 외부 장치(200-1 내지 200-N) 사용자가 자유롭게 그린 ‘가을 풍경 그림’ 각각에 포함된 오브젝트 중, ‘그림’에 해당하는 오브젝트일 수 있다.

동작 907에서, 디스플레이 장치(1000)는 레퍼런스 데이터와 적어도 하나의 타겟 오브젝트를 비교하여, 수신된 제출 컨텐츠 각각을 평가할 수 있다.

도 10은 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하는 방법의 동작 흐름도이다.

도 10을 참조하면, 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하기 위한 시스템은, 디스플레이 장치(1000), 및 적어도 하나의 외부 장치(200-1 내지 200-N)를 포함할 수 있다.

도 10에 도시된 외부 장치의 컨텐츠를 평가하는 시스템은 도 1 내지 도 9를 참조하여 전술한 시스템 및 장치의 아키텍처와 많은 면에서 유사할 수 있으며, 위에 언급되지 않은 추가 기능이 포함될 수 있다. 전술한 시스템 및 장치의 구성 요소에 대한 일부 설명은 생략되거나 간결하게 기재될 수 있다.

교사(예를 들어, 디스플레이 장치(1000)의 사용자(100))가 적어도 하나의 외부 장치(200-1 내지 200-N)의 화면을 모니터링하거나, 적어도 하나의 외부 장치(200-1 내지 200-N)의 화면을 다른 학생들에게 공유(예를 들어, 디스플레이 장치(1000)의 화면에 디스플레이)하여 수업 자료로 활용하고자 하는 경우를 가정한다.

교사와 학생이 서로 마주보도록 배치된 환경 또는 원격 수업 등으로 서로 다른 공간에 있는 경우, 교사는 학생의 화면을 볼 수 없다. 따라서, 학생이 수업과 관련없는 컨텐츠를 화면에 디스플레이하거나 수업 이외의 다른 목적으로 적어도 하나의 외부 장치(200-1 내지 200-N)를 사용하더라도, 교사는 이를 확인할 수 없다.

또한, 교사가 학생의 화면을 직접 눈으로 볼 수 없는 환경에서, 어떤 학생이 수업과 관련없는 컨텐츠를 화면에 디스플레이하거나 수업 이외의 다른 목적으로 적어도 하나의 외부 장치(200-1 내지 200-N)를 사용하고 있다면 해당 학생의 화면을 공유하는 것은 부적절할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는 사용자가 설정한 소정의 주기마다 또는 사용자의 입력(예를 들어 모니터링 요청 커맨드)가 획득되면, 적어도 하나의 외부 장치(200-1 내지 200-N)로부터 디스플레이되고 있는 컨텐츠를 획득하여, 사용자 인텐트와 관련없는 컨텐츠가 디스플레이되고 있거나 디스플레이되고 있는 컨텐츠의 공유가 부적절한지 여부를 평가할 수 있다.

동작 1001에서, 적어도 하나의 외부 장치(200-1 내지 200-N)는 각각의 컨텐츠(컨텐츠 1 내지 컨텐츠 N)를 디스플레이 한다. 예를 들어, 제1 외부 장치 200-1은 컨텐츠 1을 디스플레이하고, 제N 외부 장치 200-N은 컨텐츠 N을 디스플레이 할 수 있다.

적어도 하나의 외부 장치(200-1 내지 200-N)에 디스플레이되는 컨텐츠(컨텐츠 1 내지 컨텐츠 N)는 적어도 하나의 외부 장치(200-1 내지 200-N) 사용자에 의해 디스플레이된 컨텐츠일 수 있다.

동작 1002에서, 적어도 하나의 외부 장치(200-1 내지 200-N)는 각각의 컨텐츠(컨텐츠 1 내지 컨텐츠 N)를 디스플레이 장치(1000)로 전송하고, 디스플레이 장치는 적어도 하나의 외부 장치(200-1 내지 200-N)로부터 각각의 컨텐츠(컨텐츠 1 내지 컨텐츠 N)를 수신한다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는, 적어도 하나의 외부 장치(200-1 내지 200-N)에 디스플레이되는 컨텐츠를 모니터링하기 위하여 사용자 입력(예를 들어 모니터링 요청 커맨드)에 의해 또는 미리 설정된 소정의 주기마다 적어도 하나의 외부 장치(200-1 내지 200-N)로 디스플레이되는 컨텐츠(컨텐츠 1 내지 컨텐츠 N)를 전송할 것을 요청할 수 있다.

동작 1003에서, 디스플레이 장치(1000)는 컨텐츠1 내지 컨텐츠N 각각에 포함된 오브젝트 세트1 내지 오브젝트 세트N을 획득할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)의 프로세서(1100)는 영상 분석 모듈(1522)을 구동시켜 적어도 하나의 외부 장치로부터 수신된 컨텐츠1 내지 컨텐츠N을 분석하여, 수신된 컨텐츠1 내지 컨텐츠N 각각에 포함되는 오브젝트를 추출할 수 있다.

동작 1004에서, 디스플레이 장치(1000)는 컨텐츠1 내지 컨텐츠N 각각에 포함된 오브젝트 세트1 내지 오브젝트 세트N의 해석 결과에 기초하여 사용자 인텐트를 결정할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)의 프로세서(1100)는 영상 분석 모듈(1522)을 구동시켜 컨텐츠1 내지 컨텐츠N 각각에 포함된 오브젝트 세트1 내지 오브젝트 세트N에 대한 적어도 하나의 카테고리를 결정할 수 있다. 적어도 하나의 카테고리는 서로 계층 관계(hierarchical relationship)를 가질 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는, 오브젝트 세트1 내지 오브젝트 세트N에 대한 적어도 하나의 카테고리를 결정하기 위하여, 디스플레이 장치(1000)에 디스플레이되는 컨텐츠에 포함되는 오브젝트 세트를 더 이용할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는, 오브젝트 세트1 내지 오브젝트 세트N에 대한 적어도 하나의 카테고리를 결정하기 위하여, 적어도 하나의 외부 장치 각각(200-1 내지 200-N)에 대한 가중치를 결정하고, 오브젝트 세트1 내지 오브젝트 세트N에 가중치를 적용할 수 있다.

사용자 인텐트는 영상 분석 결과 획득된 오브젝트의 카테고리에 기초하여 결정되는 정보로서, 디스플레이 장치(1000)의 사용자(100)가 디스플레이 장치(1000)를 이용하는 목적 또는 적어도 하나의 외부 장치의 사용자에게 전달하려고 하는 내용이나 주제를 나타낼 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는, 사용자의 음성 입력을 모니터링할 수 있으며, 사용자 인텐트는 사용자의 음성 입력 해석 결과에 더 기초하여 결정될 수 있다.

동작 1005에서, 디스플레이 장치(1000)는 사용자 인텐트에 기초하여 컨텐츠 1 내지 컨텐츠 N를 평가할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는 오브젝트 세트1 내지 오브젝트 세트N 각각이 사용자 인텐트에 기초하여 결정된 오브젝트 세트1 내지 오브젝트 세트N에 대한 적어도 하나의 카테고리에 포함되는지 여부를 판단하고, 판단 결과에 기초하여 컨텐츠1 내지 컨텐츠N 각각을 평가할 수 있다.

도 11을 참조하면, 디스플레이 장치(1000)는, 적어도 하나의 외부 장치(200-1 내지 200-N)로부터 컨텐츠(500-1 내지 500-N)를 수신할 수 있다.

예를 들어, 디스플레이 장치(1000)의 사용자인 교사가 소정의 주기로 적어도 하나의 외부 장치(200-1 내지 200-N)에 디스플레이 되고 있는 컨텐츠를 전송할 것을 설정하거나, 특정 시점에 적어도 하나의 외부 장치(200-1 내지 200-N)에 디스플레이 되고 있는 컨텐츠를 전송할 것을 요청하는 사용자 입력이 수신되면, 디스플레이 장치(1000)는 적어도 하나의 외부 장치(200-1 내지 200-N)에 현재 디스플레이되고 있는 컨텐츠(컨텐츠 1 내지 컨텐츠 N)를 전송할 것을 요청할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)의 사용자인 교사가 소정의 주기로 적어도 하나의 외부 장치(200-1 내지 200-N)에 디스플레이 되고 있는 컨텐츠를 전송할 것을 설정한 경우, 적어도 하나의 외부 장치(200-1 내지 200-N)는 디스플레이 장치(1000)와 초기 연결시 획득한 주기마다, 디스플레이 장치(1000)의 요청 없이도 컨텐츠를 전송할 수 있다.

디스플레이 장치(1000)는, 적어도 하나의 외부 장치(200-1 내지 200-N)로부터 수신된 컨텐츠 1 내지 컨텐츠 N을 분석하여, 각 컨텐츠에 포함된 오브젝트를 추출한다.

도 11을 참조하면, 제1 외부 장치에 디스플레이되고 있는 컨텐츠 1은 {Zn(문자), 스포이드(이미지), 비이커(이미지)}에 해당하는 제1 오브젝트 세트를 포함한다. 제2 외부 장치에 디스플레이되고 있는 컨텐츠 2는 {원자력(문자), 원자력(이미지), 비이커(이미지)}에 해당하는 제2 오브젝트 세트를 포함한다. 제N 외부 장치에 디스플레이되고 있는 컨텐츠 N은 {CO2(문자), 행성(문자), 태양(이미지), 지구(이미지)}를 포함하는 제N 오브젝트 세트를 포함한다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는 제1 오브젝트 세트 내지 제N 오브젝트 세트에 포함되는 오브젝트들에 기초하여 사용자 인텐트를 결정할 수 있다.

도 11을 참조하면, 컨텐츠 1 내지 컨텐츠 N에 포함되는 오브젝트들은 {Zn(문자), 스포이드(이미지), 비이커(이미지), 원자력(문자), 원자력(이미지), 비이커(이미지), … , CO2(문자), 행성(문자), 태양(이미지), 및 지구(이미지)}이며, 이와 같은 오브젝트들의 분석 결과와 대응되는 카테고리는 다음과 같이 결정될 수 있다.

컨텐츠 No.	오브젝트	제1 카테고리 (대분류)	제2 카테고리 (중분류)	점수
컨텐츠 1	Zn(문자)	과학	화학	30
	스포이드(이미지)	과학	화학
	비이커(이미지)	과학	화학
컨텐츠 2	원자력(문자)	과학	물리학/화학	26
	원자력(이미지)	과학	물리학/화학
	비이커(이미지)	과학	화학
컨텐츠 N	CO2(문자)	과학	화학	19
	행성(문자)	과학	지구과학
	태양(이미지)	과학	지구과학
	지구(이미지)	과학	지구과학

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는 컨텐츠 1 내지 컨텐츠 N과 관련된 사용자 인텐트에 대응되는 제1 카테고리(대분류)를 ‘과학’으로, 제2 카테고리(중분류)를 ‘화학’으로 결정할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는, 컨텐츠 1 내지 컨텐츠 N과 관련된 사용자 인텐트에 기초하여, 컨텐츠 1 내지 컨텐츠 N을 평가할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는, 컨텐츠 1 내지 컨텐츠 N과 관련된 사용자 인텐트에 기초하여, 컨텐츠 1 내지 컨텐츠 N에 대한 점수를 결정할 수 있다.

예를 들어, 제1 카테고리에 대한 점수를 16점, 제2 카테고리에 대한 점수를 12점으로 배점하는 경우, 컨텐츠 1은 제1 카테고리 점수 18점과 제2 카테고리 점수 12점을 얻을 수 있으므로 30점을 획득한다. 컨텐츠 2는 제1 카테고리 점수 18점과 제2 카테고리 점수 8점을 얻을 수 있으므로 26점을 획득하고, 컨텐츠 N은 제1 카테고리 점수 16점과 제2 카테고리 점수 3점을 얻을 수 있으므로 19점을 획득한다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는 컨텐츠 1 내지 컨텐츠 N 각각에 적용할 가중치를 결정하고, 컨텐츠 1 내지 컨텐츠 N 각각에 대응하는 가중치를 적용하여, 컨텐츠 1 내지 컨텐츠 N을 평가할 수 있다.

예를 들어, 디스플레이 장치(1000)는 적어도 하나의 외부 장치(200-1 내지 200-N)의 이전 점수 이력에 기초하여, 이전 점수가 높은 경우 대응되는 컨텐츠에 더 높은 가중치를 부여하도록 결정할 수 있다.

예를 들어, 디스플레이 장치(1000)는 디스플레이 장치(1000) 사용자의 입력에 기초하여, 적어도 하나의 외부 장치(200-1 내지 200-N) 각각에 적용되는 가중치를 결정할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는 디스플레이 장치(1000)의 디스플레이부(1410)에 디스플레이 되고 있는 컨텐츠에 더 기초하여 사용자 인텐트를 결정할 수 있다.

이러한 경우, 디스플레이 장치(1000)는 디스플레이 장치(1000)는 디스플레이 장치(1000)의 디스플레이부(1410)에 디스플레이 되고 있는 컨텐츠에 가장 높은 가중치를 부여하도록 결정할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는, 컨텐츠 1 내지 컨텐츠 N에 대한 평가 결과를 적어도 하나의 외부 장치(200-1 내지 200-N)로 전달할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는, 컨텐츠 1 내지 컨텐츠 N에 대한 점수가 소정의 임계치 이하인 경우 컨텐츠 1 내지 컨텐츠 N에 대한 평가 결과를 적어도 하나의 외부 장치(200-1 내지 200-N)로 전달할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는, 컨텐츠 1 내지 컨텐츠 N에 대한 평가 결과를 디스플레이 장치(1000)의 디스플레이부(1410)에 디스플레이할 수 있다.

본 개시의 일 실시예에 따르면, 디스플레이 장치(1000)는, 컨텐츠 1 내지 컨텐츠 N에 대한 점수가 소정의 임계치 이하인 경우 컨텐츠 1 내지 컨텐츠 N에 대한 평가 결과를 디스플레이 장치(1000)의 디스플레이부(1410)에 디스플레이할 수 있다.

도 11을 참조하면, 컨텐츠 1은 30점 컨텐츠 2는 26점, 컨텐츠 N은 19점을 획득하고 임계 점수가 20점인 경우, 디스플레이 장치(1000)는 제N 외부 장치로 컨텐츠 평가 결과에 대한 정보를 전송할 수 있다. 컨텐츠 평가 결과에 대한 정보를 획득한 제N 외부 장치는 제N 외부 장치의 사용자에게 다른 컨텐츠를 소비하도록 유도하기 위하여 컨텐츠 평가 결과를 제공할 수 있다.

또는, 디스플레이 장치(1000)는 디스플레이 장치(1000)의 디스플레이부(1410)에 컨텐츠 1 내지 컨텐츠 N의 평가 결과에 대한 정보를 표시하거나, 임계 점수 이하인 컨텐츠 N에 대한 평가 결과를 표시할 수 있다.

도 12는 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하는 방법의 순서도이다.

도 12를 참조하면, 본 개시의 일 실시예에 따른 디스플레이 장치(1000)는 시각적인 정보를 전달할 수 있도록 동작하도록 구성된 장치를 의미하며, 디스플레이 장치(1000)는 네트워크(300)로 연결된 외부 장치(200)로 소정의 컨텐츠를 전송하거나, 외부 장치(200)로부터 소정의 컨텐츠를 수신할 수 있다. 디스플레이 장치(1000)는 외부 장치(200)로부터 수신된 소정의 컨텐츠를 평가할 수 있다.

도 12에 도시된 외부 장치의 컨텐츠를 평가하는 시스템은 도 1 내지 도 11을 참조하여 전술한 시스템 및 장치의 아키텍처와 많은 면에서 유사할 수 있으며, 위에 언급되지 않은 추가 기능이 포함될 수 있다. 전술한 시스템 및 장치의 구성 요소에 대한 일부 설명은 생략되거나 간결하게 기재될 수 있다.동작 1201에서, 디스플레이 장치(1000)는 디스플레이 장치와 연결된 복수의 외부 장치로부터 수신된 복수의 컨텐츠 각각에 포함된 오브젝트 세트를 획득할 수 있다.

적어도 하나의 외부 장치(200-1 내지 200-N)는 디스플레이 하고 있는 각각의 컨텐츠(컨텐츠 1 내지 컨텐츠 N)를 디스플레이 장치(1000)로 전송하고, 디스플레이 장치는 적어도 하나의 외부 장치(200-1 내지 200-N)로부터 각각의 컨텐츠(컨텐츠 1 내지 컨텐츠 N)를 수신할 수 있다. 디스플레이 장치(1000)는 수신된 컨텐츠1 내지 컨텐츠N 각각에 포함된 오브젝트 세트1 내지 오브젝트 세트N을 획득할 수 있다.

동작 1202에서, 디스플레이 장치(1000)는 복수의 오브젝트 세트(오브젝트 세트 1 내지 오브젝트 세트 N)의 해석 결과에 기초하여 사용자 인텐트를 결정할 수 있다.

동작 1203에서, 디스플레이 장치(1000)는 사용자 인텐트에 기초하여 복수의 컨텐츠(컨텐츠 1 내지 컨텐츠 N) 각각을 평가할 수 있다.

도 13은 본 개시의 일 실시예에 따른 디스플레이 장치가 외부 장치의 컨텐츠를 평가하는 방법의 순서도이다.

도 13에서 단계 1301 내지 단계 1303은 도 12의 단계 1201 내지 단계 1203과 각각 동일하므로, 설명을 생략한다.

도 13을 참조하면, 디스플레이 장치(1000)는 적어도 하나의 외부 장치의 컨텐츠 평가 결과에 기초하여, 공유 여부를 결정할 수 있다.

동작 1301에서, 디스플레이 장치(1000)는 디스플레이 장치와 연결된 복수의 외부 장치로부터 수신된 복수의 컨텐츠 각각에 포함된 오브젝트 세트를 획득할 수 있다.

동작 1302에서, 디스플레이 장치(1000)는 복수의 오브젝트 세트(오브젝트 세트 1 내지 오브젝트 세트 N)의 해석 결과에 기초하여 사용자 인텐트를 결정할 수 있다.

동작 1303에서, 디스플레이 장치(1000)는 사용자 인텐트에 기초하여 복수의 컨텐츠(컨텐츠 1 내지 컨텐츠 N) 각각을 평가할 수 있다.

동작 1304에서, 디스플레이 장치(1000)는 복수의 컨텐츠(컨텐츠 1 내지 컨텐츠 N) 각각에 대한 평가 결과에 기초하여, 디스플레이 여부를 판단할 수 있다.

예를 들어, 교사가 적어도 하나의 외부 장치(200-1 내지 200-N)의 화면을 다른 학생들에게 공유(예를 들어, 디스플레이 장치(1000)의 화면에 디스플레이)하여 수업 자료로 활용하고자 의도할 수 있다. (즉, 교사(예를 들어, 디스플레이 장치(1000)의 사용자(100)가 디스플레이 장치(1000)의 출력부(1400)에 적어도 하나의 외부 장치(200-1 내지 200-N) 화면의 컨텐츠를 표시하고자 의도할 수 있다.)

그러한 경우, 교사와 학생이 서로 마주보도록 배치된 환경 또는 원격 수업 등으로 서로 다른 공간에 있는 경우, 교사가 학생의 화면을 직접 눈으로 볼 수 없는 환경이다. 따라서, 어떤 학생이 수업과 관련없는 컨텐츠를 화면에 디스플레이하거나 수업 이외의 다른 목적으로 적어도 하나의 외부 장치(200-1 내지 200-N)를 사용하고 있다면 해당 학생의 화면은 공유가 부적절하다.

따라서, 디스플레이 장치(1000)는 복수의 컨텐츠(컨텐츠 1 내지 컨텐츠 N) 각각에 대한 평가 결과에 기초하여, 복수의 컨텐츠(컨텐츠 1 내지 컨텐츠 N) 각각에 대한 평가 결과가 나쁘면(예를 들어, 획득한 점수가 소정의 임계값 이하인 경우) 해당 컨텐츠는 디스플레이부(1410)에 디스플레이하지 않는 것으로 결정할 수 있다.

본 개시의 청구항 또는 명세서에 기재된 실시예들에 따른 방법들은 하드웨어, 소프트웨어, 또는 하드웨어와 소프트웨어의 조합의 형태로 구현될(implemented) 수 있다.

소프트웨어로 구현하는 경우, 하나 이상의 프로그램(소프트웨어 모듈)을 저장하는 컴퓨터 판독 가능 저장 매체 또는 컴퓨터 프로그램 제품이 제공될 수 있다. 컴퓨터 판독 가능 저장 매체 또는 컴퓨터 프로그램 제품에 저장되는 하나 이상의 프로그램은, 전자장치(device) 내의 하나 이상의 프로세서에 의해 실행 가능하도록 구성된다(configured for execution). 하나 이상의 프로그램은, 전자장치로 하여금 본 개시의 청구항 또는 명세서에 기재된 실시 예들에 따른 방법들을 실행하게 하는 명령어(instructions)를 포함한다.

이러한 프로그램(소프트웨어 모듈, 소프트웨어)은 랜덤 액세스 메모리 (random access memory), 플래시(flash) 메모리를 포함하는 불휘발성(non-volatile) 메모리, 롬(ROM: Read Only Memory), 전기적 삭제가능 프로그램가능 롬(EEPROM: Electrically Erasable Programmable Read Only Memory), 자기 디스크 저장 장치(magnetic disc storage device), 컴팩트 디스크 롬(CD-ROM: Compact Disc-ROM), 디지털 다목적 디스크(DVDs: Digital Versatile Discs) 또는 다른 형태의 광학 저장 장치, 마그네틱 카세트(magnetic cassette)에 저장될 수 있다. 또는, 이들의 일부 또는 전부의 조합으로 구성된 메모리에 저장될 수 있다. 또한, 각각의 구성 메모리는 다수 개 포함될 수도 있다.

또한, 프로그램은 인터넷(Internet), 인트라넷(Intranet), LAN(Local Area Network), WLAN(Wide LAN), 또는 SAN(Storage Area Network)과 같은 통신 네트워크, 또는 이들의 조합으로 구성된 통신 네트워크를 통하여 접근(access)할 수 있는 부착 가능한(attachable) 저장 장치(storage device)에 저장될 수 있다. 이러한 저장 장치는 외부 포트를 통하여 본 개시의 실시예를 수행하는 장치에 접속할 수 있다. 또한, 통신 네트워크 상의 별도의 저장 장치가 본 개시의 실시예를 수행하는 장치에 접속할 수도 있다.

본 개시에서, 용어 "컴퓨터 프로그램 제품(computer program product)" 또는 "컴퓨터로 읽을 수 있는 기록매체(computer readable medium)"는 메모리, 하드 디스크 드라이브에 설치된 하드 디스크, 및 신호 등의 매체를 전체적으로 지칭하기 위해 사용된다. 이들 "컴퓨터 프로그램 제품" 또는 "컴퓨터로 읽을 수 있는 기록매체"는 본 개시에 따른 컨텐츠를 분석하고 평가하기 위한 명령어로 구성된 소프트웨어를 디스플레이 장치에 제공하는 수단이다.

기기로 읽을 수 있는 저장매체는, 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서, ‘비일시적 저장매체'는 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다. 예로, '비일시적 저장매체'는 데이터가 임시적으로 저장되는 버퍼를 포함할 수 있다.

일 실시예에 따르면, 본 문서에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두개의 사용자 장치들(예: 스마트폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품(예: 다운로더블 앱(downloadable app))의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.

상술한 본 개시의 구체적인 실시예들에서, 본 개시에 포함되는 구성 요소는 제시된 구체적인 실시예에 따라 단수 또는 복수로 표현되었다. 그러나, 단수 또는 복수의 표현은 설명의 편의를 위해 제시한 상황에 적합하게 선택된 것으로서, 본 개시가 단수 또는 복수의 구성 요소에 제한되는 것은 아니며, 복수로 표현된 구성 요소라 하더라도 단수로 구성되거나, 단수로 표현된 구성 요소라 하더라도 복수로 구성될 수 있다.

본 명세서에 개시된 모든 특징(첨부된 청구범위, 요약 및 도면 포함) 및/또는 그렇게 개시된 방법 또는 프로세스의 모든 단계는 그러한 특징 중 적어도 일부가 및/또는 단계는 상호 배타적이다. 다시 말해서, 본 명세서에 개시된 실시예의 조합이 예상되고 따라서 본 개시의 범위 내에 포함된다.

충돌 또는 불일치가 발생하지 않는 한(예를 들어, 작업(또는 그 수행)이 다른 작업의 결과/결과에 의존하는 경우, 그 연산은 다른 연산 이후에 수행) 본 개시의 실시예에 따른 동작들 중 하나 이상은 위에서 설명된 것과 다른 순서로 수행될 수 있다. 예를 들어, 도 3, 5, 6, 8, 9, 10, 12 및/또는 13의 작업 중 하나 이상은 순서를 변경하여 충돌이나 불일치가 발생하지 않는 한 표시된 순서와 다른 순서로 수행될 수 있다.

한편 본 개시의 상세한 설명에서는 구체적인 실시 예에 관해 설명하였으나, 본 개시의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 개시의 범위는 설명된 실시 예에 국한되어 정해져서는 아니 되며 후술하는 특허청구의 범위 뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.

본 개시의 일 실시예에서, 사용자의 음성 입력 대신에, 다른 유형의 입력이 획득될 수 있다. 예를 들어, 사용자의 텍스트 입력 또는 제스처 입력은 디스플레이 장치(1000)에 의해 획득될 수 있다. 획득된 입력은 해석(또는 파싱 또는 인식 등)될 수 있고, 해석 결과에 기초하여 인텐트가 판단될 수 있다. 예를 들어, 획득한 텍스트 입력을 해석하고 그 결과에 따라 인텐트를 결정할 수 있다.

본 개시의 일 실시예에서, 레퍼런스 데이터가 결정될 수 있다. 예를 들어, 디스플레이 장치(1000)는 사용자의 인텐트 및/또는 레퍼런스 카테고리에 기초하여 레퍼런스 데이터를 결정할 수 있다.

본 개시의 일 실시예에서, 제출 컨텐츠는 제출 컨텐츠를 생성하는 외부 장치 이외의 서버 또는 장치로부터 획득하거나 또는 획득될 수 있다. 예를 들어, 제출 컨텐츠를 생성한 외부 장치는 제출 컨텐츠를 서버 또는 외부 저장소로 전송할 수 있고, 디스플레이 장치(1000)는 서버 또는 외부 저장소로부터 제출 컨텐츠를 획득할 수 있다.

본 발명의 일 실시예에서, 제출 컨텐츠에 포함된 적어도 하나의 오브젝트 중 적어도 하나의 타겟 오브젝트가 식별될 수 있다. 예를 들어, 디스플레이 장치(1000)는 제출 컨텐츠에 포함된 오브젝트들 중 타겟 오브젝트를 식별하고, 식별된 타겟 오브젝트를 레퍼런스 데이터와 비교할 수 있다.

본 개시의 일 실시예에서, 제출 컨텐츠는 레퍼런스 데이터 및/또는 적어도 하나의 타겟 오브젝트에 기초하여 평가될 수 있다. 예를 들어, 디스플레이 장치(1000)는 레퍼런스 데이터 및 적어도 하나의 타겟 오브젝트에 기초하여 제출 컨텐츠를 평가할 수 있다. 다른 예에서, 평가는 적어도 하나의 타겟 오브젝트를 레퍼런스 데이터와 비교하는 것을 포함할 수 있다.

본 개시의 일 실시예에서, 디스플레이 장치(1000)의 방법에 대응하는 방법을 수행하도록 구성된 외부 장치가 제공된다. 본 개시의 다른 실시예는 이러한 외부 장치의 방법을 제공한다.

본 개시의 하나 이상의 실시예는 다음 단락 중 하나 이상에 따를 수 있다는 것이 이해될 것이다:

본 발명의 제1 실시 예에 따른 장치의 컨텐츠 분석 방법은, 사용자의 입력을 획득하는 단계; 획득된 입력에 기초하여 사용자의 인텐트를 결정하는 단계; 사용자의 인텐트에 따라 레퍼런스 데이터를 얻는 단계; 제출 컨텐츠 획득; 및 적어도 하나의 타겟 오브젝트를 레퍼런스 데이터와 비교하는 단계를 포함한다. 예를 들어, 획득된 입력에 기초하여 사용자의 인텐트를 결정하는 것은 사용자의 입력을 해석한 결과에 기초하여 사용자의 인텐트를 결정하는 것을 포함할 수 있다.

본 개시의 제2 실시예에 따르면, 제1 실시예의 방법이 제공되고, 레퍼런스 데이터를 획득하는 단계는, 장치에 표시된 레퍼런스 컨텐츠에 포함된 오브젝트들 중 적어도 하나의 정답 오브젝트를 사용자의 인텐트에 기초하여 결정하는 단계; 및 정답 적어도 하나의 오브젝트를 레퍼런스 데이터로 결정하는 단계를 포함한다.

본 개시의 제3 실시예에 따르면, 제2 실시예의 방법이 제공되며, 제출 컨텐츠는 장치에 의한 공유에 응답하여 획득되는 레퍼런스 컨텐츠에 외부 장치의 사용자의 입력을 추가함으로써 획득된 컨텐츠를 포함하고, 적어도 하나의 타겟 오브젝트는 외부 장치의 사용자의 입력에 대응하는 것으로 결정된다.

본 개시의 제4 실시예에 따르면, 제1 실시예 내지 제3 실시예 중 어느 하나의 방법이 제공되고, 레퍼런스 데이터를 획득하는 단계는: 사용자의 인텐트에 기초하여 적어도 하나의 레퍼런스 카테고리를 결정하는 단계; 및 데이터베이스에 저장된 데이터 중 적어도 하나의 레퍼런스 카테고리에 포함된 데이터를 레퍼런스 데이터로 결정하는 단계를 포함한다.

본 개시의 제5 실시예에 따르면, 제1 실시예 내지 제4 실시예 중 어느 하나의 방법이 제공되고, 사용자의 입력을 획득하는 단계는: 복수의 사용자 중에서 장치의 사용자의 음성을 인식하는 단계; 장치에 입력된 음성 입력, 사용자에 의해 입력된 적어도 하나의 텍스트를 인식하는 단계; 또는 사용자에 의해 입력된 적어도 하나의 제스처를 인식하는 단계;를 포함한다.

본 개시의 제6 실시예에 따르면, 제1 실시예 내지 제5 실시예 중 어느 하나의 방법이 제공되고, 여기서 사용자의 인텐트는 입력의 의도, 지시의 존재 여부, 유형, 및 지시의 내용과 주제 중 적어도 하나를 포함한다.

본 개시의 제7 실시예에 따르면, 제1 실시예 내지 제6 실시예 중 어느 하나의 방법이 제공되고, 방법은 비교 결과에 기초하여 제출 컨텐츠를 평가하는 단계; 및 선택적으로, 평가 결과에 대한 정보를 장치 또는 외부 장치 중 적어도 하나에 전송하는 단계를 더 포함한다.

본 개시의 제8 실시예에 따르면, 제7 실시예의 방법이 제공되고, 제출 컨텐츠를 평가하는 단계는 적어도 하나의 타겟 오브젝트를 레퍼런스 데이터와 비교한 결과에 대한 점수를 획득하는 단계를 포함하고, 방법은: 점수가 특정 임계값 이하인 경우, 비교 결과에 대한 정보를 장치 또는 외부 장치 중 적어도 하나로 전송하는 단계를 더 포함한다.

본 개시의 제9 실시예에 따르면, 장치는: 디스플레이; 입력을 획득하도록 구성된 입력 모듈; 제출 컨텐츠를 획득하도록 구성된 통신 모듈; 적어도 하나의 명령어를 포함하는 프로그램을 저장하도록 구성된 저장부; 및 저장부에 저장된 적어도 하나의 명령어를 실행하도록 구성된 적어도 하나의 프로세서를 포함하고, 적어도 하나의 프로세서는, 적어도 하나의 명령어를 실행하도록 구성되어, 사용자의 입력에 기초하여 사용자의 인텐트를 결정하고; 사용자의 인텐트에 따라 레퍼런스 데이터를 획득하고; 적어도 하나의 타겟 오브젝트를 레퍼런스 데이터와 비교한다. 예를 들어, 사용자의 입력에 기초하여 사용자의 인텐트를 판단하는 것은 사용자의 입력을 해석한 결과에 기반하여 사용자의 인텐트를 판단하는 것을 포함할 수 있다.

본 개시의 제10 실시예에 따르면, 제9 실시예의 장치가 제공되며, 적어도 하나의 프로세서는 장치에 디스플레이된 레퍼런스 컨텐츠에 포함된 오브젝트들 중 적어도 하나의 정답 오브젝트를 결정하고 적어도 하나의 정답 오브젝트를 결정하도록 구성된다.

본 발명의 제11 실시예에 따르면, 제10 실시예의 장치가 제공되며, 제출 컨텐츠는 장치에 의한 공유에 응답하여 획득되는, 레퍼런스 컨텐츠에 외부 장치의 사용자 입력을 추가하여 획득한 컨텐츠를 포함하며, 적어도 하나의 타겟 오브젝트는 외부 장치의 사용자의 입력에 대응하는 것으로 결정된다.

본 발명의 제12 실시예에 따르면, 제9 내지 제11 실시예 중 어느 하나의 장치가 제공되며, 적어도 하나의 프로세서는 사용자의 인텐트에 기초하여 적어도 하나의 레퍼런스 카테고리를 결정하고, 데이터베이스에 저장된 데이터 중 적어도 하나의 레퍼런스 카테고리에 포함된 데이터를 레퍼런스 데이터로 결정하도록 구성된다.

본 발명의 제13 실시 예에 따른 장치의 컨텐츠 분석 방법은, 복수의 외부 장치로부터 수신한 복수의 컨텐츠에 포함된 복수의 오브젝트 세트를 획득하는 단계; 복수의 오브젝트 세트 중 적어도 하나에 기초하여 장치의 사용자의 인텐트를 결정하는 단계; 및 사용자의 인텐트에 기초하여 복수의 컨텐츠 중 적어도 하나를 평가하는 단계를 포함한다. 예를 들어, 복수의 오브젝트 세트 중 적어도 하나에 기초하여 사용자의 인텐트를 결정하는 것은 복수의 오브젝트 세트를 해석한 결과에 기초하여 장치의 사용자의 인텐트를 결정하는 것을 포함할 수 있다. 예를 들어, 사용자의 인텐트에 기초하여 복수의 컨텐츠 중 적어도 하나를 평가하는 것은 사용자의 인텐트에 기초하여 복수의 컨텐츠를 평가하는 것을 포함할 수 있다.

본 개시의 제14 실시예에 따르면, 제13 실시예의 방법이 제공되고, 방법은 사용자의 인텐트를 결정하는 단계는 복수의 오브젝트 세트를 해석한 결과에 기초하여 적어도 하나의 카테고리를 결정하는 단계를 포함하고, 복수의 컨텐츠 각각을 평가하는 단계는 복수의 오브젝트 세트 각각이 적어도 하나의 카테고리에 속하는지 여부를 식별하는 단계를 포함한다.

본 개시의 제15 실시예에 따르면, 제14 실시예의 방법이 제공되고, 방법은 장치 상에 디스플레이된 컨텐츠에 포함된 오브젝트 세트를 획득하는 단계를 더 포함하고, 사용자의 인텐트를 결정하는 단계는 장치에 포함된 복수의 오브젝트 세트들 및 오브젝트 세트에 기초하여 적어도 하나의 카테고리를 결정하는 단계를 포함한다.

본 개시의 제16 실시예에 따르면, 제13 실시예 내지 제15 실시예 중 어느 하나의 방법이 제공되고, 방법은 사용자의 입력을 획득하는 단계를 더 포함하고, 사용자의 인텐트를 결정하는 단계는 획득한 입력의 해석 결과에 기 초하여 사용자의 인텐트를 결정하는 단계를 포함한다. 예를 들어, 입력은 음성 입력, 텍스트 입력, 제스처 입력 등이 될 수 있다.

본 개시의 제17 실시예에 따르면, 제13 실시예 내지 제16 실시예 중 어느 하나의 방법이 제공되고, 사용자의 인텐트를 결정하는 단계는: 복수의 외부 장치 각각에 대한 복수의 가중치를 식별하는 단계; 및 상기 복수의 외부 장치 각각에 적용된 복수의 가중치를 갖는 복수의 오브젝트 세트에 기초하여 사용자의 인텐트를 결정하는 단계를 포함한다.

본 개시의 제18 실시예에 따르면, 제13 실시예 내지 제17 실시예 중 어느 하나의 방법이 제공되고, 방법은 평가 결과에 대한 정보를 장치 및/또는 복수의 외부 장치 중 하나 이상에 전송하는 단계를 더 포함한다.

본 개시의 제19 실시예에 따르면, 제13 실시예 내지 제18 실시예 중 어느 하나의 방법이 제공되고, 복수의 컨텐츠 각각을 평가하는 단계는 적어도 하나의 카테고리에 기초하여 복수의 컨텐츠 각각에 대한 점수를 획득하는 단계를 포함하고, 방법은, 복수의 컨텐츠 중 특정 임계값 이하의 점수를 갖는 컨텐츠에 대한 평가 결과를 해당 컨텐츠에 대응하는 장치 또는 외부 장치 중 적어도 하나에 전송하는 단계를 더 포함한다.

본 개시의 제20 실시예에 따르면, 장치는 디스플레이; 복수의 외부 장치로부터 복수의 컨텐츠를 수신하는 통신 모듈; 적어도 하나의 명령어를 포함하는 프로그램을 저장하도록 구성된 저장부; 및 저장부에 저장된 적어도 하나의 명령어를 실행하도록 구성된 적어도 하나의 프로세서를 포함하고, 적어도 하나의 프로세서는 저장부에 저장된 적어도 하나의 명령어를 실행하여, 복수의 컨텐츠에 포함된 복수의 오브젝트 세트를 획득하고, 복수의 오브젝트 세트 중 적어도 하나에 기초하여 장치의 사용자의 인텐트를 평가하고, 사용자의 인텐트에 기초하여 복수의 컨텐츠 중 적어도 하나를 평가한다. 예를 들어, 복수의 오브젝트 세트 중 적어도 하나에 기초하여 사용자의 인텐트를 결정하는 것은 복수의 오브젝트 세트를 해석한 결과에 기초하여 장치의 사용자의 인텐트를 결정하는 것을 포함할 수 있다. 예를 들어, 사용자의 인텐트에 기초하여 복수의 컨텐츠 중 적어도 하나를 평가하는 것은 사용자의 인텐트에 기초하여 복수의 컨텐츠를 평가하는 것을 포함할 수 있다.

본 개시의 제21 실시예에 따르면, 제20 실시예의 장치가 제공되고, 적어도 하나의 프로세서는 복수의 오브젝트 세트를 해석한 결과에 기초하여 적어도 하나의 카테고리를 결정하고, 각각이 복수의 오브젝트 세트는 적어도 하나의 카테고리에 속한다.

본 개시의 제22 실시예에 따르면, 제21 실시예의 장치가 제공되고, 적어도 하나의 프로세서는 장치에 디스플레이된 컨텐츠에 포함된 오브젝트 세트를 획득하고, 오브젝트 세트에 기초하여 장치에 포함된 복수의 오브젝트 세트 및 오브젝트 세트에 대해 적어도 하나의 카테고리를 결정하도록 구성된다(예를 들어, 사용자의 인텐트를 결정하기 위해).

본 개시의 제23 실시예에 따르면, 제20 실시예 내지 제22 실시예 중 어느 하나의 장치가 제공되고, 적어도 하나의 프로세서가 획득된 입력을 해석한 결과에 더 기초하여 사용자의 인텐트를 결정하기 위하여, 장치는 사용자의 입력을 획득하도록 구성된 입력 모듈을 더 포함하도록 구성된다. 예를 들어, 입력은 음성 입력(예를 들어, 입력 모듈은 수신기를 포함할 수 있음), 또는 텍스트 입력, 또는 제스처 입력 등일 수 있다.

본 개시의 제24 실시예에 따르면, 제20 내지 제23 실시예 중 어느 하나의 장치가 제공되고, 적어도 하나의 프로세서는 복수의 외부 장치 각각에 대한 복수의 가중치를 식별하고 복수의 외부 장치 각각에 복수의 가중치가 적용된 복수의 오브젝트 세트에 기초한 사용자의 인텐트를 결정하도록 구성된다.

본 개시의 제25 실시예에 따르면, 제20 내지 제24 실시예 중 어느 하나의 장치가 제공되며, 적어도 하나의 프로세서는 통신 모듈을 통해 평가 결과에 관한 정보를 장치 또는 복수의 외부 장치에 전송하도록 구성된다.

본 개시의 제26 실시예에 따르면, 제20 실시예 내지 제25 실시예 중 어느 하나의 장치가 제공되고, 여기서 적어도 하나의 프로세서는 (예를 들어, 복수의 컨텐츠 각각을 평가하기 위해) 적어도 하나의 카테고리에 기초하여 복수의 컨텐츠 각각에 대한 점수를 획득하고, 복수의 컨텐츠 중 소정 임계값 이하의 점수를 갖는 컨텐츠에 대한 평가 결과를 소정 임계값 이하의 점수를 갖는 컨텐츠에 대응하는 장치 또는 외부 장치 중 적어도 하나로 전송하도록 구성된다.

본 발명의 제28 실시예에 따르면, 컴퓨터가 제1 실시예 또는 제13 실시예의 방법을 실행하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체가 제공된다.

Claims

디스플레이 장치가, 컨텐츠를 분석하고 평가하는 방법에 있어서,

상기 디스플레이 장치 사용자의 음성 입력을 획득하는 단계;

상기 획득된 음성 입력을 해석한 제1 결과에 기초하여 사용자 인텐트를 결정하는 단계;

상기 사용자 인텐트에 기초하여, 레퍼런스 데이터를 획득하는 단계;

상기 디스플레이 장치와 연결된 외부 장치로부터 제출 컨텐츠를 획득하는 단계;

상기 제출 컨텐츠에 포함된 오브젝트 중에서, 상기 레퍼런스 데이터와 비교될 적어도 하나의 타겟 오브젝트를 결정하는 단계; 및

상기 적어도 하나의 타겟 오브젝트와 상기 레퍼런스 데이터를 비교함으로써, 상기 제출 컨텐츠를 평가하는 단계;를 포함하는, 방법.
제1 항에 있어서, 상기 레퍼런스 데이터를 획득하는 단계는,

상기 사용자 인텐트에 기초하여, 상기 디스플레이 장치에 디스플레이되는 레퍼런스 컨텐츠에 포함된 오브젝트 중에서, 적어도 하나의 정답 오브젝트를 결정하는 단계; 및

상기 적어도 하나의 정답 오브젝트를 상기 레퍼런스 데이터로 결정하는 단계;를 포함하는, 방법.
제2 항에 있어서,

상기 제출 컨텐츠는, 상기 디스플레이 장치가 상기 외부 장치로 상기 레퍼런스 컨텐츠를 공유한 것에 대한 응답으로 획득되는, 상기 레퍼런스 컨텐츠에 상기 외부 장치 사용자의 입력이 추가된 컨텐츠이고,

상기 적어도 하나의 타겟 오브젝트는, 상기 외부 장치 사용자의 입력에 대응하여 결정되는, 방법.
제1 항에 있어서,

상기 레퍼런스 데이터를 획득하는 단계는,

상기 사용자 인텐트에 기초하여, 적어도 하나의 레퍼런스 카테고리를 결정하는 단계; 및

데이터 베이스에 저장된 데이터 중 상기 적어도 하나의 레퍼런스 카테고리에 포함되는 데이터를 상기 레퍼런스 데이터로 결정하는 단계;를 포함하는, 방법.
제1 항에 있어서,

상기 사용자의 음성 입력을 획득하는 단계는, 상기 디스플레이 장치에 입력되는 복수의 사용자 음성 입력 중에서, 상기 디스플레이 장치 사용자의 음성을 인식하는 단계;를 포함하는, 방법.
제1 항에 있어서,

상기 사용자 인텐트는, 상기 음성 입력의 의도, 상기 지시의 여부, 상기 지시의 종류 및 컨텐츠의 주제 중 적어도 하나를 포함하는, 방법.
제1 항에 있어서,

상기 방법은, 상기 제출 컨텐츠를 평가한 제2 결과에 대한 정보를 상기 디스플레이 장치 또는 상기 외부 장치 중 적어도 하나로 전달하는 단계;를 더 포함하는, 방법.
제1 항에 있어서,

상기 제출 컨텐츠를 평가하는 단계는, 상기 적어도 하나의 타겟 오브젝트와 상기 레퍼런스 데이터를 비교한 제3 결과에 대한 점수를 획득하는 단계;를 포함하고,

상기 방법은, 상기 점수가 소정의 임계값 이하인 경우 상기 제3 결과를 나타내는 정보를, 상기 디스플레이 장치 또는 상기 외부장치 중 적어도 하나로 전달하는 단계;를 더 포함하는, 방법.
디스플레이 장치에 있어서,

디스플레이;

사용자의 음성 입력을 획득하는 음성 수신부;

상기 디스플레이 장치와 연결된 외부 장치로부터 제출 컨텐츠를 획득하는 통신부,

적어도 하나의 명령어(instruction)를 포함하는 프로그램을 저장하는 저장부; 및

상기 저장부에 저장된 적어도 하나의 명령어를 실행하는 적어도 하나의 프로세서를 포함하고,

상기 적어도 하나의 프로세서는 상기 적어도 하나의 명령어를 실행함으로써,

상기 음성 수신부를 통해 획득된 상기 디스플레이 장치 사용자의 음성 입력을 해석한 제1 결과에 기초하여 사용자 인텐트를 판단하고,

상기 사용자 인텐트에 기초하여, 레퍼런스 데이터를 획득하고,

상기 제출 컨텐츠에 포함된 오브젝트 중에서, 상기 레퍼런스 데이터와 비교될 적어도 하나의 타겟 오브젝트를 결정하고,

상기 적어도 하나의 타겟 오브젝트와 상기 레퍼런스 데이터를 비교함으로써, 상기 제출 컨텐츠를 평가하는, 장치.
제9 항에 있어서,

상기 적어도 하나의 프로세서는, 상기 사용자 인텐트에 기초하여, 상기 디스플레이 장치에 디스플레이되는 레퍼런스 컨텐츠에 포함된 오브젝트 중에서, 적어도 하나의 정답 오브젝트를 결정하고, 상기 적어도 하나의 정답 오브젝트를 상기 레퍼런스 데이터로 결정하는, 장치.
제10 항에 있어서,

상기 제출 컨텐츠는, 상기 디스플레이 장치가 상기 외부 장치로 상기 레퍼런스 컨텐츠를 공유한 것에 대한 응답으로 획득되는, 상기 레퍼런스 컨텐츠에 상기 외부 장치 사용자의 입력이 추가된 컨텐츠이고,

상기 적어도 하나의 타겟 오브젝트는, 상기 외부 장치 사용자의 입력에 대응하여 결정되는, 장치.
제9 항에 있어서,

상기 프로세서는, 상기 사용자 인텐트에 기초하여, 적어도 하나의 레퍼런스 카테고리를 결정하고, 데이터 베이스에 저장된 데이터 중 상기 적어도 하나의 레퍼런스 카테고리에 포함되는 데이터를 상기 레퍼런스 데이터로 결정하는, 장치
제9 항에 있어서, 상기 적어도 하나의 프로세서는,상기 디스플레이 장치에 입력되는 복수의 사용자 음성 입력 중에서, 상기 디스플레이 장치 사용자의 음성을 인식하고, 상기 인식된 디스플레이 장치 사용자의 음성 입력을 획득하는, 장치.
제9 항에 있어서,

상기 사용자 인텐트는, 상기 음성 입력의 의도, 상기 지시의 여부, 상기 지시의 종류 및 컨텐츠의 주제 중 적어도 하나를 포함하는, 장치.
제1 항의 방법을 컴퓨터에서 수행하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체.