KR20200135431A - 처리 장치, 처리 방법, 데이터 처리 장치, 데이터 처리 시스템, 데이터 처리 방법 및 프로그램 - Google Patents

처리 장치, 처리 방법, 데이터 처리 장치, 데이터 처리 시스템, 데이터 처리 방법 및 프로그램 Download PDF

Info

Publication number
KR20200135431A
KR20200135431A KR1020207030046A KR20207030046A KR20200135431A KR 20200135431 A KR20200135431 A KR 20200135431A KR 1020207030046 A KR1020207030046 A KR 1020207030046A KR 20207030046 A KR20207030046 A KR 20207030046A KR 20200135431 A KR20200135431 A KR 20200135431A
Authority
KR
South Korea
Prior art keywords
timing
unit
blinking
user
data
Prior art date
Application number
KR1020207030046A
Other languages
English (en)
Other versions
KR102516751B1 (ko
Inventor
타마미 나카노
Original Assignee
재팬 사이언스 앤드 테크놀로지 에이전시
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2018055034A external-priority patent/JP7023504B2/ja
Priority claimed from JP2018055033A external-priority patent/JP7185892B2/ja
Application filed by 재팬 사이언스 앤드 테크놀로지 에이전시 filed Critical 재팬 사이언스 앤드 테크놀로지 에이전시
Publication of KR20200135431A publication Critical patent/KR20200135431A/ko
Application granted granted Critical
Publication of KR102516751B1 publication Critical patent/KR102516751B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/013Eye tracking input arrangements
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/103Detecting, measuring or recording devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
    • A61B5/11Measuring movement of the entire body or parts thereof, e.g. head or hand tremor, mobility of a limb
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/103Detecting, measuring or recording devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
    • A61B5/11Measuring movement of the entire body or parts thereof, e.g. head or hand tremor, mobility of a limb
    • A61B5/1103Detecting eye twinkling
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/16Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/16Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
    • A61B5/163Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state by tracking eye movement, gaze, or pupil change
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/30Scenes; Scene-specific elements in albums, collections or shared content, e.g. social network photos or video
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44218Detecting physical presence or behaviour of the user, e.g. using sensors to detect if the user is leaving the room or changes his face expression during a TV program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Social Psychology (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Surgery (AREA)
  • Molecular Biology (AREA)
  • Veterinary Medicine (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Psychiatry (AREA)
  • Ophthalmology & Optometry (AREA)
  • Databases & Information Systems (AREA)
  • Physiology (AREA)
  • Dentistry (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Signal Processing (AREA)
  • Child & Adolescent Psychology (AREA)
  • Developmental Disabilities (AREA)
  • Educational Technology (AREA)
  • Hospice & Palliative Care (AREA)
  • Psychology (AREA)
  • Image Analysis (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

제어 장치는, 대화 장치의 눈 깜박임 동작의 타이밍을 취득하는 제 1 취득부와, 상기 대화 장치의 사용자의 눈 깜박임 타이밍을 취득하는 제 2 취득부와, 상기 눈 깜박임 동작의 타이밍과 상기 사용자의 눈 깜박임 타이밍의 차이에 따른 처리를 행하는 처리부를 갖는다. 상기 처리부는 상기 사용자의 눈 깜박임 타이밍이, 상기 눈 깜박임 동작의 타이밍보다 이후의 소정 기간 내에 포함되는 정도에 따른 처리를 행해도 된다.

Description

처리 장치, 처리 방법, 데이터 처리 장치, 데이터 처리 시스템, 데이터 처리 방법 및 프로그램
본 발명은 사람의 눈 깜박임 동작을 이용하는 기술에 관한 것이다.
사람은 생활하는 데 있어서 눈 깜박임 동작을 행한다. 현재, 이 눈 깜박임 동작에 대한 해명(解明)이 진행되고 있으며, 비특허 문헌 1은 비디오를 관찰하고 있을 때 복수의 피험자의 눈 깜박임이 동기되고, 환경 비디오나 음성에서는 복수의 피험자의 눈 깜박임이 동기되지 않는다는 것을 개시하고 있다.
비특허 문헌 1 : Tamami Nakano, Yoshiharu Yamamoto, Keiichi Kitajo, Toshimitsu Takahashi and Shigeru Kitazawa, "Synchronization of spontaneous eyeblinks while viewing video stories", Proceedings of the Royal Society B: Biological Sciences, 276(1673), p 3635 - 3644, [online], [2018년 3월 12일 검색], 인터넷 <URL:http://rspb.royalsocietypublishing.org/content/royprsb/early /2009/07/24/rspb. 2009.0828.full.pdf>, (2009년)
한편, 눈 깜박임 현상의 응용은 현재 검토 단계이며, 아직 실용화에는 이르지 않았다.
따라서, 본 발명은 눈 깜박임 동작을 이용한 응용 기술을 제공하는 것을 목적 중 하나로 한다.
본 발명의 일 실시예는 대화 장치의 눈 깜박임 동작의 타이밍을 취득하는 제 1 취득부와, 상기 대화 장치의 사용자의 눈 깜박임 타이밍을 취득하는 제 2 취득부와, 상기 눈 깜박임 동작의 타이밍과 상기 사용자의 눈 깜박임 타이밍의 차이에 따른 처리를 행하는 처리부를 가진 처리 장치를 제공한다.
상기 처리 장치에 있어서, 상기 처리부는 상기 차이에 기초한 지표값에 따른 처리를 행해도 된다.
상기 처리 장치에 있어서, 상기 처리부는 상기 사용자의 눈 깜박임 타이밍이 상기 눈 깜박임 동작의 타이밍에 따른 소정 기간 내에 포함되는 정도에 따른 처리를 행해도 된다.
상기 처리 장치에 있어서, 상기 소정 기간은 상기 눈 깜박임 동작의 타이밍부터 500밀리초 이하의 시점을 포함해도 된다.
상기 처리 장치에 있어서, 상기 처리부는, 상기 사용자의 눈 깜박임 타이밍 및 상기 눈 깜박임 동작의 타이밍을 소정의 시간축 상에 시각순으로 나열한 제 1 데이터에 있어서의 상기 정도와, 상기 사용자의 눈 깜박임 타이밍 및 상기 눈 깜박임 동작의 타이밍 중 적어도 하나의 순서를 변경한 제 2 데이터에 있어서의 상기 정도에 따라, 상기 처리를 행해도 된다.
상기 처리 장치에 있어서, 상기 처리부는 상기 대화 장치에게 상기 차이에 따른 대화 처리를 행하게 해도 된다.
상기 처리 장치에 있어서, 상기 처리부는 상기 대화 장치의 식별자와 대응지어서, 상기 차이에 따른 평가 데이터를 출력해도 된다.
상기 처리 장치에 있어서, 상기 대화 장치의 주변의 환경을 나타내는 환경 정보를 취득하는 환경 정보 취득부와, 상기 환경 정보에 따른 제 1 타이밍에 상기 대화 장치에 눈 깜박임 동작을 행하게 하는 눈 깜박임 동작 제어부를 가져도 된다.
상기 처리 장치에 있어서, 상기 사용자가 눈 깜박임을 하는 타이밍과 상기 환경과 대응지어진 데이터를 기억 장치에 축적시키는 기억 제어부를 갖고, 상기 눈 깜박임 동작 제어부는 상기 제 1 타이밍을 상기 기억 장치에 축적된 데이터와 상기 환경 정보에 따른 타이밍으로 해도 된다.
상기 처리 장치에 있어서, 상기 눈 깜박임 동작 제어부는 또한 상기 제 1 타이밍과는 다른 제 2 타이밍에 상기 대화 장치에 눈 깜박임 동작을 행하게 해도 된다.
상기 처리 장치에 있어서, 눈의 눈꺼풀에 상당하는 눈꺼풀부와, 상기 눈꺼풀부를 개폐시킴으로써 상기 눈꺼풀부의 눈 깜박임 동작을 제어하는 눈 깜박임 동작 제어부를 갖고, 상기 제 1 취득부는 상기 눈꺼풀부의 눈 깜박임 동작의 타이밍을 취득해도 된다.
상기 처리 장치에 있어서, 표시부와, 상기 표시부에 표시된 오브젝트의 눈 깜박임 동작을 제어하는 눈 깜박임 동작 제어부를 갖고, 상기 제 1 취득부는 상기 오브젝트의 눈 깜박임 동작의 타이밍을 취득해도 된다.
본 발명의 일 실시예는 대화 장치의 눈 깜박임 동작의 타이밍 및 상기 대화 장치의 사용자의 눈 깜박임 타이밍을 취득하고, 상기 눈 깜박임 동작의 타이밍과 상기 사용자의 눈 깜박임 타이밍과의 차이에 따른 처리를 행하는 처리 방법을 제공한다.
본 발명의 일 실시예는, 컴퓨터에게 대화 장치의 눈 깜박임 동작의 타이밍 및 상기 대화 장치의 사용자의 눈 깜박임 타이밍을 취득하고, 상기 눈 깜박임 동작의 타이밍과 상기 사용자의 눈 깜박임 타이밍의 차이에 따른 처리를 행하는 기능을 실현하게 하기 위한 프로그램을 제공한다.
본 발명의 일 실시예는 사용자의 눈 깜박임 타이밍을 나타내는 데이터를 취득하는 취득부와, 복수의 사용자의 상기 눈 깜박임 타이밍의 차이에 기초하여 상기 복수의 사용자의 눈 깜박임 타이밍의 일치 정도에 따른 지표를 산출하는 산출부와, 상기 지표에 따른 데이터를 출력하는 출력부를 구비하는 데이터 처리 장치를 제공한다.
본 발명의 일 실시예는 사용자의 눈 깜박임을 검출하는 눈 깜박임 검출부와, 상기 데이터 처리 장치를 갖고, 상기 취득부는 상기 눈 깜박임 검출부의 검출 결과에 따라 상기 눈 깜박임 타이밍을 나타내는 데이터를 취득하는 데이터 처리 시스템을 제공한다.
본 발명의 일 실시예는, 사용자의 눈 깜박임 타이밍을 나타내는 데이터를 취득하고, 복수의 사용자의 상기 눈 깜박임 타이밍의 차이에 기초하여 상기 복수의 사용자의 눈 깜박임 타이밍의 일치 정도에 따른 지표를 산출하는 데이터 처리 방법을 제공한다.
본 발명의 일 실시예는 사용자의 눈 깜박임 타이밍을 나타내는 데이터를 취득하고, 복수의 사용자의 상기 눈 깜박임 타이밍의 차이에 기초하여 상기 복수의 사용자의 눈 깜박임 타이밍의 일치 정도에 따른 지표를 산출하는 처리를 실행하게 하기 위한 프로그램을 컴퓨터에 제공한다.
본 발명의 일 실시예에 따르면, 눈 깜박임 동작을 이용한 응용 기술을 제공할 수가 있다.
도 1은 본 발명의 제 1 실시예인 대화 장치의 외관 구성의 일 예를 나타내는 도면이다.
도 2는 본 발명의 제 1 실시예인 대화 장치가 행하는 눈 깜박임 동작을 설명하는 도면이다.
도 3은 본 발명의 제 1 실시예인 대화 장치의 하드웨어 구성을 나타내는 블록도이다.
도 4는 본 발명의 제 1 실시예인 대화 장치의 기능 구성을 나타내는 블록도이다.
도 5는 본 발명의 제 1 실시예의 대화 장치가 실행하는 처리를 나타내는 흐름도이다.
도 6은 본 발명의 제 1 실시예의 지표 산출 처리를 나타내는 흐름도이다.
도 7은 본 발명의 제 1 실시예의 타이밍 차이의 산출 방법을 설명하는 도면이다.
도 8은 본 발명의 제 1 실시예의 타이밍 차이의 출현 빈도의 분포를 나타내는 그래프를 나타낸다.
도 9는 본 발명의 제 1 실시예의 랜덤 데이터의 일 예를 나타내는 도면이다.
도 10은 본 발명의 제 1 실시예의 평가값의 일 예를 나타내는 도면이다.
도 11은 본 발명의 제 1 실시예의 검증과 관련된 청자(聽者)의 눈 깜박임 빈도의 분포를 나타내는 그래프이다.
도 12는 본 발명의 제 1 실시예의 검증과 관련된 회답 결과별로 청자의 눈 깜박임의 빈도의 분포를 나타내는 그래프이다.
도 13은 본 발명의 제 1 실시예의 검증과 관련된 평가값을, 성별 및 상품별로 나타낸 그래프이다.
도 14는 본 발명의 제 1 실시예의 검증과 관련된 상품에 대한 관심도를, 성별 및 상품별로 나타낸 그래프이다.
도 15은 본 발명의 제 2 실시예인 대화 장치의 기능 구성을 나타내는 블록도이다.
도 16은 본 발명의 제 2 실시예의 대화 장치가 실행하는 학습 처리를 나타내는 흐름도이다.
도 17은 본 발명의 제 2 실시예의 대화 장치가 실행하는 눈 깜박임 동작에 관한 처리를 나타내는 흐름도이다.
도 18은 본 발명의 제 3 실시예인 대화 장치의 하드웨어 구성을 나타내는 블록도이다.
도 19는 본 발명의 제 3 실시예인 대화 장치의 기능 구성을 나타내는 블록도이다.
도 20은 본 발명의 제 3 실시예인 대화 장치가 실행하는 처리를 나타내는 흐름도이다.
도 21은 본 발명의 일 실시예의 처리 장치의 기능 구성을 나타내는 블록도이다.
도 22는 본 발명의 제 4 실시예인 데이터 처리 시스템의 전체 구성을 나타내는 블록도이다.
도 23은 본 발명의 제 4 실시예의 서버 장치의 하드웨어 구성을 나타내는 블록도이다.
도 24는 본 발명의 제 4 실시예의 단말 장치의 하드웨어 구성을 나타내는 블록도이다.
도 25는 본 발명의 제 4 실시예의 데이터 처리 시스템의 기능 구성을 나타내는 블록도이다.
도 26은 본 발명의 제 4 실시예의 데이터 처리 시스템이 실행하는 처리를 나타내는 흐름도이다.
도 27은 본 발명의 제 4 실시예의 지표 산출 처리를 나타내는 흐름도이다.
도 28은 본 발명의 제 4 실시예의 눈 깜박임 타이밍의 차이의 산출 방법을 설명하는 도면이다.
도 29는 본 발명의 제 4 실시예의 타이밍 차이의 출현 빈도의 분포를 나타내는 그래프를 나타낸다.
도 30은 본 발명의 제 4 실시예의 랜덤 데이터의 일 예를 나타내는 도면이다.
도 31은 본 발명의 제 4 실시예의 평가값의 일 예를 나타내는 도면이다.
도 32는 본 발명의 제 4 실시예의 단계 S17에서 출력되는 데이터의 일 예를 나타내는 도면이다.
도 33은 본 발명의 제 4 실시예의 검증과 관련된 피험자의 눈 깜박임의 빈도의 분포를 나타내는 그래프이다.
도 34는 본 발명의 제 4 실시예의 검증과 관련된 피험자의 1분마다의 눈 깜박임 횟수의 시간적 변화를 나타내는 그래프이다.
도 35는 본 발명의 제 4 실시예의 검증과 관련된 동영상을 본 이후의 앙케이트 결과와 눈 깜박임 횟수의 관계를 나타내는 그래프이다.
도 36은 본 발명의 제 4 실시예의 검증과 관련된 평가값의 산출 결과를 나타내는 그래프이다.
도 37은 본 발명의 제 4 실시예의 검증과 관련된 관심이 있는 대상이 다른 피험자별로 각 동영상을 보았을 때의 평가값을 산출한 결과를 나타내는 그래프이다.
도 38은 본 발명의 제 4 실시예의 검증과 관련된 모든 피험자에 대해서, 각 동영상을 본 이후의 앙케이트 결과와 평가값의 관계를 나타낸 그래프이다.
도 39는 본 발명의 제 4 실시예의 검증과 관련된 동영상을 본 이후의 감상과 평가값의 관계를 나타내는 그래프이다.
도 40은 본 발명의 제 4 실시예의 변형예의 단계 S17에서 출력되는 데이터의 일 예를 나타내는 도면이다.
도 41은 본 발명의 제 5 실시예인 데이터 처리 시스템의 전체 구성을 나타내는 블록도이다.
도 42는 본 발명의 제 5 실시예의 데이터 처리 시스템의 기능 구성을 나타내는 블록도이다.
도 43은 본 발명의 제 5 실시예의 데이터 처리 시스템에서 실행되는 처리를 나타내는 흐름도이다.
도 44는 본 발명의 제 5 실시예의 검증에 관한 영상 강의에서의 평가값을 산출한 그래프이다.
도 45는 본 발명의 제 5 실시예의 검증에 관한 출제되는 문제와 눈 깜박임 타이밍의 관계를 나타내는 그래프이다.
도 46은 본 발명의 제 5 실시예의 문제의 정답율이나 이해도와 평가값의 관계를 나타내는 그래프이다.
도 47은 본 발명의 제 5 실시예의 문제의 정답율과 평가값의 관계를 나타내는 그래프이다.
도 48은 본 발명의 제 6 실시예의 데이터 처리 시스템의 기능 구성을 나타내는 블록도이다.
도 49는 본 발명의 제 6 실시예의 데이터 처리 시스템이 실행하는 처리를 나타내는 흐름도이다.
도 50은 본 발명의 제 7 실시예인 데이터 처리 시스템의 전체 구성을 나타내는 블록도이다.
도 51은 본 발명의 제 7 실시예의 단말 장치의 하드웨어 구성을 나타내는 블록도이다.
도 52는 본 발명의 제 7 실시예의 데이터 처리 시스템의 기능 구성을 나타내는 블록도이다.
도 53은 본 발명의 제 7 실시예의 데이터 처리 시스템에서 실행되는 처리를 나타내는 흐름도이다.
도 54는 본 발명의 제 7 실시예의 데이터 처리 시스템에서 실행되는 처리를 설명하는 도면이다.
도 55는 본 발명의 제 7 실시예의 데이터 처리 시스템에서 실행되는 처리를 설명하는 도면이다.
도 56은 본 발명의 제 7 실시예의 변형예의 단계 S48에서 출력되는 데이터의 일 예를 나타내는 도면이다.
도 57은 본 발명의 일 변형예와 관련된 촬상부를 정면에서 본 모식도이다.
도 58은 본 발명의 일 변형예와 관련된 단말 장치의 하드웨어 구성을 나타내는 블록도이다.
도 59는 본 발명의 일 변형예와 관련된 데이터 처리 시스템의 기능 구성을 나타내는 블록도이다.
도 60은 본 발명의 일 변형예와 관련된 데이터 처리 시스템에서 실행되는 처리를 나타내는 흐름도이다.
도 61은 본 개시와 관련된 데이터 처리 장치의 기능 구성을 나타내는 블록도이다.
이하, 본 발명의 일 실시예에 대해서 도면을 참조하면서 상세하게 설명한다. 이하에 나타내는 실시예는 본 발명의 실시예의 일 예로, 본 발명은 이들 실시예로 한정되는 것은 아니다. 한편, 본 실시예에서 참조하는 도면에서, 동일 부분 또는 동일한 기능을 갖는 부분에는 동일한 부호 또는 유사한 부호(숫자의 뒤에 A, B 등만을 붙인 부호)를 붙이고, 그 반복 설명은 생략하는 경우가 있다.
[제 1 실시예]
사람과 대화 장치와의 의사(疑似)적인 커뮤니케이션(이하, 간단히 '커뮤니케이션'이라고 한다)을 실현하는 기술이 종래부터 제안되어 있다. 일본 특허 공표 제 2010-525848호 공보는 대화형의 완구를 개시하고 있다. 또한, 눈의 눈 깜박임을 모방한 동작을 행하는 대화 장치가 제안되어 있다. 일본 특허 제5639440호는 CG 캐릭터의 눈을 사전 설정된 눈 깜박임의 간격에 따라 개폐하는 것을 개시하고 있다. 특허 공개 제 2000-349920호 공보는 머리의 끄덕거림 동작 타이밍을 기점으로 해서 경시적으로 지수 분포시킨 타이밍에 눈 깜박임 동작을 행하는 로봇을 개시하고 있다. 한편, 화자 및 청자의 눈 깜박임에 관해서, 본건의 발명자들에 의해, 논문 1 및 논문 2에 이하의 사항이 개시되고 있다.
(논문 1) Tamami Nakano and Shigeru Kitazawa, "Eyeblink entrainment at breakpoints of speech", Experimental Brain Research, 205(4), p. 577-81, [online], [2018년 3월 12일 검색], 인터넷
<URL:https://www.ncbi.nlm.nih.gov/pubmed/20700731>, (2010년)
(논문 2) Kyohei Tatsukawa, Tamami Nakano, Hiroshi Ishiguro and Yuichiro Yoshikawa, "Eyeblink Synchrony in Multimodal Human-Android Interaction", Scientific Reports, 6: 39718, [online], [2018년 3월 12일 검색], 인터넷 <URL:https://www.nature.com/articles/srep39718>, (2016년)
논문 1은 화자와 청자의 눈 깜박임이 시간 지연으로 동기되는 것을 개시하고 있다. 또한, 논문 1은 화자의 눈 깜박임은 이야기가 끝나는 시점 또는 발화 사이에 증가시키는 것을 개시하고 있다. 논문 2는 로봇인 화자와 인간인 청자의 사이에 눈 깜박임이 시간 지연으로 동기되는 것을 개시하고 있다.
이 때, 사용자와 대화 장치 사이의 커뮤니케이션과는 관계없이, 대화 장치가 눈 깜박임 동작을 해도 커뮤니케이션의 질 향상에 기여하는 것이 어려운 경우가 있다.
제 1 내지 제 3 실시예에서는 눈 깜박임 동작을 이용해서 대화 장치와 사용자의 커뮤니케이션을 지원하는 예에 대해서 설명한다.
본 발명자는 화자 및 청자의 눈 깜박임 타이밍의 차이를, 해당 화자 및 청자가 실시하는 커뮤니케이션의 질의 평가에 이용할 수 있다고 하는 지견을 얻었다. 예를 들어, 화자 및 청자의 눈 깜박임 타이밍의 일치 정도가 높은 경우, 청자는 화자의 발화에 대해서 높은 관심을 나타내고 있다고 추측할 수가 있다. 반대로, 그 일치 정도가 낮은 경우, 청자는 화자의 발화에 대해서 그다지 관심을 나타내지 않는다고 추측할 수가 있다. 이러한 지견을 얻기에 이른 검증에 대해서는 후술한다. 이하, 대화 장치와 그 사용자의 커뮤니케이션을 실현하는 기술에, 이러한 지견을 적용한 경우의 실시예를 설명한다.
도 1은 본 발명의 제 1 실시예인 대화 장치(10)의 외관 구성의 일 예를 나타내는 도면이다. 대화 장치(10)는 사용자(U)와 대화하는 처리 장치이다. 사용자(U)는 대화 장치(10)의 사용자이다. 사용자(U)는 대화 장치(10)와 대면해서 대화 장치(10)와 대화에 의한 커뮤니케이션을 취한다.
대화 장치(10)는 생물을 모방한 외관을 갖는 로봇이다. 대화 장치(10)는 예를 들어, 인간 혹은 그 외의 동물(예를 들어 개 또는 고양이), 또는 가공의 인물(예를 들어, 애니메이션의 등장 인물)을 모방한 외관을 가진다. 대화 장치(10)의 외관은 구애되지 않는다.
대화 장치(10)는 얼굴부(101)과 눈꺼풀부(102)를 갖는다. 얼굴부(101)는 얼굴에 상당하는 부위이고, 눈꺼풀부(102)는 얼굴부(101)에 배치되어 눈의 눈꺼풀에 상당하는 부위이다. 눈꺼풀부(102)는 개폐함으로써 눈의 눈 깜박임을 모방한 동작(이하 '눈 깜박임 동작'이라고 한다)을 한다. 본 실시예에서는 2개의 눈꺼풀부(102)가 같은 동작을 한다.
도 2는 대화 장치(10)의 눈 깜박임 동작을 설명하는 도면이다. 대화 장치(10)는 평상시에 눈꺼풀부(102)를 연 상태로 둔다. 대화 장치(10)는 눈 깜박임 동작을 하는 타이밍에, 눈꺼풀부(102)를 연 상태로부터 닫은 상태로 천이시키고(화살표 A1), 닫은 상태로부터 연 상태로 천이시킨다(화살표 A2). 눈꺼풀부(102)의 연 상태로부터 닫은 상태, 및 닫은 상태로부터 연 상태의 천이 타이밍은 눈꺼풀부(102)가 눈의 눈 깜박임을 모방한 동작을 하도록 사전에 설정되어 있다.
대화 장치(10)는 입, 코 및 그 외의 부위를 얼굴부(101)에 가져도 된다. 대화 장치(10)는 또한 얼굴부(101)에 배치된 이들 각 부위를 동작시켜도 되지만, 본 실시예에서는 설명을 생략한다.
대화 장치(10)의 설치 장소 및 용도는 특별히 구애되지 않는다. 대화 장치(10)는 예를 들어 상업 시설(예를 들어 점포), 공공 시설 또는 그 외의 시설에 설치된다. 이 경우, 사용자(U)는 해당 시설의 이용자이다. 대화 장치(10)는 의료용, 완구 또는 그 외의 용도로 이용되어도 된다.
도 3은 대화 장치(10)의 하드웨어 구성을 나타내는 블록도이다. 대화 장치(10)는 제어부(11)와, 음성 입력부(12)와, 음성 출력부(13)와, 기억부(14)와, 촬상부(15)와, 눈꺼풀부(102)를 갖는다. 제어부(11)는 대화 장치(10)의 각 부를 제어한다. 제어부(11)는 예를 들어, CPU로 예시되는 연산 처리 장치 및 메모리를 포함한다. 메모리는 예를 들어, 연산 처리 장치가 워크 에어리어로서 사용하는 RAM, 및 제어 프로그램을 기억하는 ROM를 포함한다.
음성 입력부(12)는 음성의 입력을 수취한다. 음성 입력부(12)는 입력받은 음성을 음성 신호로 변환해서 제어부(11)에 공급한다. 음성 입력부(12)는 예를 들어, 마이크, A(Analog)/D(Digital) 변환 회로 및 필터를 포함한다.
음성 출력부(13)는 음성을 출력한다. 음성 출력부(13)는 제어부(11)로부터 공급된 음성 신호로부터 변환한 소리를 출력한다. 음성 출력부(13)는 예를 들어, D/A 변환 회로 및 스피커를 포함한다.
기억부(14)는 데이터를 기억한다. 기억부(14)는 예를 들어, 프로그램(141) 및 대화 데이터(142)를 기억한다. 프로그램(141)은 제어부(11)에 소정의 기능을 실현시키기 위한 프로그램이다.
대화 데이터(142)는 대화 장치(10)가 사용자(U)와 대화하기 위한 데이터이다. 대화 데이터(142)는 예를 들어, 입력 데이터와 출력 데이터를 대응지은 데이터를 복수 기억하고 있다. 입력 데이터는 사용자(U)가 발화하면 상정되는 발화의 내용을 문자열로 나타낸 데이터이다. 출력 음성은 해당 발화에 대한 응답의 내용을 문자열로 나타낸 데이터이다. 예를 들어, 입력 데이터가 '이름은?'인 경우, 해당 입력 데이터에 대응지어지는 출력 데이터는 '나의 이름은 XX입니다'('XX'는 대화 장치(10)의 명칭)이다.
대화 데이터(142)는 화제를 식별하는 식별자를, 입력 데이터 및 출력 데이터에 대응지어서 포함해도 된다. 예를 들어, 축구에 관한 발화에 이용되는 입력 데이터 및 출력 데이터에는 제 1 식별자 'ID001'가 대응지어진다. 식사에 관한 발화에 이용되는 입력 데이터 및 출력 데이터에는 제 2 식별자 'ID002'가 대응지어진다.
한편, 대화 데이터(142)는 다른 형식의 데이터여도 된다. 기억부(14)는, 예를 들어, 광학식 기록 매체, 자기 기록 매체 및 반도체 기록 매체로 예시되는 임의의 형식의 기록 매체(기억 장치)를 포함할 수 있다.
촬상부(15)는 피사체를 촬상하고, 촬상한 화상을 나타내는 촬상 데이터를 생성한다. 피사체는 사용자(U)이다. 촬상부(15)는 예를 들어, CCD(Charge Coupled Device) 이미지 센서로 예시되는 촬상 소자, 및 렌즈를 포함한다. 촬상부(15)의 렌즈는 예를 들어, 얼굴부(101)에 있어서의 눈꺼풀부(102) 근방에 마련되지만, 얼굴부(101)에 있어서의 그 외의 위치, 또는 얼굴부(101) 이외의 위치에 마련되어도 된다.
눈꺼풀부(102)는 제어부(11)의 제어에 따라 개폐한다. 눈꺼풀부(102)는 예를 들어, 개폐 기구(예를 들어, 다이어프램 및 실린더) 및 해당 개폐 기구를 구동시키는 구동 회로를 포함한다. 눈 깜박임 동작을 실현하기 위한 기구에 대해서는 여러 가지의 공지 기술을 적용할 수 있다.
도 4는 대화 장치(10)의 기능 구성을 나타내는 블록도이다. 대화 장치(10)의 제어부(11)는 눈 깜박임 동작 제어부(111)와, 제 1 취득부(112)와, 눈 깜박임 검출부(113)와, 제 2 취득부(114)와, 처리부(115)를 포함한다. 제어부(11)는 프로그램(141)을 실행함으로써 눈 깜박임 동작 제어부(111), 제 1 취득부(112), 눈 깜박임 검출부(113), 제 2 취득부(114) 및 처리부(115)에 상당하는 기능을 실현한다. 제어부는 전술한 처리 장치에 상당한다.
눈 깜박임 동작 제어부(111)는 눈꺼풀부(102)를 개폐시킴으로써 대화 장치(10)의 눈 깜박임 동작을 제어한다. 눈 깜박임 동작 제어부(111)는 예를 들어, 눈 깜박임 동작을 하기 위한 눈 깜박임 제어 데이터를 눈꺼풀부(102)에 출력한다. 눈꺼풀부(102)는 눈 깜박임 제어 데이터에 따라 개폐된다. 한편, 눈 깜박임 동작 제어부(111)는 제어부에서 반드시 포함하지 않아도 된다.
제 1 취득부(112)는 대화 장치(10)(눈꺼풀부(102))의 눈 깜박임 동작의 타이밍을 취득한다. 제 1 취득부(112)는 예를 들어, 눈 깜박임 동작 제어부(111)로부터 눈 깜박임 동작의 타이밍을 나타내는 데이터를 취득한다.
눈 깜박임 검출부(113)는 사용자(U)의 눈 깜박임을 검출한다. 구체적으로는 눈 깜박임 검출부(113)는 촬상부(15)에 의해 생성된 촬상 데이터에 기초하여, 사용자(U)의 눈 깜박임을 검출한다. 한편, 눈 깜박임 검출부(113)는 제어부(11)에서 반드시 포함하지 않아도 된다.
제 2 취득부(114)는 사용자(U)의 눈 깜박임 타이밍을 취득한다. 제 2 취득부(114)는 본 실시예에서는 사용자(U)의 눈 깜박임 타이밍을 나타내는 데이터(이하 '눈 깜박임 데이터'라고 한다)를 취득한다. 눈 깜박임 데이터는 눈 깜박임이 검출된 시각을, 이 시각순으로 나열한 데이터(제 1 데이터)이다. 제 2 취득부(114)는 예를 들어, 눈 깜박임 검출부(113)에 의한 눈 깜박임의 검출 결과에 기초하여 눈 깜박임 데이터를 생성한다.
처리부(115)는 대화 장치(10)의 눈 깜박임 동작의 타이밍과 사용자(U)의 눈 깜박임 타이밍의 차이에 따른 처리를 행한다. 처리부(115)는 본 실시예에서는 대화 처리를 행한다. 대화 처리는 대화 데이터(142)를 이용해서 대화하기 위한 처리이다. 구체적으로는, 대화 처리는 음성 입력부(12)를 통해서 입력된 음성을 인식해서 입력 데이터로 변환하는 처리를 포함한다. 또한, 대화 처리는 해당 입력 데이터에 대응된 출력 데이터를 음성으로 변환하고, 음성 입력부(12)를 통해서 출력하는 처리를 포함한다.
다음으로, 대화 장치(10)의 동작을 설명한다. 도 5는 대화 장치(10)가 실행하는 처리를 나타내는 흐름도이다.
처리부(115)는 대화 처리를 개시한다(단계 S1). 대화 처리를 개시하는 계기는 구애되지 않는다. 처리부(115)는 사용자(U)의 존재를 인식한 타이밍이어도 된다. 대화 장치(10)의 사용자는 예를 들어, 촬상 데이터가 나타내는 화상으로부터 인식되는 사람, 또는 촬상부(15)의 촬상 방향에 위치하는 사람, 촬상부(15)의 위치에 따른 위치에 있는 사람이다. 대화 장치(10)의 사용자는 대화 장치(10)에 로그인한 사람이어도 된다. 또한, 처리부(115)는 음성 입력부(12)를 통해서 입력된 음성으로부터 소정의 음성(예를 들어, 인사를 나타내는 음성)을 인식한 경우, 또는 소정의 조작을 수취한 경우에, 대화 처리를 개시해도 된다.
다음으로, 처리부(115)는 촬상부(15)에 촬상을 개시시킨다(단계 S2). 촬상이 개시되면, 대화 장치(10)는 이하에서 설명하는 처리를 행한다.
우선, 눈 깜박임 동작에 관한 처리를 설명한다. 눈 깜박임 동작 제어부(111)는 눈 깜박임 동작을 행할지 여부를 판단한다(단계 S11). 눈 깜박임 동작 제어부(111)는 예를 들어, 대화 장치(10)의 발화 중, 또는 발화가 종료한 타이밍에 눈 깜박임 동작을 한다고 판단한다. 발화가 종료한 타이밍은 예를 들어, 이야기가 중단되는 타이밍이다. 눈 깜박임 동작의 타이밍은 랜덤한 타이밍을 포함해도 된다.
단계 S11에서 '예'라고 판단한 경우에, 눈 깜박임 동작 제어부(111)는 대화 장치(10)에 눈 깜박임 동작을 행하게 한다(단계 S12). 단계 S11에서 '아니오'라고 판단한 경우, 눈 깜박임 동작 제어부(111)는 눈 깜박임 동작을 하지 않는다. 그리고, 대화 장치(10)의 처리는 단계 S3로 넘어간다.
다음으로, 대화 장치(10)와 사용자의 커뮤니케이션의 질의 평가에 관한 처리를 설명한다.
제 1 취득부(112)는 대화 장치(10)의 눈 깜박임 동작의 타이밍을 취득한다(단계 S21). 다음으로, 눈 깜박임 검출부(113)는 촬상부(15)로부터 공급된 촬상 데이터에 기초하여 사용자(U)의 눈 깜박임을 검출한다(단계 S22). 눈 깜박임의 검출 알고리즘은 여러 가지의 공지 기술이 적용되어도 된다. 눈 깜박임 검출부(113)는 예를 들어, 촬상 데이터가 나타내는 화상으로부터, 사용자(U)의 눈의 둘레를 따라서 복수의 특징점을 추출한다. 눈 깜박임 검출부(113)는 예를 들어, Haar-like에 기초하여 특징점을 추출한다. 눈 깜박임 검출부(113)는 복수의 프레임의 촬상 데이터에 기초하여, 추출한 특징점의 이동의 방향 및 그 속도의 시간적인 변화를 특정함으로써 사용자(U)의 눈 깜박임의 유무를 검출한다. 예를 들어 사람의 눈 깜박임에 기인해서 대략 0~300밀리초 사이에 특징점의 급격한 속도의 변화가 발생한다. 그래서, 눈 깜박임 검출부(113)는 소정 기간 내의 속도 변화가 임계값 이상이 된 경우에, 사용자(U)의 눈 깜박임이 있었던 것으로 검출한다.
다음으로, 제 2 취득부(114)는 눈 깜박임의 검출 결과에 기초하여, 사용자(U)의 눈 깜박임 타이밍을 나타내는 눈 깜박임 데이터를 취득한다(단계 S23).
다음으로, 처리부(115)는 지표 산출 처리를 행한다(단계 S24). 지표 산출 처리는 대화 장치(10)와 사용자(U)의 커뮤니케이션의 질의 지표를 산출하는 처리이다.
도 6은 지표 산출 처리를 나타내는 흐름도이다. 이하, 지표 산출 처리를 구체예를 들어서 설명한다.
우선, 처리부(115)는 사용자(U)의 눈 깜박임 타이밍과 대화 장치(10)의 눈 깜박임 동작의 타이밍의 차이를 산출한다(단계 S241). 처리부(115)는 예를 들어, 소정 기간에 있어서의 사용자(U)의 눈 깜박임 타이밍과 눈꺼풀부(102)의 눈 깜박임 동작의 타이밍의 모든 조합에 대해서 차이(이하 '타이밍 차이'라고 함)를 산출한다. 소정 기간은 예를 들어 30초이지만, 30초 미만이어도 되고, 30초보다 길어도 된다. 소정 기간은 예를 들어, 대화 장치(10)의 발화가 종료되는 타이밍부터 소정 시간 전까지 거슬러 올라간 기간 전체 또는 일부의 기간이다.
도 7은 타이밍 차이의 산출 방법을 설명하는 도면이다. 도 7에 나타내는 타이밍 차트는 사용자(U)의 눈 깜박임 타이밍 및 대화 장치(10)가 눈 깜박임 동작을 한 타이밍을 나타낸다. 도 7에 나타낸 바와 같이, 사용자(U)의 눈 깜박임 타이밍을 그 시각순으로 t11, t12, … t1B로 나타낸다. 대화 장치(10)의 눈 깜박임 동작의 타이밍을, 그 시각순으로 t21, t22, … t27로 나타낸다. 이 경우, 처리부(115)는 t11, t12, … t1B 각각에 대해, t21, t22, … t27 각각과의 차이를 산출한다. 눈 깜박임 타이밍 t1i와 눈 깜박임 동작의 타이밍 t2j의 차이인 타이밍 차이를, 이하 'Δtij'라고 나타낸다. 이 경우, 처리부(115)는 타이밍 차이(TD){Δt11, Δt12, … , Δt17, Δt21, Δt22, … , Δt27, … ΔtB1, ΔtB2, … , ΔtB7}를 산출한다.
도 8은 타이밍 차이의 출현 빈도의 분포를 나타내는 그래프(DG)를 나타낸다. 도 8의 그래프(DG)에 있어서, 가로축이 타이밍 차이에 대응하고, 세로축이 각 타이밍 차이의 출현의 정도(즉, 출현 빈도)에 대응한다. 도 8에 나타내는 예에서는, 어느 시간 범위 T내에서 출현 빈도가 높아지고 있다.
그런데, 그래프(DG)에서 나타내어지는 출현 빈도의 분포는, 사용자(U)와 대화 장치(10)의 커뮤니케이션뿐만 아니라, 사용자(U)의 눈 깜박임의 특성(예를 들어, 횟수 및 빈도) 및 대화 장치(10)의 눈 깜박임 동작의 특성(예를 들어, 횟수 및 빈도)에 기인해서 생겼다고 생각된다. 예를 들어, 사용자(U)의 눈 깜박임의 빈도 및 대화 장치(10)의 눈 깜박임 동작의 빈도가 높은 경우일수록, 작은 타이밍 차이의 출현 빈도가 높아지기 쉽다. 이 때문에, 타이밍 차이(TD)가 어느 정도 대화 장치(10)와 사용자(U)의 커뮤니케이션에 기인해서 생겼는지를 분명히 할 필요가 있다. 그래서, 처리부(115)는 써로게이트 데이터법에 기초하여 출현 빈도의 분포를 해석한다.
즉, 처리부(115)는 랜덤 데이터(제 2 데이터)를 생성한다(단계 S242). 랜덤 데이터는 시간축 상에서 대화 장치(10)의 눈 깜박임 동작의 간격의 순서를 랜덤하게 변경한 데이터를 포함한다.
도 9는 랜덤 데이터(R1~RK)의 일 예를 나타내는 도면이다. 처리부(115)는 K가지(예를 들어, 1000가지)의 랜덤 데이터(R1~RK)를 생성한다. 도 9에 나타내는 랜덤 데이터(R1~RK)에서는, 대화 장치(10)의 눈 깜박임 동작의 간격의 순서가 변경되어, 사용자(U)의 눈 깜박임의 간격의 순서는 변경되지 않는다. 한편, 도 7에 나타내는 타이밍 't2j'와, 도 9에 나타내는 타이밍 't2ja'이 대응한다.
다음으로, 처리부(115)는 생성한 랜덤 데이터 각각에 대해서, 사용자(U)의 눈 깜박임 타이밍과 대화 장치(10)의 눈 깜박임 동작의 타이밍의 차이인 타이밍 차이를 산출한다(단계 S243). 타이밍 차이의 산출 방법은 단계 S241와 같아도 된다. 눈 깜박임 타이밍 t1ia과 눈 깜박임 동작의 타이밍 t2ja의 차이인 타이밍 차이를, 이하 'Δtija'라고 나타낸다. 도 9에 나타내는 경우, 처리부(115)는 랜덤 데이터에 기초하여, 타이밍 차이 TR{Δt11a, Δt15a, … , Δt13a, Δt21a, Δt25a, … , Δt23a, … ΔtB1a, ΔtB5a, … , ΔtB3a}를 산출한다. 랜덤 데이터에서의 타이밍 차이의 출현 빈도는 예를 들어, 도 8의 그래프(RG)로 나타난다. 한편, 그래프(RG)는 랜덤 데이터(R1~RK)의 타이밍 차이의 출현 빈도의 평균을 나타낸다.
다음으로, 처리부(115)는 눈 깜박임 데이터에 기초하는 타이밍 차이와 랜덤 데이터에 기초하는 타이밍 차이에 따른 평가값을 산출한다(단계 S244). 평가값은 대화 장치(10)와 사용자(U)의 커뮤니케이션의 질의 지표가 되는 지표값이다. 랜덤 데이터는 대화 장치(10)의 눈 깜박임 동작의 간격을 랜덤하게 변경한 데이터이다. 이 때문에, 랜덤 데이터는 대화 장치(10)의 눈 깜박임 동작의 횟수 및 간격은 유지한 채로, 시계열의 정보가 흩뜨려진 데이터라고 할 수 있다. 따라서, 타이밍 차이(TD)의 분포와 랜덤 데이터(R1~RK)의 분포를 비교함으로써, 사용자(U)의 눈 깜박임 데이터가 나타내는 타이밍 차이의 출현 분포가, 대화 장치(10)와 사용자(U)의 커뮤니케이션에 기인해서 나타난 정도를 파악할 수가 있다.
처리부(115)는 평가값을 Z값에 의해 산출한다. 즉, 처리부(115)는 눈 깜박임 데이터가 나타내는 타이밍 차이(TD){Δt11, Δt12, … , Δt17, Δt21, Δt22, … , Δt27, … ΔtB1, ΔtB2, … , ΔtB7} 각각으로부터 랜덤 데이터(R1~RK)에 있어서의 타이밍 차이의 평균값을 감소시키고, 나아가 획득된 값을 랜덤 데이터(R1~RK)에 있어서의 타이밍 차이의 표준 편차로 나눔으로써 평가값을 산출한다. 예를 들어, 타이밍 차이(TD)의 분포가 랜덤 데이터의 분포와 같은 경우, 평가값은 '0'이다. 이 경우, 사용자(U)의 눈 깜박임이 대화 장치(10)와 사용자(U)의 커뮤니케이션에 기인한 영향을 받고 있지 않다고 추측할 수 있다. 한편, 평가값이 크고, 타이밍 차이(TD)의 분포와 랜덤 데이터의 분포의 차이가 큰 경우에, 사용자(U)의 눈 깜박임이 대화 장치(10)와 사용자(U)의 커뮤니케이션의 영향을 받고 있다고 추측할 수 있다. 도 8을 이용해서 설명하면, 출현 빈도의 차이(Δ)가 큰 경우일수록, 커뮤니케이션의 영향을 보다 강하게 받고 있다고 추측되어, 평가값은 커진다.
도 10은 평가값의 일 예를 나타내는 그래프이다. 도 10에 나타내는 그래프에 있어서, 가로축은 타이밍 차이에 대응하고, 세로축은 평가값에 대응한다. 타이밍 차이가 양의 값인 경우, 사용자(U)의 눈 깜박임 타이밍이 대화 장치(10)의 눈 깜박임 동작의 타이밍보다 늦다는 것을 의미한다. 타이밍 차이가 음의 값인 경우, 사용자(U)의 눈 깜박임 타이밍이 대화 장치(10)의 눈 깜박임 동작의 타이밍보다 빠르다는 것을 의미한다. 또한, 타이밍 차이는 여기에서는 250밀리초씩 나타낸다. 도 10에 있어서, 타이밍 차이 '0'밀리초는 타이밍 차이가 0밀리초 이상 250밀리초 미만인 것을 나타낸다. 타이밍 차이 '+250'밀리초 및 '-250'밀리초는 타이밍 차이가 250초 이상 500밀리초 미만인 것을 나타낸다. 본 실시예에서는 처리부(115)는 사용자(U)의 눈 깜박임 타이밍이 대화 장치(10)의 눈 깜박임 동작의 타이밍 이후의 소정 기간 내에 포함되는 정도에 기초하여, 대화 장치(10)와 사용자(U)의 커뮤니케이션의 질의 평가값을 산출한다. 구체적으로는 처리부(115)는 타이밍 차이 '+250'밀리초에 대응하는 평가값을, 대화 장치(10)와 사용자(U)의 커뮤니케이션의 질의 평가값으로서 산출한다. 즉, 처리부(115)는 사용자(U)의 눈 깜박임 타이밍이, 대화 장치(10)의 눈 깜박임 동작의 타이밍보다 늦고 또한 그 타이밍 차이가 250밀리초 이상 500밀리초 미만인 눈 깜박임의 출현 빈도에 기초하여 평가값을 산출한다. 도 10에 나타내는 예에서는 평가값은 '0.4'이다. 이상이, 지표 산출 처리의 설명이다.
한편, 랜덤 데이터는 대화 장치(10)의 눈 깜박임 동작의 간격의 순서가 변경되지 않고, 사용자(U)의 눈 깜박임의 간격의 순서가 변경된 데이터여도 된다. 또한, 랜덤 데이터는 대화 장치(10)의 눈 깜박임 동작의 간격의 순서, 및 사용자(U)의 눈 깜박임의 간격의 순서가 변경된 데이터여도 된다. 지표 산출 처리가 종료되면, 대화 장치(10)의 처리는 단계 S3로 진행된다.
다음으로, 도 5로 돌아가서 대화 처리에 관한 처리를 설명한다. 처리부(115)는 단계 S24의 지표 산출 처리에서 산출된 평가값이 임계값 이상인지 여부를 판단한다(단계 S31). 평가값은 여기에서는 최근 기간에 대응하는 평가값이다. 임계값은 사용자(U)가 대화 장치(10)와의 대화에 관심이 있는지 여부를 판단할 때의 지표가 되는 값이다. 임계값은 예를 들어 사전 결정된 값이다.
단계 S31에서 '예'라고 판단한 경우, 처리부(115)는 제 1 대화 처리를 행한다(단계 S32). 단계 S32에서 '아니오'라고 판단한 경우, 처리부(115)는 제 1 대화 처리와는 다른 제 2 대화 처리를 행한다(단계 S33). 즉, 처리부(115)는 평가값이 임계값 이상인지 여부에 따라서 다른 대화 처리를 행한다. 평가값이 임계값 이상인 경우, 사용자(U)의 대화 장치(10)와의 커뮤니케이션에 대한 관심 정도가 높다고 추측할 수 있다. 따라서, 처리부(115)는 예를 들어, 현재의 화제를 변경하지 않는 제 1 대화 처리를 행한다. 처리부(115)는 예를 들어, 사용자(U)와 축구에 대해서 대화를 하고 있었던 경우, 축구에 대해서 계속 대화를 한다. 이 때, 처리부(115)는 대화 데이터에 포함되는 식별자 'ID001'에 대응지어진 입력 데이터 및 출력 데이터에 기초하여 제 1 대화 처리를 행한다.
한편, 평가값이 임계값 미만인 경우, 사용자(U)의 대화 장치(10)와의 커뮤니케이션에 대한 관심 정도가 낮다고 추측할 수 있다. 따라서, 처리부(115)는 현재의 화제를 변경한 제 2 대화 처리를 행한다. 처리부(115)는 예를 들어, 사용자(U)와 축구에 대해서 대화를 하고 있던 경우, 오늘의 점심 식사에 대한 대화로 변경한다. 이 때, 처리부(115)는 대화 데이터에 포함되는 식별자 'ID002'에 대응지어진 입력 데이터 및 출력 데이터에 기초하여 제 2 대화 처리를 행한다.
이상과 같이, 처리부(115)는 대화 장치(10)의 눈 깜박임 동작의 타이밍과 사용자(U)의 눈 깜박임 타이밍의 차이에 기초하는 지표값(본 실시예에서는 평가값)에 따른 처리를 행한다. 다만, 전술한 제 1 대화 처리 및 제 2 대화 처리는 일 예로, 여러 가지의 변형이 가능하다. 처리부(115)는 평가값이 임계값 미만이 되면 즉시 대화의 화제를 변경한 제 2 대화 처리를 행하는 것이 아니라, 제 1 대화 처리를 계속해도 된다. 이 경우, 처리부(115)는 평가값이 임계값 미만인 기간이 소정 기간 계속된 경우, 또는 평가값이 임계값 미만이 된 횟수가 소정 횟수 이상이 된 경우에, 제 1 대화 처리로부터 제 2 대화 처리로 변경해도 된다. 그리고, 대화 장치(10)의 처리는 단계 S3로 진행된다.
단계 S3에서, 처리부(115)는 대화 처리를 종료할지 여부를 판단한다. 처리부(115)는 예를 들어, 촬상부(15)로부터 공급된 촬상 데이터에 기초하여, 사용자(U)의 존재를 인식하지 않게 된 경우에는 대화 처리를 종료한다고 판단한다. 처리부(115)는 음성 입력부(12)를 통해서 입력된 음성으로부터 소정의 음성(예를 들어, 작별 인사를 나타내는 음성)을 인식한 경우, 또는 소정의 조작을 수취한 경우에, 대화 처리를 종료한다고 판단해도 된다.
대화 처리를 계속한다고 판단한 경우(단계 S3; 아니오), 대화 장치(10)의 처리는 단계 S11, S21, S31로 돌아간다. 대화 처리를 종료한다고 판단한 경우(단계 S3; 예), 처리부(115)는 대화 처리를 종료한다.
대화 장치(10)에 의하면, 사용자(U)의 눈 깜박임 타이밍과 대화 장치(10)의 눈 깜박임 동작의 타이밍과의 차이에 따라서, 사용자(U)의 대화 장치(10)와의 커뮤니케이션에 대한 관심 정도를 정량적으로 평가할 수 있다. 나아가 대화 장치(10)는 이 평가를 대화 처리에 반영시킴으로써, 대화 장치(10)와 사용자(U)와의 커뮤니케이션을 지원할 수가 있다. 또한, 대화 장치(10)는 사용자(U)의 눈 깜박임이라고 하는 자연스러운 동작에 기초하여 커뮤니케이션의 질을 평가할 수 있다. 따라서, 대화 장치(10)에 의하면 사용자(U)에 평가를 위해서 필요한 동작을 요구하지 않아도 해당 평가를 행할 수 있다.
여기서, 사용자(U)의 눈 깜박임 타이밍과 대화 장치(10)의 눈 깜박임 동작의 타이밍의 차이를 커뮤니케이션의 질의 평가에 이용할 수 있는 근거를 설명한다. 본 발명자들은 이하에서 설명하는 방법으로 화자 및 청자의 눈 깜박임 타이밍 차이가, 화자와 청자의 커뮤니케이션에 대한 관심 정도의 지표가 되는 것을 확인하는 검증을 행했다.
화자는 상품의 시연 판매를 업으로 하는 시연 판매자이다. 시연 판매자는 '여성용 드라이어', '여성용 화장품', '남성용 손목시계' 및 '남성용 전기 면도기'의 4개의 상품에 대해서 각각 상품 소개를 행했다. 각 상품의 소개 시간은 약 3분이다. 청자는 남성이 18명, 여성이 20명의 합계 38명의 대학생이다. 38명의 청자는 화자가 행한 상품 소개 모습을 촬상한 동영상을 시청한 이후에, 각 상품 소개를 재미있게 느꼈는지 여부를 회답했다. 화자와 청자의 눈 깜박임 타이밍 차이에 대해서는 화자 및 청자를 각각 촬상한 동영상으로부터 검출해서, 화자의 눈 깜박임 타이밍의 전후에 있어서의 청자의 눈 깜박임 타이밍을 해석했다.
도 11은 38명의 청자의 눈 깜박임의 빈도의 분포를 나타내는 그래프이다. 도 11에 나타내는 그래프에서 가로축은 시각에 대응하고 세로축은 평가값(Z값)에 대응한다. 시각은 화자의 눈 깜박임 타이밍을 '0'으로 해서, 이보다 빠른 청자의 눈 깜박임 타이밍을 음의 값으로, 이보다 늦은 청자의 눈 깜박임 타이밍을 양의 값으로 나타낸다. 즉, 도 11의 그래프의 가로축은 타이밍 차이를 나타낸다. 도 11에서도, 도 10과 마찬가지로 타이밍 차이를 250초씩 나타낸다. 이 검증에서는, 평가값의 산출에 있어서, 화자의 눈 깜박임의 간격의 순서를 변경하고 청자의 눈 깜박임의 간격의 순서를 변경하지 않는 방법에 의해 랜덤 데이터가 이용되고 있다. 도 11에 나타낸 바와 같이 화자의 눈 깜박임으로부터 +250밀리초 이상 +500밀리초 미만의 시간 범위 내에서 늦게 청자의 눈 깜박임이 증대하여 평가값이 높아졌다. 한편, p값은 0.000001이다.
도 12는 회답 결과마다의 청자의 눈 깜박임의 빈도의 분포를 나타내는 그래프이다. 도 12에 나타내는 그래프에서도 도 11과 마찬가지로, 가로축은 시각에 대응하고 세로축은 평가값에 대응한다. 실선 그래프는 상품 소개를 재미있다고 회답한 청자에 대한 평가값이다. 점선 그래프는 상품 소개를 재미없다고 회답한 청자에 대한 평가값이다.
도 12에 나타낸 바와 같이, 상품 소개를 재미있다고 회답한 청자에 대해서는 화자의 눈 깜박임으로부터 +250밀리초 이상 +500밀리초 미만의 시간 범위 내에서 늦게 눈 깜박임이 증대하여 평가값이 높아졌다. 한편, 상품 소개를 재미없었다고 회답한 청자에 대해서는 이러한 눈 깜박임의 증대 및 평가값의 높아짐은 확인할 수 없었다. 한편, p값은 0.004이다.
도 13은 평가값을 청자의 성별 및 상품별로 나타낸 그래프이다. 도 13에 나타낸 바와 같이, '여성용 화장품'에 대해서는 여성 청자에 대해서는 평가값이 높은 값을 나타내는 한편, 남성 청자에 대해서는 평가값이 낮은 값을 나타냈다. '남성용 손목 시계' 및 '남성용 전기 면도기'에 대해서는 남성 청자에 대해서는 평가값이 높은 값을 나타내는 한편, 여성 청자에 대해서는 평가값이 낮은 값을 나타냈다.
도 14는 상품에 대한 관심도를 청자의 성별 및 상품별로 나타낸 그래프이다. 도 14에 나타내는 상품에 대한 관심도는 각 피험자가 '매우 지루함'이라고 회답한 경우의 관심도를 '1', '조금 지루함'이라고 회답한 경우의 관심도를 '2', '조금 재미있다'라고 회답한 경우의 관심도를 '3', '매우 재미있다'라고 회답한 경우의 관심도를 '4'로 하여, 남녀 각각에 대해 이 관심도의 평균을 취한 값을 나타낸다. 관심도의 값이 클수록 청자가 상품 소개에 높은 관심을 나타낸 것을 의미한다. 도 13과 도 14를 대비하면, 각 상품에 대해서 평가값와 상품 소개에 대한 관심도가 서로 관련있다는 것을 확인할 수 있었다.
이상의 검증에 의해, 본 발명자들은 화자와 청자의 눈 깜박임 타이밍 차이가 청자의 화자의 대화에 대한 관심 정도와 상관된다고 하는 지견을 얻었다.
[제 2 실시예]
제 2 실시예는 대화 장치(10) 주변의 환경에 기초하여 대화 장치(10)의 눈 깜박임 동작의 타이밍을 제어한다. 이하의 설명에서, 전술한 제 1 실시예의 요소와 동일한 요소는 동일한 부호를 붙여서 나타낸다. 본 실시예의 대화 장치(10)의 하드웨어 구성은 전술한 제 1 실시예와 같아도 된다.
도 15는 본 실시예의 대화 장치(10)의 기능 구성을 나타내는 블록도이다. 대화 장치(10)의 제어부(11)는 프로그램(141)을 실행함으로써 눈 깜박임 동작 제어부(111)와, 제 1 취득부(112)와, 눈 깜박임 검출부(113)와, 제 2 취득부(114)와, 처리부(115)와, 환경 정보 취득부(116)와, 기억 제어부(117)에 상당하는 기능을 실현한다.
환경 정보 취득부(116)는 대화 장치(10) 주변의 환경을 나타내는 환경 정보를 취득한다. 환경 정보는 여기서는 대화 장치(10)가 사용자(U)에 의해 사용되고 있을 때의 환경, 환언하면, 대화 장치(10)가 사용자(U)와 대화하고 있을 때의 환경을 나타낸다. 환경 정보는 예를 들어, 음성 정보, 음압 정보, 운율, 움직임 정보 및 주변 정보 중 하나 이상을 포함한다. 음성 정보는 음성 입력부(12)를 통해서 입력된 음성을 나타내는 정보, 음성 출력부(13)를 통해서 출력되는 음성을 나타내는 정보, 또는 이들의 모두를 포함한다. 음압 정보는 해당 음성 정보의 소정의 주파수 대역(예를 들어, 가청역)에서의 음압을 나타낸다. 운율은 발화에서 나타나는 음성학적 성질을 나타내ai, 예를 들어 억양이다. 움직임 정보는 사용자(U)의 신체 동작(예를 들어, 얼굴, 몸 또는 표정의 움직임)을 나타낸다. 주변 정보는 사용자(U)의 주변 환경을 나타낸다(예를 들어, 사용자(U)가 있는 공간의 밝기). 음성 정보, 음압 정보 및 운율은 음성 입력부(12)를 통해서 입력된 음성, 및 음성 출력부(13)에 공급되는 음성 신호에 기초하여 특정된다. 움직임 정보 및 주변 정보는 촬상부(15)를 이용해서 특정된다. 환경 정보는 다른 계측 장치를 이용해서 취득되어도 된다. 또한, 환경 정보는 대화 장치(10)의 상정 연령, 성별, 직업 및 사용자(U)에 관한 정보를 더 포함해도 된다.
기억 제어부(117)는 사용자(U)가 눈 깜박임을 한 타이밍과 대화 장치(10)가 사용되고 있는 환경을 대응지었다는 것을 나타내는 데이터를, 학습 데이터(143)로서 기억부(14)에 축적시킨다. 즉, 학습 데이터(143)는 대화 장치(10)의 주변의 환경과 사용자(U)가 실제로 한 눈 깜박임을 하는 타이밍의 관계를 학습한 결과를 나타내는 데이터이다. 한편, 기억 제어부(117)는 기억부(14) 이외의 기억 장치, 예를 들어 클라우드 스토리지 서비스와 관련된 기억 장치에, 학습 데이터(143)를 축적해도 된다.
눈 깜박임 동작 제어부(111)는 환경 정보 취득부(116)가 취득한 환경 정보에 따른 타이밍(제 1 타이밍)에 대화 장치(10)에 눈 깜박임 동작을 행하게 한다. 구체적으로는 눈 깜박임 동작 제어부(111)는 기억부(14)에 기억된 학습 데이터(143)와 환경 정보 취득부(116)가 취득한 환경 정보에 따른 타이밍에, 대화 장치(10)에 눈 깜박임 동작을 행하게 한다. 눈 깜박임 동작 제어부(111)는 예를 들어, 대화 장치(10)에 눈 깜박임 동작을 행하게 하는 타이밍, 눈 깜박임 동작의 빈도, 및 이들 모두를 제어한다.
다음으로, 대화 장치(10)의 동작을 설명한다. 도 16은 대화 장치(10)가 실행하는 학습 처리를 나타내는 흐름도이다. 학습 처리는 대화 처리와 병행해서 행해진다.
환경 정보 취득부(116)는 환경 정보를 취득한다(단계 S41). 다음으로, 제 2 취득부(114)는 사용자(U)의 눈 깜박임 타이밍을 취득한다(단계 S42). 다음으로, 기억 제어부(117)는 단계 S41에서 취득한 환경 정보가 나타내는 환경과 단계 S42에서 취득한 눈 깜박임 타이밍을 대응지었다는 것을 나타내는 데이터를, 학습 데이터(143)로서 기억부(14)에 축적시킨다(단계 S43). 이상이 학습 처리의 설명이다.
도 17은 대화 장치(10)가 실행하는 눈 깜박임 동작에 관한 처리를 나타내는 흐름도이다. 도 17의 처리는 도 5에서 설명한 단계 S11, S12의 처리 대신에 실행된다.
환경 정보 취득부(116)는 환경 정보를 취득한다(단계 S51). 다음으로, 눈 깜박임 동작 제어부(111)는 눈 깜박임 동작을 행할지 여부를 판단한다(단계 S52). 여기서는 눈 깜박임 동작 제어부(111)는 단계 S51에서 취득한 환경 정보와 학습 데이터(143)에 기초하여 눈 깜박임 동작을 행할지 여부를 판단한다. 동작 제어부(111)는 예를 들어, 기계 학습에 의해 눈 깜박임 동작의 유무 및 눈 깜박임 동작을 하는 타이밍을 판단한다. 기계 학습의 알고리즘은 예를 들어 뉴럴 네트워크이지만, 그 이외의 알고리즘이어도 된다. 한편, 학습 데이터(143)가 소정의 양만큼 축적될 때까지는 눈 깜박임 동작 제어부(111)는 전술한 제 1 실시예의 단계 S11와 같은 방법으로, 눈 깜박임 동작을 행할지 여부를 판단해도 된다.
눈 깜박임 동작 제어부(111)는 눈 깜박임 동작을 한다고 판단한 경우에는(단계 S52; 예) 대화 장치(10)에 눈 깜박임 동작을 행하게 한다(단계 S53). 눈 깜박임 동작 제어부(111)는 눈 깜박임 동작을 하지 않는다고 판단한 경우에는(단계 S52; 아니오), 대화 장치(10)에 눈 깜박임 동작을 행하게 하지 않는다. 눈 깜박임 처리부(115)는 대화 장치(10) 주변의 환경과 그 환경 하에서 인간이 행하는 눈 깜박임의 관계를 학습하고, 그 관계에 따라서 대화 장치(10)에 눈 깜박임 동작을 행하게 한다. 눈 깜박임 동작 제어부(111)는 예를 들어, 의외성이 높은 화제가 되었다고 판단했을 때에는 눈 깜박임 동작의 빈도를 높여도 된다. 이상이, 눈 깜박임 동작에 관한 처리의 설명이다.
본 실시예의 대화 장치(10)에 의하면, 전술한 제 1 실시예와 동등한 효과에 더해서 학습 데이터(143)를 이용해서 보다 자연스러운 타이밍에 눈 깜박임 동작을 할 수가 있다. 이로써, 대화 장치(10)와 사용자(U)의 커뮤니케이션의 질 향상을 기대할 수가 있다.
눈 깜박임 동작 제어부(111)는 환경 정보에 따른 타이밍에 더해서, 또 다른 타이밍(제 2 타이밍)에, 대화 장치(10)에 눈 깜박임 동작을 행하게 해도 된다. 눈 깜박임 동작 제어부(111)는 예를 들어, 랜덤 타이밍에 대화 장치(10)에 소정 기간 내에 소정 횟수(예를 들어, 1분간 20회)의 눈 깜박임 동작을 행하게 한다. 눈 깜박임 동작 제어부(111)는 소정 규칙에 따른 타이밍에 대화 장치(10)에 눈 깜박임 동작을 행하게 해도 된다. 이로써, 대화 장치(10)는 보다 자연스러운 타이밍에 눈 깜박임 동작을 하는 효과를 기대할 수 있다.
기억 제어부(117)는 평가값이 임계값 이상인 기간에 있어서, 학습 데이터(143)을 축적해도 된다. 이로써, 대화 장치(10)는 질이 좋은 커뮤니케이션을 하고 있을 때 인간이 행하는 눈 깜박임에 따라서 눈 깜박임 동작을 할 수가 있다.
한편, 학습 데이터(143)가 사전에 기억부(14)에 기억되어 있는 경우, 대화 장치(10)는 학습 데이터를 축적하는 기능(즉, 기억 제어부(117))을 가지지 않아도 된다.
[제 3 실시예]
제 3 실시예는 대화 장치가 표시 장치로서 기능한다는 점에서, 전술한 제 1 실시예의 대화 장치와 상위하다. 이하의 설명에서 전술한 제 1 실시예의 요소와 동일한 요소는 같은 부호를 붙여서 나타내고, 전술한 제 1 실시예의 요소에 대응하는 요소에 대해서는 같은 부호의 말미에 'A'를 붙여서 나타낸다.
도 18은 본 발명의 제 3 실시예인 대화 장치(10A)의 외관 구성의 일 예를 나타내는 도면이다. 대화 장치(10A)는 표시 영역(161)을 갖는다. 표시 영역(161)은 화상이 표시되는 영역이다. 표시 영역(161)은 오브젝트(20)를 표시한다. 오브젝트(20)는 전술한 제 1 실시예에서 설명한 대화 장치(10)의 외관과 마찬가지의 화상이다. 오브젝트(20)는 얼굴부(201)와 눈꺼풀부(202)를 갖는다. 얼굴부(201)는 얼굴에 상당하는 부위이다. 눈꺼풀부(202)는 얼굴부(201)에 배치되고, 눈의 눈꺼풀에 상당하는 부위이다. 눈꺼풀부(202)는 개폐됨으로써 눈 깜박임 동작을 한다. 본 실시예의 눈 깜박임 동작은 표시 영역(161)에의 화상의 표시에 의해 행해진다는 점에서 전술한 제 1 실시예와 상위하다. 한편, 도 18에 나타내는 오브젝트(20)는 일 예에 지나지 않고, 적어도 눈 깜박임 동작을 표현하는 화상을 포함하면 된다. 예를 들어, 오브젝트(20)는 적어도 하나의 눈꺼풀부를 포함한다. 도 1에 나타내는 외관의 대화 장치(10)의 눈꺼풀부(102) 대신에 표시부가 마련되어서 해당 표시부에 눈꺼풀부(202)에 상당하는 오브젝트가 표시되어도 된다.
사용자(U)는 대화 장치(10A)와 커뮤니케이션을 취하는 사람이다. 사용자(U)는 대화 장치(10A)와 대면해서 표시 영역(161)에 표시된 오브젝트(20)을 관찰해서 대화를 행한다.
도 19는 대화 장치(10A)의 하드웨어 구성을 나타내는 블록도이다. 대화 장치(10)는 제어부(11)와, 음성 입력부(12)와, 음성 출력부(13)와, 기억부(14)와, 촬상부(15)와, 표시부(16)를 갖는다. 기억부(14)는, 제어부(11)에 소정의 기능을 실현시키기 위한 프로그램(141A)을 기억한다. 표시부(16)는 화상을 표시하는 표시 영역(161)을 가진다. 표시부(16)는 예를 들어 액정 디스플레이, 유기 EL 디스플레이 또는 그 외의 표시 장치이다.
도 20은 대화 장치(10A)의 기능 구성을 나타내는 블록도이다. 대화 장치(10)의 제어부(11)는 프로그램(141A)을 실행함으로써, 눈 깜박임 동작 제어부(111A)와, 제 1 취득부(112)와, 눈 깜박임 검출부(113)와, 제 2 취득부(114)와, 처리부(115)에 상당하는 기능을 실현한다. 눈 깜박임 동작 제어부(111A)는 표시부(16)의 표시 영역(161)에 표시된 오브젝트(20)에 눈 깜박임 동작을 행하게 한다. 눈 깜박임 동작 제어부(111A)는 예를 들어, 눈 깜박임 동작을 행하게 하기 위한 눈 깜박임 제어 데이터를 표시부(16)에 공급한다. 눈 깜박임 제어 데이터는 표시부(16)의 표시를 제어하는 데이터이다. 표시부(16)는 눈 깜박임 제어 데이터에 따라서, 오브젝트(20)에 눈 깜박임 동작을 행하게 한다. 제 1 취득부(112)는 오브젝트(20)(눈꺼풀부(202))의 눈 깜박임 동작의 타이밍을 취득한다.
대화 장치(10A)의 동작은 눈 깜박임 동작이 표시부(16)의 제어에 의해 행해진다는 점을 제외하면 전술한 제 1 실시예와 같다.
한편, 본 실시예의 구성은 전술한 제 2 실시예의 대화 장치(10)에 적용할 수도 있다.
[변형예]
본 발명은 상기 실시예로 한정된 것은 아니고, 그 취지를 벗어나지 않는 범위에서 적당하게 변경하는 것이 가능하다. 이하, 제 1 실시예의 대화 장치(10)의 변형예로서 설명하지만, 제 2 실시예의 대화 장치(10) 및 제 3 실시예의 대화 장치(10A)에도 적용할 수가 있다.
전술한 실시예의 처리부(115)의 평가값의 산출 방법은 일 예에 지나지 않는다. 처리부(115)는 예를 들어, 시계열로 사용자(U)의 눈 깜박임의 횟수 및 대화 장치(10)의 눈 깜박임 동작의 횟수를 계수하고, 특정 기간(장면)에서의 눈 깜박임 및 눈 깜박임 동작의 횟수에 기초하여 평가값을 산출해도 된다. 이 경우, 처리부(115)는 눈 깜박임 및 눈 깜박임 동작의 횟수가 많은 기간일수록, 사용자(U)의 대화 장치(10)의 커뮤니케이션에 대한 관심의 정도가 높다는 것을 나타내는 평가값을 산출한다. 눈 깜박임 및 눈 깜박임 동작이 많은 기간은 그 이외의 기간보다 사용자(U)의 눈 깜박임 타이밍과 대화 장치(10)의 눈 깜박임 동작의 타이밍의 타이밍 차이가 작다고 생각되기 때문이다. 또한, 처리부(115)는 평가값을 산출하지 않고, 눈 깜박임 동작의 타이밍과 사용자의 눈 깜박임 타이밍의 차이에 따른 처리를 행해도 된다.
사용자(U)의 눈 깜박임 타이밍과 대화 장치(10)의 타이밍의 차이에 따른 처리는 발화 처리로 한정되지 않는다. 처리부(115)는 예를 들어, 대화 장치(10)를 평가하는 처리를 행해도 된다. 이 경우, 처리부(115)는 대화 장치(10)의 식별자와 대응지어서 평가 데이터를 출력한다. 평가 데이터는 대화 장치(10)의 평가를 나타낸다. 평가 데이터는 평가값을 나타내는 데이터여도 되고, 평가값을 이용해서 생성된 데이터여도 된다. 평가 데이터의 출력은 예를 들어, 송신, 인쇄, 표시 또는 그 외의 방법에 의해 행해진다. 이 변형예에 의하면, 대화 장치(10)가 행하는 커뮤니케이션의 질을 평가할 수 있다.
눈 깜박임의 검출은 촬상 데이터를 이용하는 방법 이외 방법으로 행해져도 된다. 해당 방법으로서 전파 센서(예를 들어, 4GHz 전파 센서 모듈), 적외선 센서, 도플러 센서 등의 비접촉의 센서를 이용하는 방법이 있다. 또한, 얼굴의 근력의 움직임에 기초하여 눈 깜박임을 검출하는 센서를 이용하는 방법이 있다.
전술한 실시예에서 설명한 제어부(11)가 실현한 기능의 일부 또는 전부를, 대화 장치 외부의 처리 장치가 가져도 된다. 이 경우, 해당 처리 장치는 예를 들어, 대화 장치를 통신(예를 들어, 공중 통신 회선을 통한 통신)에 의해 제어한다. 이 제어에는 눈 깜박임 동작의 제어 및 대화 처리의 제어 중 하나 또는 양쪽 모두가 포함되어도 된다. 해당 처리 장치는 복수의 대화 장치를 제어해도 된다. 요컨데, 본 개시에 관한 처리 장치는 도 21에 나타낸 바와 같이, 대화 장치의 눈 깜박임 동작의 타이밍을 취득하는 제 1 취득부(301)와, 상기 대화 장치의 사용자의 눈 깜박임 타이밍을 취득하는 제 2 취득부(302)와, 상기 눈 깜박임 동작의 타이밍과 상기 사용자의 눈 깜박임 타이밍의 차이에 따른 처리를 행하는 처리부(303)를 갖는다.
전술한 실시예의 구성 및 동작의 일부가 생략되어도 된다. 전술한 실시예에서 설명하고자 했던 구성 및 동작이 추가되어도 된다. 또한, 전술한 실시예에서 설명한 처리의 실행 순서는 일 예에 지나지 않고 적당하게 변경되어도 된다.
제어부(11)가 실현하는 기능은 복수의 프로그램의 조합에 의해 실현되어도 되고, 또는 복수의 하드웨어 자원의 연계에 의해 실현되어도 된다. 제어부(11)의 기능이 프로그램을 이용해서 실현되는 경우, 이 기능을 실현하기 위한 프로그램(141, 141A)이 각종 자기 기록 매체, 광기록 매체, 광자기 기록 매체, 반도체 메모리 등의 컴퓨터 판독 가능한 기록 매체에 기억한 상태로 제공되어도 된다. 또한, 이 프로그램은 네트워크를 통해서 배포되어도 된다. 또한, 본 발명은 처리 방법으로서도 파악할 수 있다.
[제 4 실시예]
사람이 무의식 중에 행하는 동작에 기초하여 그 사람이 관찰하는 시각 정보에 대한 관심 정도를 추정하는 기술이 종래부터 제안되어 있다. 일본 특허 제 5771127호는 사람의 시선 변화 및 눈 깜박임 간격에 기초하여, 영상에 대한 주목도를 추정하는 것을 개시하고 있다. 일본 특허 공개 제 2009-267445호 공보는 컨텐츠의 장르에 대응한 만족도 산출 수법을 선택하고, 사용자의 해당 컨텐츠에 대한 만족도를 산출하는 것을 개시하고 있다. 일본 특허 공개 제 2005-142975호 공보는 단말 조작 데이터 및 눈 깜박임을 포함한 신체 데이터에 기초하여, 시청 질 데이터를 생성하는 것을 개시하고 있다. 일본 특허 재공표 제 2008-72739호 공보는 시청자의 안구 운동에 기초하여, 컨텐츠에 대한 흥미·관심도를 산출하는 것을 개시하고 있다. 한편, 같은 영상을 보는 복수의 피험자의 눈 깜박임에 관해서, 본 출원의 발명자들에 의해, 논문 3에 이하의 사항이 개시되어 있다.
(논문 3) Richard J. Wiseman and Tamami Nakano, "Blink and you'll miss it: the role of blinking in the perception of magic tricks", PeerJ, e1873,[online],[2018년 3월 12일 검색], 인터넷 <URL:https://peerj.com/articles/1873/?utm#source=TrendMD&utm#campaign=PeerJ#TrendMD#1&utm#medium=TrendMD>, (2016년)
논문 3은 마술 영상을 보고 있을 때의 복수의 피험자의 눈 깜박임이 동기되는 것을 개시하고 있다.
한편, 인간의 눈 깜박임 횟수나 빈도는 개인차가 크다. 이 때문에, 사람의 눈 깜박임의 횟수나 빈도를 그대로, 관심 정도 등의 객관적인 지표로서 이용하는 것은 곤란하다.
본건 발명자는 복수의 사용자의 눈 깜박임 타이밍의 차이를, 해당 복수의 사용자가 관찰하는 시각 정보에 대한 관심의 정도의 지표로서 이용할 수 있다고 하는 지견을 얻었다. 예를 들어, 복수의 사용자의 눈 깜박임 타이밍의 일치 정도가 높은 기간은, 그 기간에 관찰된 시각 정보에 대해 해당 복수의 사용자가 강한 관심을 나타내고 있다고 추측할 수 있다. 한편, 그 일치 정도가 낮은 기간은, 그 기간에 관찰된 시각 정보에 대해 해당 복수의 사용자가 강한 관심을 나타내지 않다고 추측할 수 있다. 이러한 지견을 얻기에 이른 검증에 대해서는 후술한다. 이러한 지견에 기초하여, 제 4 내지 제 7 실시예에서는 사람의 눈 깜박임을 객관적인 지표로서 이용하기 위한 기술로서 복수의 사용자의 눈 깜박임 타이밍 일치 정도에 따른 처리를 행하는 데이터 처리 시스템을 설명한다.
도 22는 본 발명의 제 4 실시예인 데이터 처리 시스템(1001)의 전체 구성을 나타내는 블록도이다. 데이터 처리 시스템(1001)은 소정의 시각 정보를 관찰하는 복수의 사용자의 눈 깜박임에 기초하여 해당 시각 정보를 평가한다. 시각 정보는 사람이 시각을 통해서 획득할 수 있는 정보를 총칭한다. 시각 정보는 본 실시예에서는 동영상이다. 동영상은 사람이 시각을 통해서 인식할 수 있는 정보가 시간적으로 변화된다. 동영상은 또한 사람이 청각을 통해서 인식할 수 있는 정보(즉, 소리)를 포함해도 된다. 본 실시예의 동영상은 예를 들어, 텔레비젼 방송과 관련된 동영상(예를 들어, TV 프로그램 또는 광고 방송)이다.
데이터 처리 시스템(1001)은 서버 장치(1010)와 복수의 단말 장치(1020)(1020-1, 1020-2, … , 1020-N)를 가진다. 서버 장치(1010)는 복수의 단말 장치(1020) 각각으로부터 사용자의 눈 깜박임 타이밍을 나타내는 데이터를 취득하고 취득한 해당 데이터에 기초하여 동영상의 평가를 행한다. 서버 장치(1010)는 예를 들어, 사용자에 의한 동영상의 시청 경향의 집계, 분석하는 사업자에 의해 관리, 운용된다. 서버 장치(1010)는 복수의 단말 장치(1020) 각각과 통신 회선(NW)을 통해서 통신한다. 통신 회선(NW)은 예를 들어 인터넷으로 예시되는 공중 통신 회선, 또는 전용 회선이다. 서버 장치(1010)는 본 개시와 관련된 데이터 처리 장치를 갖는 장치의 일 예이다.
복수의 단말 장치(1020)는 동영상을 관찰하는 사용자에 의해 사용된다. 도 22에는 복수의 단말 장치(1020)로서 단말 장치(1020-1, 1020-2, … , 1020-N)(단, N은 2이상의 자연수)가 나타나 있다. 단말 장치(1020-i)(단, 1≤i≤N)의 사용자를, 이하에서는 '사용자(Ui)'라고 칭한다. 사용자(Ui)는 동영상 재생 장치(1030-i)를 이용해서 동영상을 관찰한다. 동영상 재생 장치(1030-1~1030-N)는 예를 들어 텔레비젼이다.
단말 장치(1020)는 예를 들어, 스마트 폰, 태블릿 단말, 및 웨어러블형 컴퓨터로 예시되는 휴대형의 단말 장치이다. 또는 단말 장치(1020)는 동영상의 시청 공간(예를 들어, 동영상 재생 장치(1030-1~1030-N)가 설치된 방)에 설치되는 고정형의 단말 장치여도 된다. 단말 장치(1020)는 동영상을 관찰하는 사용자의 눈 깜박임을 검출 가능한 위치에 설치된다. 예를 들어, 단말 장치(1020)는 동영상 재생 장치(1030-1~1030-N) 근방에 설치된다.
도 23은 서버 장치(1010)의 하드웨어 구성을 나타내는 블록도이다. 서버 장치(1010)는 제어부(1011)와, 통신부(1012)와, 기억부(1013)를 갖는다. 제어부(1011)는 서버 장치(1010)의 각부를 제어한다. 제어부(1011)는 예를 들어, CPU로 예시되는 연산 처리 장치 및 메모리를 포함한다. 메모리는 예를 들어, 연산 처리 장치가 워크 에어리어로서 사용하는 RAM, 및 제어 프로그램을 기억하는 ROM를 포함한다. 
통신부(1012)는 통신 회선(NW)을 통해서 복수의 단말 장치(1020) 각각과 유선 또는 무선에 의해 통신한다. 통신부(1012)는 예를 들어, 통신 회로 및 안테나를 포함한다.
기억부(1013)는 데이터를 기억한다. 기억부(1013)는 예를 들어, 프로그램(1131)을 기억한다. 프로그램(1131)은 제어부(1011)에 소정의 기능을 실현시키기 위한 프로그램이다. 기억부(1013)는 예를 들어, 광학식 기록 매체, 자기 기록 매체 및 반도체 기록 매체로 예시되는 임의의 형식의 기록 매체를 포함할 수 있다.
도 24는 단말 장치(1020)의 하드웨어 구성을 나타내는 블록도이다. 단말 장치(1020)는 제어부(1021)와, 사용자 인터페이스(1022)와, 통신부(1023)와, 기억부(1024)와, 촬상부(1025)를 가진다. 제어부(1021)는 단말 장치(1020)의 각부를 제어한다. 제어부(1021)는 예를 들어, CPU로 예시되는 연산 처리 장치 및 메모리를 포함한다. 메모리는 예를 들어, CPU가 워크 에어리어로서 사용하는 RAM, 및 제어 프로그램을 기억하는 ROM를 포함한다. 제어부(1021)는 소정의 시간축 상에서 규정되는 시각을 측정하는 계시(計時)부를 가진다. 시간축은 예를 들어, 절대 시각 또는 동영상의 재생 위치(예를 들어, 동영상의 재생 개시 시각을 기준으로 한 상대 시각)를 규정한다.
사용자 인터페이스(1022)는 사용자와 대화하기 위한 인터페이스이다. 사용자 인터페이스(1022)는 예를 들어, 조작을 수취하는 조작부(예를 들어, 물리 키 또는 터치 센서), 및 정보를 표시하는 표시부(예를 들어, 액정 디스플레이)를 포함한다. 통신부(1023)는 통신 회선(NW)을 통해서 서버 장치(1010)와 통신한다. 통신부(1023)는 예를 들어, 통신 회로 및 안테나를 포함한다. 기억부(1024)는 데이터를 기억한다. 기억부(1024)는 예를 들어, 프로그램(1241)을 기억한다. 프로그램(1241)은 제어부(1021)에 소정의 기능을 실현시키기 위한 프로그램이다. 기억부(1024)는 예를 들어, 광학식 기록 매체, 자기 기록 매체 및 반도체 기록 매체로 예시되는 임의의 형식의 기록 매체를 포함할 수 있다.
촬상부(1025)는 피사체를 촬상하고, 해당 촬상한 화상을 나타내는 촬상 데이터를 생성한다. 피사체는 적어도, 사용자의 얼굴, 보다 상세하게는 사용자의 눈을 포함한다. 촬상부(1025)는 예를 들어, CCD(Charge Coupled Device) 이미지 센서로 예시되는 촬상 소자 및 렌즈를 포함한다.
도 25는 데이터 처리 시스템(1001)의 기능 구성을 나타내는 블록도이다. 서버 장치(1010)의 제어부(1011)는 데이터 처리 장치에 상당한다. 제어부(1011)는 취득부(1111)와, 산출부(1112)와, 출력부(1113)를 구비한다. 제어부(1011)는 프로그램(1131)을 실행함으로써, 취득부(1111)와, 산출부(1112)와, 출력부(1113)에 상당하는 기능을 실현한다. 복수의 단말 장치(1020) 각각의 제어부(1021)는 프로그램(1241)을 실행함으로써, 눈 깜박임 검출부(1211)와 송신부(1212)에 상당하는 기능을 실현한다.
단말 장치(1020)에 있어서 눈 깜박임 검출부(1211)는 사용자의 눈 깜박임을 검출한다. 구체적으로는 눈 깜박임 검출부(1211)는 촬상부(1025)에 의해 생성된 촬상 데이터에 기초하여 사용자의 눈 깜박임을 검출한다. 송신부(1212)는 사용자의 눈 깜박임 타이밍을 나타내는 데이터(이하 '눈 깜박임 데이터'라고 함)를 통신부(1023)를 이용해서 서버 장치(1010)에 송신한다. 본 실시예의 눈 깜박임 데이터는 눈 깜박임이 검출된 시각을 그 시각순으로 나열한 데이터(제 1 데이터)이다.
서버 장치(1010)에 있어서 취득부(1111)는 통신부(1012)를 이용해서 복수의 단말 장치(1020) 각각으로부터 눈 깜박임 데이터를 취득한다.
산출부(1112)는 복수의 사용자의 눈 깜박임 타이밍의 차이에 기초하여 해당 복수의 사용자의 눈 깜박임 타이밍의 일치 정도에 따른 지표를 산출한다. 산출부(1112)는 취득부(1111)가 취득한 눈 깜박임 데이터에 기초하여 해당 지표를 산출한다. 해당 지표는 본 실시예에서는 복수의 사용자의 동영상에 대한 관심 정도의 평가값이다.
출력부(1113)는 산출부(1112)가 산출한 지표에 따른 데이터를 출력한다. 본 실시예에서는 출력부(1113)는 해당 지표 자체를 출력해도 되고, 해당 지표로부터 직접적 또는 간접적으로 특정되는 데이터(예를 들어, 컨텐츠)를 출력해도 된다.
다음으로, 데이터 처리 시스템(1001)의 동작을 설명한다. 도 26은 데이터 처리 시스템(1001)에서 실행되는 처리를 나타내는 흐름도이다.
단말 장치(1020)에서 눈 깜박임 검출부(1211)는 촬상부(1025)에 사용자의 눈을 촬상시킨다(단계 S11). 눈 깜박임 검출부(1211)는 촬상부(1025)에 의해 생성된 촬상 데이터에 기초하여 사용자의 눈 깜박임을 검출한다(단계 S12). 눈 깜박임의 검출의 알고리즘은 여러 가지의 공지 기술이 적용되어도 된다. 눈 깜박임 검출부(1211)는 예를 들어, 촬상 데이터가 나타내는 화상으로부터, 사용자의 눈의 둘레를 따라서 복수의 특징점을 추출한다. 눈 깜박임 검출부(1211)는 예를 들어, Haar-like에 기초하여 해당 특징점을 추출한다. 눈 깜박임 검출부(1211)는 복수의 프레임의 촬상 데이터에 기초하여, 추출한 특징점의 이동의 방향 및 그 속도의 시간적인 변화를 특정함으로써 사용자의 눈 깜박임의 유무를 검출한다. 예를 들어 사람의 눈 깜박임에 기인해서 대략 0~300밀리초 사이에 특징점의 급격한 속도의 변화가 생긴다. 여기서, 눈 깜박임 검출부(1211)는 소정 기간 내의 속도 변화가 임계값 이상이 된 경우 사용자의 눈 깜박임이 있었던 것을 검출한다.
눈 깜박임 검출부(1211)는 예를 들어, 촬상부(1025)로부터 공급된 촬상 데이터에 기초하여 실시간으로 눈 깜박임을 검출한다. 또는 눈 깜박임 검출부(1211)는 촬상 데이터를 기억부(1024)에 기억하게 하고, 소정의 타이밍에 해당 촬상 데이터를 판독해서 눈 깜박임을 검출해도 된다.
송신부(1212)는 사용자의 눈 깜박임 타이밍을 나타내는 눈 깜박임 데이터를, 통신부(1023)를 이용해서 서버 장치(1010)에 송신한다(단계 S13). 송신부(1212)는 또한 눈 깜박임 데이터와 대응지어서 동영상 특정 정보를, 서버 장치(1010)에 송신해도 된다. 동영상 특정 정보는 사용자가 관찰한 동영상을 특정하는 정보이다. 동영상 특정 정보는 예를 들어, 동영상을 식별하는 식별 정보, 해당 동영상의 방송 일시를 나타내는 방송 일시 정보 및 해당 동영상의 방송 채널을 나타내는 채널 정보를 포함한다. 한편, 눈 깜박임 데이터의 송신 타이밍은 구애되지 않는다. 송신 타이밍은 예를 들어, 사전 결정된 타이밍(예를 들어, 1일 1회의 소정의 시각), 또는 서버 장치(1010)로부터 요구가 있던 타이밍이다.
서버 장치(1010)에서 취득부(1111)는 통신부(1012)를 이용해서 복수의 단말 장치(1020) 각각으로부터 눈 깜박임 데이터를 취득한다(단계 S14). 취득부(1111)는 단말 장치(1020)가 동영상 특정 정보를 송신한 경우에는 해당 동영상 특정 정보를 더 취득한다.
산출부(1112)는 취득부(1111)가 취득한 눈 깜박임 데이터에 기초하여 지표 산출 처리를 행한다(단계 S15).
도 27은 지표 산출 처리를 나타내는 흐름도이다. 이하, 지표 산출 처리를 구체예를 들어서 설명한다.
산출부(1112)는 N명의 사용자(U1~UN) 중에서 2명의 사용자를 선택한다(단계 S151). 선택한 2명의 사용자를 이하, 각각 '제 1 사용자', '제 2 사용자'라고 칭한다. 산출부(1112)는 여기에서는 사용자(U1)와 사용자(U2)를 선택한 것으로 한다.
다음으로, 산출부(1112)는 제 1 사용자의 눈 깜박임 타이밍과 제 2 사용자의 눈 깜박임 타이밍의 차이를 산출한다(단계 S152). 산출부(1112)는 제 1 사용자의 눈 깜박임 타이밍과 제 2 사용자의 눈 깜박임 타이밍의 모든 조합에 대해서 타이밍의 차이(이하 '타이밍 차이'라고 한다)를 산출한다.
도 28은 눈 깜박임 타이밍의 차이의 산출 방법을 설명하는 도면이다. 도 28에는 눈 깜박임이 검출된 타이밍을 나타내는 타이밍 차트가 나타나 있다. 도 28에 나타낸 바와 같이, 사용자(U1)의 눈 깜박임 타이밍을 그 시각순으로 t11, t12, … t1B로 나타낸다. 사용자(U2)의 눈 깜박임 타이밍을 그 시각순으로 t21, t22, … t27로 나타낸다. 이 경우, 산출부(1112)는 t11, t12, … t1B 각각에 대해 t21, t22, … t27 각각과의 차이를 산출한다. 눈 깜박임 타이밍(t1i)(단, 1≤i≤m)과 눈 깜박임 타이밍 t2j(단, 1≤j≤n)의 차이인 타이밍 차이를, 이하 'Δtij'라고 나타낸다. 이 경우, 산출부(1112)는 타이밍 차이(TD){Δt11, Δt12, … , Δt17, Δt21, Δt22, … , Δt27, … ΔtB1, ΔtB2, … , ΔtBn}를 산출한다.
도 29는 타이밍 차이의 출현 빈도의 분포를 나타내는 그래프(DG)를 나타낸다. 도 29의 그래프(DG)에 있어서, 가로축이 타이밍 차이에 대응하고, 세로축이 각 타이밍 차이의 출현의 정도(즉, 출현 빈도)에 대응한다. 도 29에 나타내는 예에서는 타이밍 차이가 비교적 작은 시간 범위 T 내에서, 출현 빈도가 높아지고 있다.
그런데, 그래프(DG)로 나타내어지는 출현 빈도의 분포는 제 1 사용자 및 제 2 사용자에 의한 동영상의 관찰, 및 제 1 사용자 및 제 2 사용자의 눈 깜박임의 특성(예를 들어, 횟수나 빈도)에 기인해 발생했다고 생각된다. 그래서, 타이밍 차이(TD)로 나타내어지는 제 1 사용자 및 제 2 사용자의 눈 깜박임이 어느 정도 동영상을 관찰한 것에 기인했다는 것을 명확하게 하기 위해서, 산출부(1112)는 써로게이트 데이터법을 이용해서 출현 빈도의 분포를 해석한다.
즉, 산출부(1112)는 단계 S13에서 취득한 눈 깜박임 데이터에 기초하여, 랜덤 데이터를 생성한다(단계 S153). 랜덤 데이터는 여기에서는 단계 S151에서 선택한 2명의 사용자 중 한명 또는 양쪽 모두에 대해서, 시간축 상에서 눈 깜박임의 간격의 순서를 랜덤하게 변경한 K가지(예를 들어, 1000가지)의 랜덤 데이터(R1~RK)(제 2 데이터)를 포함한다.
도 30은 랜덤 데이터(R1~RK)의 일 예를 나타내는 도면이다. 도 30에 나타내는 랜덤 데이터(R1~RK)는, 사용자(U1)에 대해서 눈 깜박임의 간격의 순서가 변경되지 않고 사용자(U2)에 대해서 눈 깜박임의 간격의 순서가 변경되고 있는 랜덤 데이터이다. 랜덤 데이터(R1~RK)에서 사용자(U2)의 눈 깜박임 타이밍은 그 시각순으로 t21a, t25a, … t23a로 나타내어 진다. 한편, 도 28에 나타내는 타이밍 't2j'과, 도 30에 나타내는 타이밍 't2ja'이 대응한다.
다음으로, 산출부(1112)는 K가지의 랜덤 데이터(R1~RK) 각각에 대해서, 제 1 사용자의 눈 깜박임 타이밍과 제 2 사용자의 눈 깜박임 타이밍의 차이인 타이밍 차이를 산출한다(단계 S154). 타이밍 차이의 산출 방법은 단계 S152와 같아도 된다. 즉, 산출부(1112)는 랜덤 데이터(R1~RK) 각각에 대해 제 1 사용자의 눈 깜박임 타이밍과 제 2 사용자의 눈 깜박임 타이밍의 모든 조합에 대해서 타이밍 차이를 산출한다. 눈 깜박임 타이밍 t1ia(단, 1≤i≤m)과 눈 깜박임 타이밍 t2ja(단, 1≤j≤n)의 차이인 타이밍 차이를 이하 'Δtija'로 나타낸다. 이 경우, 산출부(1112)는 타이밍 차이 TR{Δt11a, Δt15a, … , Δt13a, Δt21a, Δt25a, … , Δt23a, … ΔtB1a, ΔtB5a, … , ΔtB3a}를 산출한다. 랜덤 데이터(R1~RK)에서의 타이밍 차이의 출현 빈도는 예를 들어, 도 29의 그래프(RG)로 나타난다. 한편, 그래프(RG)는 랜덤 데이터(R1~RK)의 타이밍 차이의 출현 빈도의 평균을 나타낸다. 
다음으로, 산출부(1112)는 눈 깜박임 데이터에 기초하는 타이밍 차이와 랜덤 데이터에 기초하는 타이밍 차이에 기초하여 평가값을 산출한다(단계 S155). 랜덤 데이터는 사용자(U2)의 눈 깜박임의 간격을 랜덤하게 변경한 데이터로, 사용자(U2)의 눈 깜박임의 횟수 및 간격은 유지한 채로, 시계열의 정보가 흩뜨려진 데이터라고 할 수 있다. 따라서, 눈 깜박임 데이터와 랜덤 데이터를 비교함으로써, 해당 눈 깜박임 데이터가 나타내는 타이밍 차이의 출현 분포가 동영상의 관찰에 기인해서 나타난 정도를 파악할 수 있다.
구체적으로는 산출부(1112)는 평가값을 Z값에 의해 산출한다. 즉, 산출부(1112)는 눈 깜박임 데이터가 나타내는 타이밍 차이(TD){Δt11, Δt12, … , Δt17, Δt21, Δt22, … , Δt27, … ΔtB1, ΔtB2, … , ΔtBn} 각각으로부터 랜덤 데이터(R1~RK)에 있어서의 타이밍 차이의 평균값을 줄이고, 또한 획득한 값을 랜덤 데이터(R1~RK)에 있어서의 타이밍 차이의 표준 편차로 나눔으로써, 평가값(Z)을 산출한다. 예를 들어, 눈 깜박임 데이터가 랜덤 데이터와 같은 경우, 평가값(Z)은 0이다. 이 경우, 눈 깜박임 데이터가 나타내는 출현 빈도의 분포가, 동영상의 관찰에 기인해 나타나지 않다고 추측할 수 있다. 한편, 평가값(Z)이 크고, 눈 깜박임 데이터가 랜덤 데이터에 비해서 차이가 큰 경우에, 눈 깜박임 데이터가 나타내는 출현 빈도의 분포가 동영상의 관찰에 기인해서 나타났다고 추측할 수 있다. 도 29를 이용해서 설명하면 출현 빈도의 차이(Δ)가 큰 경우일수록 평가값(Z)은 커진다.
도 31은 평가값(Z)의 일 예를 나타내는 그래프이다. 도 31에 나타내는 그래프에서, 가로축은 타이밍 차이에 대응하고 세로축은 평가값에 대응한다. 타이밍 차이는 여기에서는 빈의 값에 의해 나타낸다. 빈 번호 '7'은 타이밍 차이가 '0'으로 취급되는 것을 나타낸다. 빈 사이의 시간폭은 300밀리초이고, 빈 번호의 값이 커지는 방향으로, 양의 방향으로 타이밍 차이가 크다는 것을 의미한다. 예를 들어, 빈 번호 '8'은 +300밀리초의 차이가 있고, 빈 번호 '9'는 +600밀리초의 차이가 있다는 것을 의미한다. 반대로, 빈 번호의 값이 작아지는 방향으로, 음의 방향으로 타이밍 차이가 크다는 것을 의미한다. 예를 들어, 빈 번호 '6'은 -300밀리초의 차이가 있고, 빈 번호 '5'는 -600밀리초의 차이가 있는 것을 의미한다. 한편, 타이밍 차이가 양의 값인 경우 제 2 사용자의 눈 깜박임 타이밍이 제 1 사용자의 눈 깜박임 타이밍보다 빠르다는 것을 의미한다. 타이밍 차이가 음의 값인 경우 제 1 사용자의 눈 깜박임 타이밍이 제 2 사용자의 눈 깜박임 타이밍보다 빠르다는 것을 의미한다. 본 실시예에서는 타이밍 차이가 300밀리초 이하인 눈 깜박임의 출현 빈도가 빈 번호 '7'의 평가값(Z)을 나타낸다. 환언하면, 빈 번호 '7' 이외의 번호에 대응하는 출현 빈도는 평가값(Z)의 산출에는 사용되지 않는다. 도 31에 나타내는 예에서는 평가값(Z)은 '0.4'이다. 산출부(1112)는 동영상의 재생 기간 전체에 대해서 하나의 평가값을 산출해도 되고, 해당 재생 기간을 복수의 단위 기간(예를 들어, 30초의 기간)으로 구분해서, 해당 단위 기간마다 평가값을 산출해도 된다.
산출부(1112)는 눈 깜박임 데이터에 더해서 동영상 특정 정보에 기초하여 지표 산출 처리를 행해도 된다. 이 경우, 산출부(1112)는 동영상 특정 정보에 기초하여 N명의 사용자의 각 사용자가 보고 있는 동영상을 특정하고, 또한 공통의 시간축 상에서의 N명의 사용자의 눈 깜박임 타이밍에 기초하여 지표를 산출한다.
다음으로, 산출부(1112)는 모든 사용자의 조합에 대해서 평가값을 산출했는지 여부를 판단한다(단계 S156). 단계 S156에서 '아니오'라고 판단한 경우, 산출부(1112)는 단계 S151의 처리에 돌아간다. 그리고, 산출부(1112)는 선택하는 2명의 사용자의 조합을 변경해서 평가값을 산출한다(단계 S151~S154). 그리고, 단계 S156에서 '예'라고 판단한 경우 산출부(1112)는 지표 산출 처리를 종료한다.
한편, 랜덤 데이터는, 사용자(U2)에 대해서 눈 깜박임의 간격의 순서가 변경되지 않고 사용자(U1)에 대해서 눈 깜박임의 간격의 순서가 변경된 데이터여도 된다. 또한, 랜덤 데이터는 단계 S151에서 선택한 2명의 사용자(예를 들어, 사용자(U1) 및 사용자(U2))의 눈 깜박임의 간격의 순서가 변경된 데이터여도 된다.
지표 산출 처리가 종료되면 출력부(1113)는 산출된 평가값에 따른 데이터를 생성해서 출력한다(도 26의 단계 S16, S17).
도 32는 단계 S17에서 출력되는 데이터의 일 예를 나타내는 도면이다. 이 예에서는 출력부(1113)는 시각과 관련지어진 평가값을 출력한다. 구체적으로는 출력부(1113)는 가로축을 시각에 대응시키고 세로축을 평가값에 대응시켜서 평가값의 시간적인 변화를 나타낸 그래프(ZG)를 생성한다. 세로축의 평가값은 예를 들어, 단위 기간마다의 NC2 가지로 산출한 평가값의 평균값을 나타내고 있다. 그래프(ZG)는 N명의 사용자의 동영상에 대한 평가값의 시간적인 변화를 정량적으로 나타낸 그래프이다. 한편, 출력부(1113)는 예를 들어, 동영상의 재생 기간(예를 들어, 프로그램의 방송 기간) 전체에 대해서 평가값을 산출하지만, 일부의 기간에 대해서 평가값을 산출해도 된다.
한편, 출력부(1113)는 N명의 사용자의 평가값의 이동 평균을 출력해도 된다. 또한, 단계 S17의 데이터의 출력의 방법은 구애되지 않는다. 예를 들어, 데이터의 출력의 방법은 예를 들어, 통신, 인쇄 또는 표시에 의해 행해진다.
통상, 텔레비젼 방송의 시청률은 각 시각에 선국되어 있는 채널에 기초하여 계측되고 있다. 따라서, 선국 중인 프로그램에 시청자가 관심이 있는지 여부나, 그 관심 정도를 정량적으로 파악할 수 없었다. 이에 비해, 데이터 처리 시스템(1001)에 의하면, 복수의 사용자의 눈 깜박임 타이밍 차이에 따라서 동영상에 대한 관심 정도를 정량적으로 평가할 수 있다. 이 평가 결과는 시청 경향의 분석이나 마케팅 등에 이용하는 것이 가능하다.
여기서, 복수의 사용자의 눈 깜박임 타이밍의 차이를 시각 정보의 객관적인 평가에 이용할 수 있는 근거를 설명한다. 본건 발명자들은 이하에서 설명하는 검증을 행했다.
발명자들은 59명의 대학생을 피험자로 해서, 이하의 (동영상 1), (동영상 2), (동영상 3)를 주제로 하는 동영상을, 각각 3종류씩 작성하고, (동영상 1)→(동영상 2)→(동영상 3)→(동영상 1)→(동영상 2)→(동영상 3)→(동영상 1)→(동영상 2)→(동영상 3)의 순서로 재생했다. 각 동영상의 재생 시간은 3분간이며, 동영상의 합계의 재생 시간은 27분간이다. 본건 발명자들은 이들 동영상을 관찰하는 피험자의 눈 깜박임의 검출을 행했다.
(동영상 1) 장기 대국 해설
(동영상 2) 축구 시합
(동영상 3) 아이돌 가수 A의 텔레비젼 인터뷰
도 33은 동영상을 보고 있는 59명의 피험자의 눈 깜박임의 빈도의 분포를 나타내는 그래프이다. 도 33에 나타낸 바와 같이, 피험자의 눈 깜박임의 빈도는 5~50회/분의 범위로 분포하고, 개인차가 크다는 것을 알았다. 즉, 어떤 눈 깜박임 횟수나 빈도의 눈 깜박임이 동영상을 관찰한 것에 기인해서 발생했는지, 또는 그 사람의 눈 깜박임의 특성에 의한 것인지를 추측하는 것은 곤란하다.
도 34는 피험자의 1분마다의 눈 깜박임 횟수의 시간적 변화를 나타내는 그래프이다. 도 34에는 장기 팬인 8명의 피험자의 눈 깜박임의 평균 횟수와, 축구 팬인 19명의 피험자의 눈 깜박임의 평균 횟수와, 아이돌 가수 A팬(도 34, 도 37 및 도 38에서, 'A팬'으로 나타냄)인 18명의 피험자의 눈 깜박임의 평균 횟수가 각각 나타나 있다. 한편, 59명의 피험자 중, 사전 앙케이트에서, 장기와 축구 또는 축구와 아이돌 가수 A(도 34, 도 37 및 도 39에서 'A'라고 나타냄)와 같은 식으로, 2 이상의 대상의 팬이라고 회답한 피험자가 12명 있었다. 이 때문에, 이 12명의 피험자에 대해서는 특정 대상에 팬인 피험자로부터는 제외했다. 도 34에 나타낸 바와 같이, 눈 깜박임의 횟수는 동영상에 따라 변화하는 경향이 나타났다. 그러나, 개개의 피험자의 관심이 있는 대상과 눈 깜박임의 횟수의 사이에서, 상관은 확인할 수 없었다. 또한, 도 35는 동영상을 본 이후의 앙케이트의 결과와 눈 깜박임의 횟수의 관계를 나타내는 그래프이다. 도 35에 나타낸 바와 같이, 동영상에 대한 관심 정도와 눈 깜박임의 횟수의 사이에 상관은 확인할 수 없었다.
다음으로, 전술한 지표 산출 처리를 이용해서 피험자 상호 간의 눈 깜박임 타이밍 차이에 기초하여 평가값을 산출했다. 즉, 59명의 피험자 중에서 2명의 사용자를 선택하고, 선택한 2명의 사용자의 눈 깜박임 타이밍 차이를 산출해서 평가값을 산출하는 처리를, 모든 사용자의 조합(즉 59C2 가지)에 대해서 행하고, 나아가 그 평균값을 산출했다. 한편, 랜덤 데이터는 1000가지로 했다.
도 36은 본 검증과 관련된 평가값의 산출 결과를 나타내는 그래프이다. 도 36에 나타내는 그래프에 있어서 가로축은 타이밍 차이에 대응하고 세로축은 평가값에 대응한다. 타이밍 차이는 여기에서는 빈의 값에 의해 나타낸다. 도 36에는 빈 번호의 시간폭을 150ms, 200ms, 250ms, 300ms, 500ms로 한 그래프가 각각 나타나 있다. 도 36에 나타낸 바와 같이, 빈 번호의 시간폭을 150ms, 200ms, 250ms, 300ms, 500ms 중 어느 것으로 한 경우에도, 눈 깜박임 타이밍 차이가 0으로 취급되는 빈 번호 '7'에 있어서 출현 빈도가 국소적으로 높아지는 것을 확인할 수 있었다.
도 37은 관심이 있는 대상이 다른 피험자마다 각 동영상을 봤을 때의 평가값을 산출한 결과를 나타내는 그래프이다. 도 37에 나타내는 그래프에서 가로축은 동영상에 대응하고 세로축은 평가값에 대응한다. 도 37에 나타낸 바와 같이 장기, 축구, 아이돌 가수 A 각각에 대해서, 자신이 관심이 있는 대상에 대한 동영상을 관찰하고 있을 때, 평가값이 높아져 있다는 것을 알 수 있다.
도 38은 모든 피험자에 대해서, 각 동영상을 본 이후의 앙케이트 결과와 평가값의 관계를 나타낸 그래프이다. 도 38에 나타내는 그래프에 있어서 가로축은 타이밍 차이(빈의 값)에 대응하고 세로축은 평가값에 대응한다. 도 38에 나타낸 바와 같이 동영상을 재미있다고 느낀 피험자가, 지루하다고 느낀 피험자보다 평가값의 상승의 정도가 크다는 것을 알 수 있다.
도 39는 동영상을 본 이후의 감상과 평가값의 관계를 나타내는 그래프이다. 도 39에 나타내는 그래프에 있어서, 가로축은 관심 정도에 대응하고 세로축은 평가값에 대응한다. 관심 정도는 수치가 클수록 동영상을 재미있다고 느꼈다는 것을 의미한다. 도 39에 나타내는 'r'은 상관 계수, 'p'는 확률이다. 여기에서는 각 피험자에 대해서 해당 피험자와 다른 모든 피험자의 2명을 선택해서 평가값을 각각 산출하고, 산출한 평가값의 평균값을 해당 피험자의 평가값으로 하고 있다. 이 평가값에 있어서도, 동영상에 관심이 있는 피험자가 많을수록 높은 값을 나타내게 된다. 도 39에 나타내는 그래프로부터도 동영상을 재미있다고 하는 인상을 가진 피험자일수록 평가값이 높은 경향을 나타내고 있다는 것을 알 수 있다.
이상의 검증에 의해, 본건 발명자들은 복수의 사용자의 눈 깜박임 타이밍 차이에 따른 평가값이 동영상에 대한 관심의 정도의 지표가 된다는 지견을 획득했다.
<제 4 실시예의 변형예>
(1) 산출부(1112)는 복수의 사용자를 소정의 규칙에 따라 분류한 그룹마다 평가값을 산출해도 된다. 해당 규칙은 평가값을 산출하는 사용자의 조합을 규정하는 규칙으로 예를 들어, 사용자 속성이다. 사용자 속성은 예를 들어, 사용자의 성별, 연령, 취미, 좋아하는 동영상 장르 또는 이들의 조합이다. 사용자 속성은 이들 이외의 사용자의 속성이어도 된다. 사용자 속성은 미리 서버 장치(1010)에 등록되어 기억부(1013)에 기억되어 있어도 된다. 또한, 단말 장치(1020)의 사용자가, 사용자 인터페이스(1022)를 조작해서 사용자 속성을 입력하고, 기억부(1024)에 기억시켜 둔다. 그리고, 송신부(1212)는 눈 깜박임 데이터와 대응지어서 사용자 속성을 서버 장치(1010)에 송신해도 된다.
출력부(1113)는 또한 그룹마다 평가값에 따른 데이터를 출력해도 된다. 출력부(1113)는 예를 들어, 사용자 속성마다 평가값에 따른 데이터를 출력해도 된다. 도 40은 이 변형예의 단계 S17에서 출력되는 데이터의 일 예를 나타내는 도면이다. 여기에서는 출력부(1113)는 사용자 속성마다 시각과 관련지은 평가값을 출력한다. 이 예에서는 출력부(1113)는 가로축을 시각에 대응시키고 세로축을 평가값에 대응시켜서 평가값의 시간적인 변화를 나타낸 그래프(G1~G3)를 생성한다. 그래프 G1는 예를 들어 '속성 1'에 속하는 사용자의 평가값, 그래프 G2는 예를 들어 '속성 2'에 속하는 사용자의 평가값, 그래프 G3는 예를 들어 '속성 3'에 속하는 사용자의 평가값을 나타내고 있다. 이로써, 사용자 속성마다 동영상의 관찰 중의 평가값의 시간적인 변화를 파악할 수 있다.
(2) 출력부(1113)는 평가값이 소정의 조건을 만족하는 동영상을 특정하는 데이터를 출력해도 된다. 출력부(1113)는 예를 들어, 많은 사용자의 관심 정도가 높은 동영상을 특정하는 데이터를 출력해도 된다. 이 경우의 소정의 조건은 예를 들어, 평가값이 임계값을 넘는 것 또는 복수의 동영상 중에서 평가값이 최대인 것이다. 출력부(1113)는 동영상 중, 평가값이 소정의 조건을 만족하는 기간을 특정하는 데이터를 출력해도 된다. 이 경우의 소정의 조건은 예를 들어, 평가값이 임계값을 넘은 것 또는 복수의 동영상 중에서 평가값이 최대인 것이다.
[제 5 실시예]
제 5 실시예는 본 개시와 관련된 데이터 처리 시스템을 영상 강의를 행하는 데이터 처리 시스템에 적용한 경우를 설명한다.
도 41은 데이터 처리 시스템(1001A)의 전체 구성을 나타내는 도면이다. 데이터 처리 시스템(1001A)은 서버 장치(1010A)와 복수의 단말 장치(1020A)를 갖는다. 서버 장치(1010A)는 학교의 수업 등의 강의에 관한 동영상을 배포함과 아울러, 복수의 단말 장치(1020A) 각각으로부터 사용자(즉, 수강생)의 눈 깜박임 타이밍을 나타내는 데이터를 취득하고, 취득한 해당 데이터에 기초하여 동영상의 평가를 행한다. 서버 장치(1010A)는 예를 들어, 강의를 실시하는 사업자에 의해 관리, 운용된다. 서버 장치(1010A)는 복수의 단말 장치(1020A) 각각과 통신 회선(NW)을 통해서 통신한다.
복수의 단말 장치(1020A)는 영상 강의에 관련된 동영상을 보는 사용자에 의해 사용된다. 복수의 단말 장치(1020A) 각각은 사용자의 좌석(1040)에 미리 설치되어 있다. 단말 장치(1020A)는 동영상을 보고 있는 사용자의 눈 깜박임을 검출 가능한 위치에 마련된다. 도 22에는 복수의 단말 장치(1020A)는 단말 장치(1020A-1, 1020A-2, … , 1020A-N)(단, N는 2 이상의 자연수)가 나타나 있다. 설명의 편의를 위해서, 단말 장치(1020A-i)(단, 1≤i≤N)의 사용자를 이하에서는 '사용자(Ui)'라고 칭한다.
서버 장치(1010A) 및 단말 장치(1020A)의 하드웨어 구성은 각각 전술한 제 4 실시예의 서버 장치(1010) 및 단말 장치(1020)와 같아도 된다. 단, 서버 장치(1010A)의 기억부(1013)는 강의가 사전에 녹화해 둔 동영상을 재생해서 행해지는 경우에 해당 동영상을 나타내는 동영상 데이터를 기억해도 된다.
도 42는 데이터 처리 시스템(1001A)의 기능 구성을 나타내는 블록도이다. 서버 장치(1010A)의 제어부(1011)는 프로그램(1131)을 실행함으로써, 취득부(1111)와, 산출부(1112)와, 출력부(1113)와, 배포부(1114)에 상당하는 기능을 실현한다. 배포부(1114)는 통신부(1012)를 통해서 복수의 단말 장치(1020A) 각각에 동영상을 배포한다.
복수의 단말 장치(1020A) 각각의 제어부(1021)는 프로그램(1241)을 실행함으로써, 눈 깜박임 검출부(1211)와, 송신부(1212)와, 재생부(1213)에 상당하는 기능을 실현한다. 재생부(1213)는 통신부(1023)를 이용해서 서버 장치(1010A)로부터 동영상을 수신하고, 수신한 해당 동영상을 재생한다. 재생된 동영상은 사용자 인터페이스(1022)를 통해서 사용자에게 표시된다.
다음으로, 데이터 처리 시스템(1001A)의 동작을 설명한다. 도 43은 데이터 처리 시스템(1001A)에서 실행되는 처리를 나타내는 흐름도이다.
서버 장치(1010A)에 있어서 배포부(1114)는 영상 강의와 관련된 동영상의 배포를 개시한다(단계 S21). 단말 장치(1020A)에 있어서 재생부(1213)는 통신부(1023)를 이용해서 동영상을 수신하고, 수신한 해당 동영상의 재생을 개시한다(단계 S22). 눈 깜박임 검출부(1211)는 촬상부(1025)에 촬상을 개시시킨다(단계 S23). 눈 깜박임 검출부(1211)는 촬상 데이터에 기초하여 사용자의 눈 깜박임의 검출을 개시한다(단계 S24). 여기에서는 동영상의 재생 개시와 동시에 눈 깜박임의 검출이 개시되고 있지만, 동영상 재생 이전에 개시되어도 된다. 눈 깜박임의 검출 알고리즘은 전술한 제 4 실시예와 같아도 된다.
송신부(1212)는 눈 깜박임의 검출 결과에 기초하여 눈 깜박임 데이터를 통신부(1023)를 이용해서 서버 장치(1010A)에 송신한다(단계 S25). 눈 깜박임 데이터의 송신 타이밍은 구애되지 않는다. 송신 타이밍은 예를 들어, 사전 결정된 타이밍(예를 들어, 영상 강의의 종료 이후)이어도 되고, 서버 장치(1010A)로부터 요구가 있던 타이밍이어도 된다.
서버 장치(1010)에 있어서 취득부(1111)는 복수의 단말 장치(1020A) 각각으로부터 눈 깜박임 데이터를 취득한다(단계 S26). 산출부(1112)는 취득부(1111)가 취득한 눈 깜박임 데이터에 기초하여 지표 산출 처리를 행한다(단계 S27). 지표 산출 처리는 전술한 제 4 실시예와 같아도 된다.
출력부(1113)는 평가값에 따른 데이터를 생성해서 출력한다(단계 S28, S29). 출력부(1113)는 시각과 관련지은 평가값을 출력한다. 이 경우, 영상 강의 중에서 특히 관심을 모은 장면을 특정할 수가 있다. 또한, 출력부(1113)는 영상 강의의 전체 기간에 있어서의 평가값의 평균값을 출력해도 된다. 출력부(1113)는 평가값이 소정의 조건을 만족하는 장면(예를 들어, 평가값이 임계값 이상의 장면)을 추출한 동영상 데이터를 생성해서, 출력해도 된다. 이로써, 강의 내용의 분석이나 교재의 제작, 선정 등의 학교 운영에 유용하게 사용할 수가 있다. 또한, 출력부(1113)는 평가값에 기초하여 그 영상 강의를 담당한 강사의 평가값을 출력해도 된다. 이 경우, 출력부(1113)는 강사와 평가값을 관련지어서 출력해도 되고, 평가값에 따라서 강사가 순위를 매긴 것을 출력해도 된다.
한편, 본 실시예에 있어서, 강사와 사용자(U1~UN)가 같은 공간에서 강의를 행하는 경우, 제어부(1011)는 배포부(1114)에 상당하는 기능을 갖지 않아도 된다. 또한, 제어부(1021)는 재생부(1213)에 상당하는 기능을 갖지 않아도 된다.
평가값이 관심 정도의 지표가 되는 이유는 전술한 제 4 실시예에서도 설명했다. 나아가, 본건 발명자들은 시각 정보를 학원의 영상 강의와 관련된 동영상으로 해서 검증을 행했다. 이 검증에서는 86명의 고교생을 피험자로 해서 영상 강의에서 다루어지는 8 문제를 푸는 사전 테스트, 영상 강의와 관련된 동영상의 시청 및 사후 테스트를 순차적으로 실시했다. 사후 테스트는 사전 테스트로부터 숫자 등의 조건이 상이한 8 문제를 푸는 테스트이다.
도 44는 영상 강의에 있어서의 평가값을 나타내는 그래프이다. 도 44에 나타내는 그래프에 있어서, 가로축은 타이밍 차이에 대응하고 세로축은 평가값에 대응한다. 도 44에 나타낸 바와 같이, 대략 0.25초의 시간 범위 내의 타이밍 차이의 출현 빈도가 국소적으로 높아지는 것을 확인했다.
도 45는 문제마다의 평가값을 나타내는 그래프이다. 본건 발명자들은 출제되는 문제에 의해, 눈 깜박임 타이밍이 동기하며 약간 다르다는 것을 확인할 수 있었다.
도 46은 문제의 정답 오답의 변화와 평가값의 관계를 나타내는 그래프이다. 도 46에 나타낸 바와 같이, 본건 발명자들은 문제의 정답율 및 이해도와 평가값의 사이에 상관은 확인할 수 없었다.
도 47은 문제의 정답 오답과 평가값의 관계를 나타내는 그래프이다. 도 47에 나타낸 바와 같이, 사전 테스트의 전후에 정답인 피험자(0→0), 사후 테스트만 정답인 피험자(×→0), 사전 테스트 및 사후 테스트 모두 오답인 피험자(×→×)의 순서로 평가값이 높다. 사후 테스트에서 정답인 피험자는 오답인 피험자보다 관심을 갖고 영상 강의를 받았다고 생각된다. 따라서, 동영상에 대한 관심 정도가 높을수록 평가값이 높은 경향을 나타낸다고 추측할 수 있다.
[제 6 실시예]
제 6 실시예는 본 개시와 관련된 데이터 처리 시스템의 단말 장치가 텔레비젼 방송과 관련된 동영상을 재생하는 경우를 설명한다.
데이터 처리 시스템(1001B)의 전체 구성은 전술한 제 4 실시예의 데이터 처리 시스템(1001)과 같다. 단, 데이터 처리 시스템(1001B)는 서버 장치(1010B)와 복수의 단말 장치(1020B)를 구비한다. 서버 장치(1010B) 및 단말 장치(1020B)의 하드웨어 구성은 각각 전술한 제 4 실시예의 서버 장치(1010)및 단말 장치(1020)과 같아도 된다.
도 48은 데이터 처리 시스템(1001B)의 기능 구성을 나타내는 블록도이다. 서버 장치(1010B)의 제어부(1011)는 프로그램(1131)을 실행함으로써, 취득부(1111)와, 산출부(1112)와, 출력부(1113)에 상당하는 기능을 실현한다.
복수의 단말 장치(1020B) 각각의 제어부(1021)는 프로그램(1241)을 실행함으로써, 눈 깜박임 검출부(1211)과, 송신부(1212)와, 재생부(1214)에 상당하는 기능을 실현한다. 재생부(1214)는 통신부(1023)를 통해서 수신된 방송 신호에 기초하여 텔레비젼 방송과 관련된 동영상을 재생한다. 재생된 동영상은 사용자 인터페이스(1022)를 통해서 사용자에게 표시된다.
다음으로, 데이터 처리 시스템(1001)의 동작을 설명한다. 도 49는 데이터 처리 시스템(1001B)에서 실행되는 처리를 나타내는 흐름도이다.
단말 장치(1020B)에서 재생부(1214)는 통신부(1023)를 이용해서 방송 신호를 수신하고 수신한 해당 방송 신호에 기초하여 동영상의 재생을 개시한다(단계 S31). 눈 깜박임 검출부(1211)는 촬상부(1025)에 사용자의 눈을 촬상시키고, 촬상 데이터에 기초하여 사용자의 눈 깜박임을 검출한다(단계 S11, S12). 여기서는 동영상의 재생 개시와 동시에 눈 깜박임의 검출이 개시되고 있지만, 동영상의 재생 이전에 개시되어도 된다. 눈 깜박임의 검출의 알고리즘은 전술한 제 4 실시예와 같아도 된다.
송신부(1212)는 사용자의 눈 깜박임 타이밍을 나타내는 눈 깜박임 데이터를, 통신부(1023)를 이용해서, 서버 장치(1010B)에 송신한다(단계 S32). 송신부(1212)는 또한 눈 깜박임 데이터와 대응지어서 동영상 특정 정보를 서버 장치(1010B)에 송신 해도 된다. 눈 깜박임 데이터의 송신 타이밍은 구애되지 않는다. 송신 타이밍은 예를 들어, 사전 결정된 타이밍(예를 들어, TV 프로그램 종료 이후)이어도 되고, 서버 장치(1010B)로부터 요구가 있던 타이밍이어도 된다.
서버 장치(1010B)에서 취득부(1111)는 복수의 단말 장치(1020B) 각각으로부터 눈 깜박임 데이터를 취득한다(단계 S14). 산출부(1112)는 취득부(1111)가 취득한 눈 깜박임 데이터에 기초하여 지표 산출 처리를 행한다(단계 S15). 지표 산출 처리는 전술한 제 4 실시예와 같아도 된다. 취득부(1111)는 단말 장치(1020)가 동영상 특정 정보를 송신한 경우에는 해당 동영상 특정 정보를 더 취득한다. 또한, 산출부(1112)는 눈 깜박임 데이터에 더해서, 동영상 특정 정보에 기초하여, 지표 산출 처리를 행해도 된다. 출력부(1113)는 평가값에 따른 데이터를 생성해서 출력한다(단계 S16, S17).
[제 7 실시예]
전술한 제 4 내지 6 실시예에서는, 시각 정보는 동영상이었다. 이에 반해서 본 실시예의 시각 정보는 외부 세계(外界)의 시각 정보이다. 시각 정보는 예를 들어, 광고나 교통 표지 등의 설치물이다. 이러한 외부 세계의 시각 정보에 대한 관심의 정도를 추정하는 것에도 본 개시의 데이터 처리 시스템을 적용할 수 있다.
도 50은 데이터 처리 시스템(1001C)의 전체 구성을 나타내는 도면이다. 데이터 처리 시스템(1001C)는 서버 장치(1010C)와 복수의 단말 장치(1020C)를 가진다. 단말 장치(1020C)는 예를 들어 차량 탑재 기기로, 본 실시예에서는 차량(1050)에 설치되어 있다. 단말 장치(1020C)는 카 내비게이션 시스템 등의 차량 탑재 기기와 일체로 되어 있어도 된다. 차량(1050)은 여기에서는 4륜차(예를 들어 자동차)이지만, 이륜차(예를 들어 오토바이) 또는 그 외의 차량이어도 된다. 단말 장치(1020C)는 사용자(예를 들어, 드라이버)의 눈 깜박임을 검출 가능한 위치에 설치된다. 도 50에는, 복수의 단말 장치(1020C)로서 단말 장치(1020C-1, 1020C-2, … , 1020C-N)(단, N는 2 이상의 자연수)가 나타나 있다. 설명의 편의를 위해서 단말 장치(1020C-i)(단, 1≤i≤N)의 사용자를 이하에서는 '사용자(Ui)'라고 칭한다.
서버 장치(1010C)의 하드웨어 구성은 전술한 제 4 실시예의 서버 장치(1010)와 같아도 된다.
도 51은 단말 장치(1020C)의 하드웨어 구성을 나타내는 블록도이다. 단말 장치(1020C)는 측위부(1026)를 가진다는 점에서 전술한 제 4 실시예의 단말 장치(1020)와 상위하다. 측위부(1026)는 단말 장치(1020C)의 위치를 측정해서, 위치 정보를 생성한다. 측위부(1026)는 예를 들어 GPS(Global Positioning System) 방식으로 측위하기 위한 수신 회로 및 안테나를 구비한다. 이 경우, 측위부(1026)는 위도 정보 및 경도 정보를 포함한 위치 정보를 생성한다. 다만, 측위부(1026)는 기지국 측위 등 GPS 이외 방법으로 측위해도 된다.
도 52는 데이터 처리 시스템(1001C)의 기능 구성을 나타내는 블록도이다. 서버 장치(1010C)의 제어부(1011)는 프로그램(1131)을 실행함으로써, 취득부(1111)와, 산출부(1112)와, 출력부(1113)에 상당하는 기능을 실현한다. 복수의 단말 장치(1020C) 각각의 제어부(1021)는 프로그램(1241)을 실행함으로써 눈 깜박임 검출부(1211)와, 송신부(1212)에 상당하는 기능을 실현한다. 송신부(1212)는 눈 깜박임 타이밍을 나타내는 눈 깜박임 데이터와, 그 눈 깜박임이 검출되었을 때의 단말 장치(1020C)의 위치를 나타내는 위치 정보를 서버 장치(1010C)에 송신한다. 산출부(1112)는 복수의 사용자가 눈 깜박임을 한 위치마다 평가값을 산출한다. 출력부(1113)는 위치와 대응지어서 평가값에 따른 데이터를 출력한다.
다음으로, 데이터 처리 시스템(1001C)의 동작을 설명한다. 도 53은 데이터 처리 시스템(1001C)에서 실행되는 처리를 나타내는 흐름도이다.
측위부(1026)는 측위를 개시한다(단계 S41). 눈 깜박임 검출부(1211)는 촬상부(1025)에 촬상을 행하게 하고, 사용자의 눈 깜박임의 검출을 행한다(단계 S42, S43). 눈 깜박임 검출부(1211)는 예를 들어, 차량(1050)의 주행 중에 또는 카 내비게이션(car navigation) 장치의 이용 중에, 사용자의 눈 깜박임의 검출을 행한다.
송신부(1212)는 측위부(1026)에 의해 생성된 위치 정보와 사용자의 눈 깜박임 타이밍을 나타내는 눈 깜박임 데이터를 대응시켜서, 통신부(1023)를 이용해서 서버 장치(1010C)에 송신한다(단계 S44). 이 눈 깜박임 데이터는 예를 들어, 어느 영역에 단말 장치(1020C)(즉, 차량(1050))가 진입한 시각을 개시 시점으로 한 시간축 상에서의 눈 깜박임 타이밍을 나타낸다. 위치 정보 및 눈 깜박임 데이터의 송신 타이밍은 구애되지 않는다. 송신 타이밍은 예를 들어, 사전 결정된 타이밍(예를 들어, 소정 기간마다)이어도 되고 서버 장치(1010C)로부터 요구가 있던 타이밍이어도 된다.
서버 장치(1010C)에서 취득부(1111)는 복수의 단말 장치(1020C) 각각으로부터 위치 정보와 눈 깜박임 데이터를 취득한다(단계 S45). 산출부(1112)는 취득부(1111)가 취득한 눈 깜박임 데이터에 기초하여 지표 산출 처리를 행한다(단계 S46). 본 실시예에서는 산출부(1112)는 위치에 따른 복수의 사용자의 눈 깜박임 타이밍의 차이에 기초하여 평가값을 산출한다.
도 54는 데이터 처리 시스템(1001C)에서 실행되는 처리를 설명하는 도면이다. 도 54에 나타낸 바와 같이, 산출부(1112)는 예를 들어, 소정의 영역(Y) 내에 있는 복수의 사용자의 눈 깜박임의 검출 결과에 기초하여 평가값을 산출한다. 이로써, 영역(Y)으로부터 관찰할 수 있는 영역(Y1) 내에 사용자의 관심의 정도가 높은 시각 정보가 존재하는지, 또는 그 관심의 정도를 평가할 수 있다. 영역(Y, Y1)의 위치 및 범위는 사전에 결정되어도 된다. 영역(Y)은 어느 사용자의 위치를 기준으로 해서 결정되어도 된다.
출력부(1113)는 평가값에 따른 데이터를 생성해서 출력한다(단계 S47, S48). 도 55에 나타낸 바와 같이, 출력부(1113)는 예를 들어, 위치 정보와 평가값을 관련지은 데이터(DO)를 출력한다. 이 결과에 따라, 차량(1050)의 승차중에 사용자의 관심을 끄는 시각 정보가 존재하는 위치를 파악할 수가 있다. 예를 들어, 간판 B에 대한 관심 정도가 높은 경우에, 그 영역(Y) 내의 위치를 나타내는 위치 정보에 대응지어지는 평가값이 높아진다. 따라서, 간판 B에 의한 광고 효과를 정량적으로 파악할 수 있다. 또한, 평가값이 높은 위치에는 통행에 지장을 주는 원인이 있을 가능성이 있으므로, 해당 평가값을 그 원인의 파악에도 이용할 수 있다. 광고나 교통 표지를 관찰할 수 있는 영역에서 평가값이 낮은 경우, 설치 장소의 재검토에 이용할 수도 있다. 또한, 출력부(1113)는 위치 정보와 평가값에 따른 정보를, 차량(1050)의 승무원(여기서는 운전자)인 사용자에게 제공해도 된다. 예를 들어, 출력부(1113)는 차량(1050)의 위치를 나타내는 위치 정보와 평가값을 매겨서 기억부(1013)에 기억시킨다. 그리고, 출력부(1113)는 기억부(1013)에 축적된 평가값과 위치 정보의 대응 관계에 기초하여 복수의 사용자의 관심을 끄는 대상을 특정하고 그 대상에 따른 정보를 단말 장치(1020C)에 송신한다. 이 경우에 있어서, 출력부(1113)는 그 대상에 따른 위치에 존재하는 차량(1050)의 단말 장치(1020C)를 송신처로서 특정해도 된다. 예를 들어, 복수의 사용자가 같은 점포(예를 들어, 편의점)에 주목하고 있다는 것이 판명된 경우 출력부(1113)는 그 점포에 관한 정보(예를 들어, 점포 정보 및 쿠폰으로 예시되는 컨텐츠)를 그 점포 부근에 존재하는 차량(1050)의 단말 장치(1020C)에 송신한다. 이로써, 복수의 사용자의 관심을 끄는 대상에 관한 정보를 다른 사용자와도 공유할 수 있다.
산출부(1112)는 복수의 사용자의 눈 깜박임 데이터와 해당 복수의 사용자의 시선의 방향에 기초하여, 평가값의 계산에 이용하는 사용자의 그룹을 생성해도 된다. 제어부(1011)는 예를 들어, 촬상부(1025)의 촬상 데이터에 기초하여, 사용자의 시선 방향을 검출한다. 위치 및 시선의 방향이 일치하거나 또는 유사한 복수의 사용자는 같은 시각 정보를 관찰하고 있을 가능성이 있다. 따라서, 눈 깜박임 데이터 및 시선 방향을 함께 이용함으로써, 같은 시각 정보를 관찰하는 복수의 사용자가 같은 그룹으로 분류되기 쉬워진다. 이로써, 도 56에 나타낸 바와 같이, 영역(Y1)보다 좁은 영역(Y2) 내에 사용자의 관심을 끄는 시각 정보가 존재한다고 추측할 수 있다.
[변형예]
본 발명은 상기의 실시예로 한정되는 것은 아니고, 취지를 벗어나지 않는 범위에서 적당하게 변경하는 것이 가능하다. 이하의 변형예는 특별히 언급하지 않는 한 제 5 내지 제 7 실시예의 구성에도 적용할 수가 있다.
(1) 시각 정보는 동영상이 아니어도 된다. 시각 정보는 예를 들어, 뉴스의 기사 등의 문자, 도형, 사진 등의, 시각을 통해서 인식할 수 있는 정보를 포함한 컨텐츠이어도 된다. 이 경우의 시각 정보는 예를 들어, 사용자의 조작에 따라서 시각을 통해서 인식할 수 있는 정보가 변화된다. 이 변형예에 있어서, 산출부(1112)는 단말 장치(1020)에 표시되고 있는 시각 정보와 그 시각 정보의 표시 중에 검출된 눈 깜박임에 기초하여, 산출부(1112)는 시각 정보에 대한 평가값을 산출한다. 이로써, 컨텐츠 프로바이더가 평가값에 기초하여 컨텐츠에 대한 관심의 정도를 파악할 수가 있다.
(2) 사용자가, 촬상부(1025)에 의해 촬상되고 있는 것에 거부감을 느끼는 경우가 있다. 여기서, 사용자에 의해 촬상부(1025)가 시인되는 것을 방해하는 부재가 마련되어도 된다. 도 57은 이 변형예와 관련된 촬상부(1025)를 정면에서 본 모식도이다. 이 예에서는 촬상부(1025)에 마련된 촬상 렌즈(1251)를 덮듯이 매직 미러(1060)가 마련되어 있다. 매직 미러(1060)는 사용자 측으로부터 촬상 렌즈(1251)로는 광을 투과시키지만, 촬상 렌즈(1251) 측으로부터 사용자 측으로는 광을 투과시키지 않는 부재이다. 이로써, 사용자의 거부감이 경감된다.
(3) 전술한 실시예에서는 촬상부(1025)의 촬상 데이터에 기초하여 눈 깜박임을 검출하고 있었지만, 이외의 방법이 이용되어도 된다. 도 58에 나타낸 바와 같이, 예를 들어 단말 장치(1020)는 촬상부(1025) 대신, 전파 센서(예를 들어, 4GHz 전파 센서 모듈), 적외선 센서, 도플러 센서 등의 비접촉의 센서(1027)를 이용해서 눈 깜박임을 검출해도 된다. 한편, 단말 장치(1020)가 안경형의 웨어러블 컴퓨터 등의, 사용자의 얼굴 또는 머리 부분에 설치되는 단말 장치인 경우, 센서(1027)는 근력의 움직임 등에 기초하여 눈 깜박임을 검출하는 센서여도 된다.
(4) 전술한 실시예에서는 단말 장치(1020)가 눈 깜박임을 검출하고 있었지만, 서버 장치(1010)에서 실행되어도 된다. 도 59는 이 변형예와 관련된 데이터 처리 시스템의 기능 구성을 나타내는 블록도이다. 단말 장치(1020)에서 송신부(1212)는 촬상부(1025)의 촬상 데이터를, 통신부(1023)를 이용해서 서버 장치(1010)에 송신한다. 서버 장치(1010)에서 제어부(1011)는 취득부(1111)와, 눈 깜박임 검출부(1115)와, 산출부(1112)와, 출력부(1113)에 상당하는 기능을 실현한다. 취득부(1111)는 단말 장치(1020)로부터 촬상 데이터를 취득한다. 이 촬상 데이터는 사용자의 눈 깜박임 타이밍을 나타내는 데이터이다. 눈 깜박임 검출부(1115)는 취득부(1111)가 취득한 촬상 데이터에 기초하여 사용자의 눈 깜박임을 검출한다.
도 60은 데이터 처리 시스템(1001)에서 실행되는 처리를 나타내는 흐름도이다. 단말 장치(1020)에서 송신부(1212)는 촬상에 의해 획득한 촬상 데이터를, 통신부(1023)를 이용해서 서버 장치(1010)로 송신한다(단계 S11, S51). 서버 장치(1010)에서 취득부(1111)는 사용자의 눈 깜박임 타이밍을 나타내는 데이터로서 촬상 데이터를 취득한다(단계 S52). 눈 깜박임 검출부(1115)는 취득한 촬상 데이터에 기초하여 사용자의 눈 깜박임을 검출한다(단계 S53). 산출부(1112)는 눈 깜박임 검출부(1115)의 검출 결과에 따른 눈 깜박임 데이터에 기초하여 지표 산출 처리를 행한다(단계 S15). 출력부(1113)는 산출된 평가값에 따른 데이터를 생성해서 출력한다(단계 S16, S17).
이상 설명한 바와 같이, 취득부(1111)가 취득하는 사용자의 눈 깜박임 타이밍을 나타내는 데이터는 전술한 눈 깜박임 데이터이어도 되고, 촬상 데이터로 예시되는 눈 깜박임 데이터를 특정하기 위한 데이터이어도 된다.
(5) 전술한 실시예의 산출부(1112)의 평가값의 산출 방법은 일 예에 지나지 않는다. 산출부(1112)는 예를 들어, 시계열로 눈 깜박임의 횟수를 계수하고, 특정의 기간(장면)에 있어서의 눈 깜박임의 횟수에 기초하여 평가값을 산출해도 된다. 이 경우, 산출부(1112)는 복수의 사용자의 눈 깜박임의 횟수가 많은 기간일수록, 시각 정보에 대한 관심의 정도가 높다는 것을 나타내는 평가값을 산출한다. 복수의 사용자의 눈 깜박임의 횟수가 많은 기간은 그 이외의 기간보다, 눈 깜박임 타이밍 차이가 작다고 생각되기 때문이다.
요컨데, 본 개시와 관련된 데이터 처리 장치는 도 61에 나타낸 바와 같이, 사용자의 눈 깜박임 타이밍을 나타내는 데이터를 취득하는 취득부(1101)와, 복수의 사용자의 상기 눈 깜박임 타이밍의 차이에 기초하여 상기 복수의 사용자의 눈 깜박임 타이밍의 일치 정도에 따른 지표를 산출하는 산출부(1102)와, 상기 지표에 따른 데이터를 출력하는 출력부(1103)를 구비하고 있으면 된다.
(6) 서버 장치(1010, 1010A, 1010B, 1010C)의 제어부(1011), 및 단말 장치(1020, 1020A, 1020B, 1020C)가 실현하는 기능은 복수의 프로그램의 조합에 의해 실현되거나 또는 복수의 하드웨어 자원의 연계에 의해 실현될 수도 있다. 제어부(1011 또는 1021)의 기능이 프로그램을 이용해서 실현되는 경우, 이 기능을 실현하기 위한 프로그램(1131 또는 1241)이, 각종 자기 기록 매체, 광기록 매체, 광자기 기록 매체, 반도체 메모리 등의 컴퓨터 판독 가능한 기록 매체에 기억된 상태로 제공되어도 된다. 또한, 이 프로그램은 네트워크를 통해서 배포되어도 된다. 또한, 본 발명은 데이터 처리 방법으로서도 파악할 수 있다.
10, 10A : 대화 장치, 11 : 제어부, 12 : 음성 입력부, 13 : 음성 출력부, 14 : 기억부, 15 : 촬상부, 16 : 표시부, 20 : 오브젝트, 101 : 얼부, 102 : 눈꺼풀부, 111, 111A : 눈 깜박임 동작 제어부, 112 : 제 1 취득부, 113 : 눈 깜박임 검출부, 114 : 제 2 취득부, 115 : 처리부, 116 : 환경 정보 취득부, 117 : 기억 제어부, 141, 141A : 프로그램, 142 : 대화 데이터, 143 : 학습 데이터, 161 : 표시 영역, 201 : 얼굴부, 202 : 눈꺼풀부, 301 : 눈 깜박임 동작 제어부, 302 : 취득부, 303 : 처리부, 1001, 1001A, 1001B, 1001C : 데이터 처리 시스템, 1010, 1010A, 1010B, 1010C : 서버 장치, 1011 : 제어부, 1012 : 통신부, 1013 : 기억부, 1020, 1020A, 1020B, 1020C : 단말 장치, 1021 : 제어부, 1022 : 사용자 인터페이스, 1023 : 통신부, 1024 : 기억부, 1025 : 촬상부, 1026 : 측위부, 1030 : 동영상 재생 장치, 1040 : 좌석, 1050 : 차량, 1060 : 매직 미러, 1101 : 취득부, 1102 : 산출부, 1103 : 출력부, 1111 : 취득부, 1112 : 산출부, 1113 : 출력부, 1114 : 배포부, 1115 : 눈 깜박임 검출부, 1131 : 프로그램, 1211 : 눈 깜박임 검출부, 1212 : 송신부, 1213 : 재생부, 1214 : 재생부, 1241 : 프로그램, 1251 : 촬상 렌즈

Claims (30)

  1. 대화 장치의 눈 깜박임 동작의 타이밍을 취득하는 제 1 취득부와,
    상기 대화 장치의 사용자의 눈 깜박임 타이밍을 취득하는 제 2 취득부와,
    상기 눈 깜박임 동작의 타이밍과 상기 사용자의 눈 깜박임 타이밍의 차이에 따른 처리를 행하는 처리부
    를 구비하는 처리 장치.
  2. 제 1 항에 있어서,
    상기 처리부는, 상기 차이에 기초하는 지표값에 따른 처리를 행하는,
    처리 장치.
  3. 제 1 항에 있어서,
    상기 처리부는,
    상기 사용자의 눈 깜박임 타이밍이, 상기 눈 깜박임 동작의 타이밍에 따른 소정 기간 내에 포함되는 정도에 따른 처리를 행하는,
    처리 장치.
  4. 제 3 항에 있어서,
    상기 소정 기간은, 상기 눈 깜박임 동작의 타이밍으로부터 500밀리초 이하의 시점을 포함하는,
    처리 장치.
  5. 제 3 항에 있어서,
    상기 처리부는, 소정의 시간축 상에 시각순으로 나열한 상기 사용자의 눈 깜박임 타이밍과 상기 눈 깜박임 동작의 타이밍의 차이와, 상기 시간축 상에서 상기 사용자의 눈 깜박임 및 상기 눈 깜박임 동작 중 적어도 하나의 간격의 순서를 변경한 경우의 상기 사용자의 눈 깜박임 타이밍과 상기 눈 깜박임 동작의 타이밍의 차이에 따른 상기 처리를 행하는,
    처리 장치.
  6. 제 1 항에 있어서,
    상기 처리부는, 상기 대화 장치에 상기 차이에 따른 대화 처리를 행하게 하는,
    처리 장치.
  7. 제 1 항에 있어서,
    상기 처리부는, 상기 대화 장치의 식별자와 대응지어서 상기 차이에 따른 평가 데이터를 출력하는,
    처리 장치.
  8. 제 1 항에 있어서,
    상기 대화 장치의 주변의 환경을 나타내는 환경 정보를 취득하는 환경 정보 취득부와.
    상기 환경 정보에 따른 제 1 타이밍에, 상기 대화 장치에 눈 깜박임 동작을 행하게 하는 눈 깜박임 동작 제어부
    를 구비하는 처리 장치.
  9. 제 8 항에 있어서,
    상기 사용자가 눈 깜박임을 하는 타이밍과 상기 환경을 대응지은 데이터를 기억 장치에 축적시키는 기억 제어부를 갖고,
    상기 눈 깜박임 동작 제어부는, 상기 제 1 타이밍을, 상기 기억 장치에 축적된 데이터와 상기 환경 정보에 따른 타이밍으로 하는,
    처리 장치.
  10. 제 9 항에 있어서,
    상기 눈 깜박임 동작 제어부는, 상기 제 1 타이밍과는 다른 제 2 타이밍에서 상기 대화 장치에 눈 깜박임 동작을 더 행하게 하는,
    처리 장치.
  11. 제 1 항에 있어서,
    눈의 눈꺼풀에 상당하는 눈꺼풀부와,
    상기 눈꺼풀부를 개폐시킴으로써, 상기 눈꺼풀부의 눈 깜박임 동작을 제어하는 눈 깜박임 동작 제어부
    를 갖고,
    상기 제 1 취득부는, 상기 눈꺼풀부의 눈 깜박임 동작의 타이밍을 취득하는,
    처리 장치.
  12. 제 1 항에 있어서,
    표시부와,
    상기 표시부에 표시된 오브젝트의 눈 깜박임 동작을 제어하는 눈 깜박임 동작 제어부
    를 갖고,
    상기 제 1 취득부는, 상기 오브젝트의 눈 깜박임 동작의 타이밍을 취득하는,
    처리 장치.
  13. 대화 장치의 눈 깜박임 동작의 타이밍, 및 상기 대화 장치의 사용자의 눈 깜박임 타이밍을 취득하고,
    상기 눈 깜박임 동작의 타이밍과 상기 사용자의 눈 깜박임 타이밍의 차이에 따른 처리를 행하는,
    처리 방법.
  14. 컴퓨터로 하여금,
    대화 장치의 눈 깜박임 동작의 타이밍 및 상기 대화 장치의 사용자의 눈 깜박임 타이밍을 취득하고,
    상기 눈 깜박임 동작의 타이밍과 상기 사용자의 눈 깜박임 타이밍의 차이에 따른 처리를 행하는 기능을 실현하게 하기 위한
    프로그램.
  15. 사용자의 눈 깜박임 타이밍을 나타내는 데이터를 취득하는 취득부와,
    복수의 사용자의 상기 눈 깜박임 타이밍의 차이에 기초하여, 상기 복수의 사용자의 눈 깜박임 타이밍의 일치 정도에 따른 지표를 산출하는 산출부와,
    상기 지표에 따른 데이터를 출력하는 출력부
    를 구비하는 데이터 처리 장치.
  16. 제 15 항에 있어서,
    상기 산출부는, 상기 차이가 소정의 시간 범위 내에 포함되는 정도에 따른 상기 지표를 산출하는,
    데이터 처리 장치.
  17. 제 16 항에 있어서,
    상기 시간 범위는, 300밀리초 이하인,
    데이터 처리 장치.
  18. 제 16 항에 있어서,
    상기 복수의 사용자는, 제 1 사용자와 제 2 사용자를 포함하고,
    상기 산출부는, 소정의 시간축 상에 시각순으로 나열한 상기 제 1 사용자 및 상기 제 2 사용자의 눈 깜박임 타이밍의 차이와, 상기 시간축 상에서 상기 제 1 사용자 및 상기 제 2 사용자 중 적어도 하나의 사용자의 눈 깜박임의 간격의 순서를 변경한 경우의 상기 제 1 사용자 및 상기 제 2 사용자의 눈 깜박임 타이밍의 차이에 기초하여, 상기 지표를 산출하는,
    데이터 처리 장치.
  19. 제 16 항에 있어서,
    상기 지표는, Z값인, 데이터 처리 장치.
  20. 제 15 항에 있어서,
    상기 산출부는, 상기 복수의 사용자를 소정의 규칙에 따라 분류한 그룹별로 상기 지표를 산출하고,
    상기 출력부는, 상기 그룹별로 상기 지표에 따른 데이터를 출력하는,
    데이터 처리 장치.
  21. 제 15 항에 있어서,
    상기 산출부는, 소정의 기간을 복수의 단위 기간으로 구분하고, 해당 단위 기간별로 상기 지표를 산출하는,
    데이터 처리 장치.
  22. 제 21 항에 있어서,
    상기 출력부는, 상기 복수의 단위 기간 각각에 상기 지표를 대응지어서 출력하는,
    데이터 처리 장치.
  23. 제 15 항에 있어서,
    상기 산출부는, 상기 복수의 사용자가 소정의 시각 정보를 관찰하고 있는 기간을 특정하고, 특정한 해당 기간에서의 상기 눈 깜박임 타이밍의 차이에 기초하여 상기 지표를 산출하는,
    데이터 처리 장치.
  24. 제 23 항에 있어서,
    상기 시각 정보는, 동영상인, 데이터 처리 장치.
  25. 제 24 항에 있어서,
    상기 산출부는, 상기 복수의 사용자가 눈 깜박임을 한 위치별로, 상기 차이에 기초하여 상기 지표를 산출하고,
    상기 출력부는, 상기 위치와 대응지어서 상기 지표에 따른 데이터를 출력하는,
    데이터 처리 장치.
  26. 사용자의 눈 깜박임을 검출하는 눈 깜박임 검출부와,
    제 15 항에 기재된 데이터 처리 장치
    를 갖는 데이터 처리 시스템.
  27. 제 26 항에 있어서,
    복수의 단말 장치와,
    서버 장치
    를 구비하고,
    상기 복수의 단말 장치 각각은,
    상기 눈 깜박임 검출부와,
    자체 단말 장치의 사용자의 눈 깜박임 타이밍을 나타내는 데이터를 상기 서버 장치에 송신하는 송신부
    를 갖고,
    상기 서버 장치는, 상기 데이터 처리 장치를 갖는,
    데이터 처리 시스템.
  28. 제 27 항에 있어서,
    상기 복수의 단말 장치 각각은, 자체 단말 장치의 사용자의 눈을 촬상해서 촬상 데이터를 생성하는 촬상부를 갖고,
    상기 송신부는, 상기 촬상 데이터를 상기 서버 장치에 송신하는,
    데이터 처리 시스템.
  29. 사용자의 눈 깜박임 타이밍을 나타내는 데이터를 취득하고,
    복수의 사용자의 상기 눈 깜박임 타이밍의 차이에 기초하여 상기 복수의 사용자의 눈 깜박임 타이밍의 일치 정도에 따른 지표를 산출하는
    데이터 처리 방법.
  30. 컴퓨터로 하여금,
    사용자의 눈 깜박임 타이밍을 나타내는 데이터를 취득하고,
    복수의 사용자의 상기 눈 깜박임 타이밍의 차이에 기초하여, 상기 복수의 사용자의 눈 깜박임 타이밍의 일치 정도에 따른 지표를 산출하는 처리를 실행하게 하기 위한,
    프로그램.
KR1020207030046A 2018-03-22 2019-03-07 처리 장치, 처리 방법, 데이터 처리 장치, 데이터 처리 시스템, 데이터 처리 방법 및 프로그램 KR102516751B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JPJP-P-2018-055033 2018-03-22
JP2018055034A JP7023504B2 (ja) 2018-03-22 2018-03-22 処理装置、処理方法、及びプログラム
JP2018055033A JP7185892B2 (ja) 2018-03-22 2018-03-22 データ処理装置、データ処理システム、データ処理方法、及びプログラム
JPJP-P-2018-055034 2018-03-22
PCT/JP2019/009115 WO2019181537A1 (ja) 2018-03-22 2019-03-07 処理装置、処理方法、データ処理装置、データ処理システム、データ処理方法及びプログラム

Publications (2)

Publication Number Publication Date
KR20200135431A true KR20200135431A (ko) 2020-12-02
KR102516751B1 KR102516751B1 (ko) 2023-03-31

Family

ID=67986152

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207030046A KR102516751B1 (ko) 2018-03-22 2019-03-07 처리 장치, 처리 방법, 데이터 처리 장치, 데이터 처리 시스템, 데이터 처리 방법 및 프로그램

Country Status (4)

Country Link
US (1) US11983309B2 (ko)
KR (1) KR102516751B1 (ko)
CN (1) CN111886565B (ko)
WO (1) WO2019181537A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE545345C2 (en) * 2021-06-30 2023-07-11 Tobii Ab Method and system for alignment of data

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006020131A (ja) * 2004-07-02 2006-01-19 Nippon Telegr & Teleph Corp <Ntt> 関心度測定装置および関心度測定方法
KR100813668B1 (ko) * 2006-12-20 2008-03-14 한국생산기술연구원 안드로이드 로봇의 감정표현 방법
KR20080057400A (ko) * 2006-12-20 2008-06-25 한국생산기술연구원 인간형 로봇의 동작 및 표정 합성 장치 및 방법
KR20120124772A (ko) * 2011-05-04 2012-11-14 경북대학교 산학협력단 사용자 집중도 분석장치 및 방법
JP2017153887A (ja) * 2016-03-04 2017-09-07 株式会社東芝 心身状態推定装置、心身状態推定方法、およびアイウエア

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10207615A (ja) * 1997-01-22 1998-08-07 Tec Corp ネットワークシステム
JPH10293860A (ja) * 1997-02-24 1998-11-04 Nippon Telegr & Teleph Corp <Ntt> 音声駆動を用いた人物画像表示方法およびその装置
JP3526785B2 (ja) 1999-06-01 2004-05-17 インタロボット株式会社 意思伝達装置
JP4335642B2 (ja) 2003-11-10 2009-09-30 日本電信電話株式会社 視聴者反応情報収集方法と、視聴者反応情報収集システムで用いられるユーザ端末及び視聴者反応情報提供装置と、そのユーザ端末・視聴者反応情報提供装置の実現に用いられる視聴者反応情報作成用プログラム
JP4765070B2 (ja) 2004-09-27 2011-09-07 国立大学法人電気通信大学 キャラクタ情報処理方法及びキャラクタ情報処理装置
JP4207054B2 (ja) 2005-11-10 2009-01-14 セイコーエプソン株式会社 情報受信装置
JP4692533B2 (ja) 2005-11-10 2011-06-01 セイコーエプソン株式会社 情報受信装置
JP4127296B2 (ja) * 2006-06-09 2008-07-30 ソニー株式会社 撮像装置、および撮像装置制御方法、並びにコンピュータ・プログラム
GB2448883A (en) 2007-04-30 2008-11-05 Sony Comp Entertainment Europe Interactive toy and entertainment device
JP2009037050A (ja) 2007-08-02 2009-02-19 Toyota Motor Corp 対話装置と対話用プログラム
JP2009267445A (ja) 2008-04-21 2009-11-12 Toshiba Corp 嗜好性情報管理装置及び嗜好性情報管理方法
JP5639440B2 (ja) 2010-10-26 2014-12-10 日本放送協会 Cgキャラクタ制作装置及びcgキャラクタ制作プログラム
JP5771127B2 (ja) 2011-11-15 2015-08-26 日本放送協会 注目度推定装置およびそのプログラム
JP5982840B2 (ja) 2012-01-31 2016-08-31 富士通株式会社 対話装置、対話プログラムおよび対話方法
ES2751380T3 (es) * 2012-12-11 2020-03-31 Ami Klin Sistemas y métodos para detectar inhibición de parpadeo como marcador de cautivación y prominencia de estímulo percibido
US20140162230A1 (en) * 2012-12-12 2014-06-12 Aram Akopian Exercise demonstration devices and systems
CN103885589B (zh) * 2014-03-06 2017-01-25 华为技术有限公司 眼动追踪方法及装置
JP6555665B2 (ja) 2016-07-28 2019-08-07 日本電信電話株式会社 コミュニケーション装置および方法
US10537244B1 (en) * 2017-09-05 2020-01-21 Amazon Technologies, Inc. Using eye tracking to label computer vision datasets

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006020131A (ja) * 2004-07-02 2006-01-19 Nippon Telegr & Teleph Corp <Ntt> 関心度測定装置および関心度測定方法
KR100813668B1 (ko) * 2006-12-20 2008-03-14 한국생산기술연구원 안드로이드 로봇의 감정표현 방법
KR20080057400A (ko) * 2006-12-20 2008-06-25 한국생산기술연구원 인간형 로봇의 동작 및 표정 합성 장치 및 방법
KR20120124772A (ko) * 2011-05-04 2012-11-14 경북대학교 산학협력단 사용자 집중도 분석장치 및 방법
JP2017153887A (ja) * 2016-03-04 2017-09-07 株式会社東芝 心身状態推定装置、心身状態推定方法、およびアイウエア

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
비특허 문헌 1 : Tamami Nakano, Yoshiharu Yamamoto, Keiichi Kitajo, Toshimitsu Takahashi and Shigeru Kitazawa, "Synchronization of spontaneous eyeblinks while viewing video stories", Proceedings of the Royal Society B: Biological Sciences, 276(1673), p 3635 - 3644, [online], [2018년 3월 12일 검색], 인터넷 <URL:http://rspb.royalsocietypublishing.org/content/royprsb/early /2009/07/24/rspb. 2009.0828.full.pdf>, (2009년)

Also Published As

Publication number Publication date
KR102516751B1 (ko) 2023-03-31
CN111886565A (zh) 2020-11-03
US11983309B2 (en) 2024-05-14
US20210004078A1 (en) 2021-01-07
WO2019181537A1 (ja) 2019-09-26
CN111886565B (zh) 2024-06-14

Similar Documents

Publication Publication Date Title
US11887352B2 (en) Live streaming analytics within a shared digital environment
CN109074117B (zh) 提供基于情绪的认知助理系统、方法及计算器可读取媒体
CN109478097B (zh) 用于提供信息的方法和系统及计算机程序产品
JP7427611B2 (ja) ユーザの注意力を決定するコンピュータ実装システム及び方法
US20170238859A1 (en) Mental state data tagging and mood analysis for data collected from multiple sources
US8903176B2 (en) Systems and methods using observed emotional data
JP6424357B2 (ja) 視認対象効果度測定装置
US20160042648A1 (en) Emotion feedback based training and personalization system for aiding user performance in interactive presentations
US20170095192A1 (en) Mental state analysis using web servers
US20170374414A1 (en) System And Method For Media Experience Data
CN116484318B (zh) 一种演讲训练反馈方法、装置及存储介质
US10942563B2 (en) Prediction of the attention of an audience during a presentation
US11483618B2 (en) Methods and systems for improving user experience
US20160379505A1 (en) Mental state event signature usage
US20200350057A1 (en) Remote computing analysis for cognitive state data metrics
US20180027090A1 (en) Information processing device, information processing method, and program
JP7023504B2 (ja) 処理装置、処理方法、及びプログラム
KR102516751B1 (ko) 처리 장치, 처리 방법, 데이터 처리 장치, 데이터 처리 시스템, 데이터 처리 방법 및 프로그램
JP7317403B2 (ja) 処理装置、処理方法、及びプログラム
JP7185892B2 (ja) データ処理装置、データ処理システム、データ処理方法、及びプログラム
WO2022168185A1 (ja) ビデオセッション評価端末、ビデオセッション評価システム及びビデオセッション評価プログラム
US11995904B2 (en) Systems, devices, and/or processes for dynamic surface marking
WO2022168178A1 (ja) ビデオセッション評価端末、ビデオセッション評価システム及びビデオセッション評価プログラム
WO2022207145A1 (en) Systems, devices, and/or processes for dynamic surface marking
CN113853598A (zh) 人工智能信息处理装置及人工智能信息处理方法

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant