KR20230004754A - 공유된 청취 환경에서 청각 장애인을 위한 오디오 향상 - Google Patents

공유된 청취 환경에서 청각 장애인을 위한 오디오 향상 Download PDF

Info

Publication number
KR20230004754A
KR20230004754A KR1020227040839A KR20227040839A KR20230004754A KR 20230004754 A KR20230004754 A KR 20230004754A KR 1020227040839 A KR1020227040839 A KR 1020227040839A KR 20227040839 A KR20227040839 A KR 20227040839A KR 20230004754 A KR20230004754 A KR 20230004754A
Authority
KR
South Korea
Prior art keywords
audio
user
audio content
hearing
content
Prior art date
Application number
KR1020227040839A
Other languages
English (en)
Inventor
브랜트 캔들로어
마하르 네자트
피터 신타니
Original Assignee
소니그룹주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니그룹주식회사 filed Critical 소니그룹주식회사
Publication of KR20230004754A publication Critical patent/KR20230004754A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/103Detecting, measuring or recording devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
    • A61B5/11Measuring movement of the entire body or parts thereof, e.g. head or hand tremor, mobility of a limb
    • A61B5/1113Local tracking of patients, e.g. in a hospital or private home
    • A61B5/1114Tracking parts of the body
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/103Detecting, measuring or recording devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
    • A61B5/11Measuring movement of the entire body or parts thereof, e.g. head or hand tremor, mobility of a limb
    • A61B5/1126Measuring movement of the entire body or parts thereof, e.g. head or hand tremor, mobility of a limb using a particular sensing technique
    • A61B5/1128Measuring movement of the entire body or parts thereof, e.g. head or hand tremor, mobility of a limb using a particular sensing technique using image analysis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/12Audiometering
    • A61B5/121Audiometering evaluating hearing capacity
    • A61B5/123Audiometering evaluating hearing capacity subjective methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/55Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using an external connection, either wireless or wired
    • H04R25/554Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using an external connection, either wireless or wired using a wireless connection, e.g. between microphone and amplifier or using Tcoils
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/001Monitoring arrangements; Testing arrangements for loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/033Headphones for stereophonic communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/50Allocation or scheduling criteria for wireless resources
    • H04W72/54Allocation or scheduling criteria for wireless resources based on quality criteria
    • H04W72/543Allocation or scheduling criteria for wireless resources based on quality criteria based on requested quality, e.g. QoS
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2205/00Details of stereophonic arrangements covered by H04R5/00 but not provided for in any of its subgroups
    • H04R2205/041Adaptation of stereophonic signal reproduction for the hearing impaired
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/15Transducers incorporated in visual displaying devices, e.g. televisions, computer displays, laptops
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Veterinary Medicine (AREA)
  • Biophysics (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Surgery (AREA)
  • Molecular Biology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Otolaryngology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Radiology & Medical Imaging (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physiology (AREA)
  • Dentistry (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Neurosurgery (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)
  • Image Analysis (AREA)

Abstract

공유된 청취 환경에서 청각 장애가 있는 사용자들에 대한 오디오의 향상을 위한 전자 장치 및 방법이 제공된다. 전자 장치는 미디어 소스로부터 제1 오디오 콘텐츠를 수신하고 청각 장애가 있는 제1 사용자를 헤드마운트 오디오 디바이스의 착용자로서 검출한다. 전자 장치는 검출된 제1 사용자에 연관되는 오디오 향상 프로파일에 기초하여 제1 오디오 콘텐츠의 하나 이상의 특징들을 수정한다. 그 후, 전자 장치는 그 수정에 기초하여 제2 오디오 콘텐츠를 생성하고 생성된 제2 오디오 콘텐츠를 헤드마운트 오디오 디바이스와 공유한다.

Description

공유된 청취 환경에서 청각 장애인을 위한 오디오 향상
관련 출원들에 대한 교차참조/참조에 의한 포함
없음.
분야
본 개시의 다양한 실시예들은 장애가 있는 사람을 위한 보조 기술에 관한 것이다. 더 구체적으로, 본 개시의 다양한 실시예들은 공유된 청취 환경에서 청각 장애인을 위한 오디오의 향상을 위한 전자 장치에 관한 것이다.
미디어 디바이스들, 이를테면 텔레비전들은, 통상적으로 다양한 유형들의 오디오 디바이스들을 통해, 이를테면 내장 스피커들, 무선 스피커들, 또는 유선/무선 헤드폰들을 통해 오디오를 플레이할 수 있다. 많은 미디어 디바이스들은 통상적으로 내부 스피커들 및 Bluetooth®, 내부 스피커들 및 헤드폰 잭들, 헤드폰 잭들 및 Bluetooth®, 또는 내부 스피커들, 헤드폰 잭들, 및 Bluetooth®과 같은 구성들에서의 사운드의 동시 출력을 허용하지 않는다. 따라서, 공유된 청취 환경에서, 청각 장애가 있는 사용자가 오디오 디바이스, 이를테면 무선 헤드폰을 착용하면, 사용자는 오디오 디바이스로부터의 오디오 출력의 열악한 가청도를 경험할 수 있다는 것이 가능하다.
일부 사례들에서, 무선 오디오의 프로세싱은 오디오 디바이스 상에서 더 많은 시간이 걸릴 수 있다. 그 결과, 청각 장애가 있는 사용자는 에코를 경험할 수 있다는 것이 가능하다. 일부 다른 사례들에서, 비디오 콘텐츠를 시청하는 동안, 비디오 콘텐츠를 위한 오디오가 비디오 콘텐츠와 비교하여 지연될 수 있는 경우 사용자는 립 싱크(lip-sync) 문제를 경험할 수 있다는 것이 또한 가능하다. 이러한 문제가 있으면, 사용자는 공유된 청취 환경에서 정상적인 청력 레벨들을 갖는 다른 사용자들과 비교하여 열악한 청취 경험을 가질 수 있다.
기존 및 전통적인 접근법들의 제한들 및 단점들은, 본 출원의 나머지에서 그리고 도면들을 참조하여 언급되는 바와 같이, 본 개시의 일부 양태들을 갖는 설명된 시스템들의 비교를 통해 본 기술분야의 통상의 기술자에게 명백할 것이다.
공유된 청취 환경에서 청각 장애인을 위한 오디오의 향상을 위한 전자 장치 및 방법이, 청구항들에서 더 완전히 언급되는 바와 같이, 실질적으로 도면들 중 적어도 하나에서 도시되며 그리고/또는 그러한 하나의 도면에 관련하여 설명되는 바와 같이 제공된다.
본 개시의 이들 및 다른 특징들 및 장점들은 유사한 참조 번호들이 전체에 걸쳐 유사한 부분들을 지칭하는 첨부 도면들과 함께, 본 개시의 다음의 상세한 설명의 검토로부터 인식될 수 있다.
도 1은 본 개시의 일 실시예에 따른, 정상적인 청력 레벨들을 갖는 사용자들과 청각 장애가 있는 사용자를 위한 예시적인 청취 환경의 도면이다.
도 2는 본 개시의 일 실시예에 따른, 청각 장애가 있는 사용자에게 향상된 오디오 콘텐츠를 제공하는 예시적인 전자 장치를 도시하는 블록도이다.
도 3은 본 개시의 일 실시예에 따른, 청각 장애가 있는 사용자에게 향상된 오디오 콘텐츠를 제공하기 위한 예시적인 동작들을 도시하는 블록도이다.
도 4는 본 개시의 일 실시예에 따른, 청각 장애가 있는 사용자를 위한 오디오 콘텐츠를 향상시키기 위한 예시적인 시나리오를 도시하는 도면이다.
도 5는 본 개시의 일 실시예에 따른, 사용자의 오디오그램에 기초하여 청각 장애가 있는 사용자를 위한 오디오 향상을 위한 시나리오를 예시하는 도면이다.
도 6은 본 개시의 일 실시예에 따른, 청각 장애가 있는 사용자에게 향상된 오디오 콘텐츠를 제공하기 위한 예시적인 동작들을 도시하는 흐름도이다.
설명되는 다음 구현예들은 공유된 청취 환경에서 청각 장애가 있는 사용자를 위한 향상된 오디오 콘텐츠를 제공하기 위한 개시된 전자 장치 및 방법에서 발견될 수 있다. 본 개시의 예시적인 양태들은 미디어 소스로부터 오디오 콘텐츠를 수신할 수 있는 그리고 청각 장애가 있는 사용자의 오디오 향상 프로파일에 기초하여 수신된 오디오 콘텐츠를 향상시킬 수 있는 전자 장치(예를 들어, 스마트 텔레비전 또는 임의의 미디어 플레이어)를 제공한다. 공유된 청취 환경에서, 기존의 미디어 디바이스들은 공유된 청취 환경에서 모든 사용자들에 대한 공유된 청취 경험을 생성하기 위해 연결된 오디오 디바이스들을 통해 오디오를 플레이한다. 정상적인 청력 레벨들을 갖는 사용자들(예컨대, 최소한의 청력 손실(hearing loss)을 갖는 사용자들)이 오디오로 즐거운 청취 경험을 가질 수 있지만, 청각 장애가 있는 사용자들은 동일한 경험을 공유하지 못할 수 있다. 그 이유는 플레이되는 오디오의 오디오 특성들에 기인할 수 있는데, 이러한 특성들이 통상적으로 정상적인 청력 레벨들을 갖는 사용자들에 대해서만 최적화되기 때문이다. 청각 장애가 있는 사용자의 청취 경험을 향상시키기 위하여, 개시된 전자 장치는 미디어 소스로부터 소스 오디오 콘텐츠를 수신할 수 있고 청각 장애가 있는 사용자를 헤드마운트 오디오 디바이스(예컨대, 무선 헤드폰)의 착용자로서 검출할 수 있다. 이러한 검출 후, 전자 장치는 검출된 제1 사용자에 연관되는 오디오 향상 프로파일에 기초하여 소스 오디오 콘텐츠의 특정한 특징들(예컨대, 특정한 오디오 프레임들의 청력 레벨들(dB 단위))을 수정하여 향상된 오디오 콘텐츠를 생성하며, 이는 청각 장애가 있는 사용자를 위해 최적화될 수 있다. 전자 장치는 청각 장애가 있는 사용자가 정상적인 청력 레벨들을 갖는 사용자들의 청취 경험과 동일한 청취 경험을 가질 수 있도록 하는 플레이백을 위해 헤드마운트 오디오 디바이스와 향상된 오디오 콘텐츠를 공유할 수 있다. 향상된 오디오 콘텐츠는 스피치 양해도(intelligibility), 청취 편안함, 사운드 품질, 넓은 주파수 범위에 걸친 가청도, 또는 제1 오디오 콘텐츠에 연관되는 자연스러운 소리크기(loudness)의 사운드의 지각 중 하나 이상을 개선할 수 있다.
도 1은 본 개시의 일 실시예에 따른, 정상적인 청력 레벨들을 갖는 사용자들과 청각 장애가 있는 사용자를 위한 예시적인 청취 환경의 도면이다. 도 1을 참조하면, 전자 장치(102), 디스플레이 디바이스(104), 미디어 소스(106), 제1 사용자(108), 제1 사용자(108)를 위한 헤드마운트 오디오 디바이스(110), 이미지 캡처 디바이스(112), 제2 사용자(114), 및 제2 사용자(114)를 위한 오디오 재생 시스템(116)을 포함하는 청취 환경(100)이 도시되어 있다. 전자 장치(102)는 다른 전자 디바이스들, 이를테면 디스플레이 디바이스(104), 미디어 소스(106), 헤드마운트 오디오 디바이스(110), 또는 이미지 캡처 디바이스(112)와, 통신 네트워크(118)를 통해, 통신할 수 있다. 일부 실시예들에서, 하나 이상의 디바이스들, 이를테면 디스플레이 디바이스(104)와 이미지 캡처 디바이스(112)는, 전자 장치(102)의 입출력 (IO) 포트들을 통해, 전자 장치(102)에 통신적으로 커플링될 수 있다.
청취 환경(100)은, 청취 환경(100)에서 정상적인 청력 레벨들을 갖는 다른 사용자들(이를테면 제2 사용자(114))의 청취 경험에 영향을 미치는 일 없이, 청각 장애가 있는 사용자들(이를테면 제1 사용자(108))을 위한 향상된 오디오 콘텐츠의 플레이백을 용이하게 할 수 있는 공유된 청취 환경일 수 있다. 청취 환경(100)의 예들은 영화관, 회의장, 콘서트 홀, 강당, 또는 친구들과 가족 구성원들 간에 공유된 오디오/비디오 자원들을 갖는 홈 환경을 포함할 수 있지만 그것들로 제한되지 않는다.
전자 장치(102)는 미디어 소스(106)로부터 제1 오디오 콘텐츠를 수신하도록 구성될 수 있는 적합한 로직, 회로부, 및 인터페이스들을 포함할 수 있고 제1 사용자(108)의 오디오 향상 프로파일에 기초하여 제1 오디오 콘텐츠의 특정한 특징들을 수정하여 제2 오디오 콘텐츠를 생성할 수 있다. 예를 들어, 제1 오디오 콘텐츠의 특징은 제1 오디오 콘텐츠의 오디오 프레임들에서의 가청 주파수 대역의 신호 에너지 레벨들 또는 진폭 레벨들을 포함할 수 있다. 제2 오디오 콘텐츠는 제1 사용자(108)가 착용할 수 있는 헤드마운트 오디오 디바이스(110)와 공유될 수 있다.
일 실시예에서, 전자 장치(102)는 유선 또는 무선 연결을 통해, 디스플레이 디바이스(104)와 통신하도록 구성될 수 있는 휴대용 미디어 플레이어일 수 있다. 전자 장치(102)의 이러한 구현의 예들은 디지털 미디어 플레이어(digital media player)(DMP), 마이크로콘솔, TV 튜너(이를테면 차세대 텔레비전 시스템 위원회((Advanced Television Systems Committee)(ATSC) 튜너), 셋탑박스, OTT(Over-the-Top) 플레이어, 디지털 미디어 스트리머, 미디어 확장기/조정기, 또는 디지털 미디어 허브를 포함할 수 있지만 그것들로 제한되지 않는다.
다른 실시예에서, 전자 장치(102)는 디스플레이 가능 미디어 플레이어일 수 있다. 이러한 경우, 디스플레이 디바이스(104)의 전체 기능은, 본 개시의 범위로부터 벗어남 없이, 전자 장치(102)에 통합될 수 있다. 전자 장치(102)의 이러한 구현의 예들은, 케이블 또는 위성 네트워크들을 통한 OTA(over-the-air) 브로드캐스트 신호들로부터의, 또는 인터넷 기반 통신 신호로부터의 콘텐츠를, 수신, 디코딩 및 플레이하는 능력이 있는 텔레비전(TV), 스마트 TV, 인터넷 프로토콜(Internet-Protocol) TV(IPTV), 스마트폰, 개인용 컴퓨터, 랩톱, 태블릿, 착용가능 전자 디바이스, 또는 임의의 다른 미디어 디바이스를 포함할 수 있지만 그것들로 제한되지 않는다.
디스플레이 디바이스(104)는 미디어 소스(106)로부터 수신될 수 있는 비디오 콘텐츠를 디스플레이하도록 구성될 수 있는 적합한 로직, 회로부, 및 인터페이스들을 포함할 수 있다. 디스플레이 디바이스(104)는 액정 디스플레이(Liquid Crystal Display)(LCD) 디스플레이, 발광 다이오드(Light Emitting Diode)(LED) 디스플레이, 플라즈마 디스플레이, 또는 유기 LED(Organic LED)(OLED) 디스플레이 기술, 또는 다른 디스플레이 디바이스들을 비제한적으로 포함하는 여러 공지된 기술들을 통해 실현될 수 있다. 일 실시예에 따라, 디스플레이 디바이스(104)는 시스루(see-through) 디스플레이, 투사 기반 디스플레이, 전기변색(electro-chromic) 디스플레이, 또는 투명 디스플레이의 디스플레이 스크린을 의미할 수 있다.
미디어 소스(106)는 미디어 콘텐츠, 이를테면 오디오/비디오 콘텐츠를 전자 장치(102)에 송신하도록 구성될 수 있는 적합한 로직, 회로부, 및 인터페이스들을 포함할 수 있다. 일 실시예에서, 미디어 소스(106)는 제1 오디오 콘텐츠와 제1 오디오 콘텐츠에 관련되는 대응하는 비디오 콘텐츠를 저장하도록 구성될 수 있는 저장 디바이스로서 구현될 수 있다. 미디어 소스(106)의 이러한 구현의 예들은 펜 드라이브, 플래시 USB 스틱, 하드 디스크 드라이브(Hard Disk Drive)(HDD), 고체상태 드라이브(Solid-State Drive)(SSD), 및/또는 SD(Secure Digital) 카드를 포함할 수 있지만, 이에 제한되지 않는다. 다른 실시예에서, 미디어 소스(106)는, 통신 네트워크(118)를 통해, 제1 오디오 콘텐츠 및 대응하는 비디오 콘텐츠를 전자 장치(102)에 송신할 수 있는 미디어 스트리밍 서버로서 구현될 수 있다. 다른 실시예에서, 미디어 소스(106)는 OTA(over-the-air) 브로드캐스트 네트워크로부터 디지털 TV(DTV) 신호들을 수신하고 수신된 DTV 신호로부터 제1 오디오 콘텐츠 및 대응하는 비디오 콘텐츠를 추출하도록 구성될 수 있는 TV 튜너, 이를테면 ATSC 튜너일 수 있다. 그 후, 미디어 소스(106)는 추출된 제1 오디오 콘텐츠 및 대응하는 비디오 콘텐츠를 전자 장치(102)에 송신할 수 있다.
도 1에서, 미디어 소스(106)와 전자 장치(102)는 별개인 두 개의 디바이스들로서 도시된다. 그러나, 본 개시는 그렇게 제한되지 않을 수 있고 일부 실시예들에서, 미디어 소스(106)의 기능은, 본 개시의 범위로 벗어남 없이, 전자 장치(102)에 그 전체로서 또는 적어도 부분적으로 통합될 수 있다.
헤드마운트 오디오 디바이스(110)는 전자 장치(102)로부터 제2 오디오 콘텐츠를 수신하고 수신된 제2 오디오 콘텐츠를 플레이하도록 구성될 수 있는 적합한 로직, 회로부, 및 인터페이스들을 포함할 수 있다. 제2 오디오 콘텐츠는 수정된 버전의 제1 오디오 콘텐츠일 수 있고 청각 장애가 있는 제1 사용자(108)가 제2 오디오 콘텐츠를 최적으로 청취하도록 허용할 수 있다. 헤드마운트 오디오 디바이스(110)의 예들은, 오버헤드 헤드폰, 인이어 헤드폰, 클립온 헤드폰, 골전도(bone-conduction) 헤드폰, 보청기, 또는 헤드마운트 웨어러블(이를테면 스마트 안경, 헤드마운트 디스플레이(예컨대, 가상/증강/혼합 현실 헤드셋)을 포함할 수 있지만 그것들로 제한되지 않는다. 예시적인 실시예에서, 헤드마운트 오디오 디바이스(110)는 전자 장치(102)로부터 제2 오디오 콘텐츠를 수신하기 위해 무선 통신 프로토콜들, 이를테면 Wi-Fi, Bluetooth®, 또는 Bluetooth® 저 에너지(BLE)에 의존할 수 있는 무선 헤드폰일 수 있다.
일 실시예에서, 헤드마운트 오디오 디바이스(110)는 제1 사용자(108)의 음성 콘텐츠를 캡처하기 위한 마이크로폰과 제1 사용자(108)로부터의 입력들을 수신하기 위한 입력 디바이스를 포함할 수 있다. 입력 디바이스의 예들은 키패드, 노브(knob), 터치 스크린, 터치패드, 제스처 제어기, 또는 음성 제어 입력 디바이스를 포함할 수 있지만 그것들로 제한되지 않는다. 다른 실시예에서, 입력 디바이스는 무선 네트워크를 통해 헤드마운트 오디오 디바이스(110)에 통신적으로 커플링될 수 있다. 이러한 구현예에서, 입력 디바이스는 헤드마운트 오디오 디바이스(110)와 무선으로 페어링될 수 있는 스마트폰, 조이스틱, 게임 컨트롤러, 또는 임의의 다른 디바이스 중 하나일 수 있다.
이미지 캡처 디바이스(112)는 청취 환경(100)의 이미지를 캡처하도록 구성될 수 있는 적합한 로직, 회로부, 및 인터페이스들을 포함할 수 있다. 예를 들어, 이미지는 헤드마운트 오디오 디바이스(110)의 착용 상태 및/또는 청각 장애가 있는 제1 사용자(108)가 검출된 착용 상태의 헤드마운트 오디오 디바이스(110)의 착용자인지의 여부를 검출하기 위해 캡처될 수 있다. 일 실시예에서, 이미지 캡처 디바이스(112)는 통신 네트워크(118)를 통해 전자 장치(102)에 통신적으로 커플링될 수 있다. 다른 실시예에서, 이미지 캡처 디바이스(112)는 전자 장치(102)에 포함될 수 있다. 이미지 캡처 디바이스(112)의 예들은 이미지 센서, 광각 카메라, 액션 카메라, 폐쇄회로 텔레비전(closed-circuit television)(CCTV) 카메라, 캠코더, 디지털 카메라, 카메라 폰들, 및/또는 다른 이미지 캡처 디바이스들을 포함할 수 있지만 그것들로 제한되지 않는다.
오디오 재생 시스템(116)은 전자 장치(102)로부터 제1 오디오 콘텐츠(즉, 원래의 소스 오디오)를 수신하고 청취 환경(100)에서 정상적인 청력 레벨들을 갖는 사용자들(이를테면 제2 사용자(114))을 위해 수신된 제1 오디오 콘텐츠를 플레이하도록 구성될 수 있는 적합한 로직, 회로부, 및 인터페이스들을 포함할 수 있다. 일 실시예에서, 오디오 재생 시스템(116)은 유선 또는 무선 네트워크를 통해 전자 장치(102)에 통신적으로 커플링될 수 있다. 다른 실시예에서, 오디오 재생 시스템(116)은 전자 장치(102)의 내부 스피커 시스템일 수 있다. 오디오 재생 시스템 (116)은, 예를 들어, 내부 스피커 세트, 무선 스피커, 스마트 스피커, 유선 스피커, 우퍼, 서브우퍼, 트위터(tweeter), 사운드바, 라우드스피커, 광학적 오디오 디바이스 등을 포함할 수 있다. 예시적인 실시예에서, 오디오 재생 시스템(116)은 5:1 또는 2:1 스피커 설정과 같은 특정 스피커 레이아웃/설정을 갖는 서라운드 사운드 시스템에 해당할 수 있다.
통신 네트워크(118)는 전자 장치(102), 디스플레이 디바이스(104), 미디어 소스(106), 헤드마운트 오디오 디바이스(110), 이미지 캡처 디바이스(112), 및 오디오 재생 시스템(116)의 둘 이상이 서로 통신할 수 있는 통신 매체를 포함할 수 있다. 통신 네트워크(118)는 유선 또는 무선 통신 네트워크일 수 있다. 통신 네트워크(118)의 예들은 인터넷, Wi-Fi(Wireless Fidelity) 네트워크, 개인 영역 네트워크(Personal Area Network)(PAN), 로컬 영역 네트워크(Local Area Network)(LAN), 또는 도시권 통신망(Metropolitan Area Network)(MAN)을 포함할 수 있지만 그것들로 제한되지 않는다.
청취 환경(100)에서의 다양한 디바이스들은 다양한 유선 및 무선 통신 프로토콜들에 따라, 통신 네트워크(118)에 연결하도록 구성될 수 있다. 이러한 유선 및 무선 통신 프로토콜들의 예들은 전송 제어 프로토콜 및 인터넷 프로토콜(Transmission Control Protocol and Internet Protocol)(TCP/IP), 사용자 데이터그램 프로토콜(User Datagram Protocol)(UDP), 하이퍼 텍스트 전송 프로토콜(Hypertext Transfer Protocol)(HTTP), 파일 전송 프로토콜(File Transfer Protocol)(FTP), Zig Bee, EDGE, IEEE 802.11, Li-Fi(light fidelity), 802.16, IEEE 802.11s, IEEE 802.11g, 멀티홉 통신, 무선 액세스 포인트(AP), 디바이스 간 통신, 셀룰러 통신 프로토콜들, 및 블루투스(BT) 통신 프로토콜들 중 적어도 하나를 포함할 수 있지만 그것들로 제한되지 않는다.
동작 시, 전자 장치(102)는 미디어 소스(106)로부터 제1 오디오 콘텐츠를 수신할 수 있다. 그 후, 전자 장치(102)는 청각 장애가 있는 제1 사용자(108)를 헤드마운트 오디오 디바이스(110)의 착용자로서 검출할 수 있다. 일 실시예에서, 전자 장치(102)는 이미지 캡처 디바이스(112)를 제어하여 제1 사용자(108) 및 헤드마운트 오디오 디바이스(110)를 포함할 수 있는 청취 환경(100)의 이미지를 캡처할 수 있다. 캡처된 이미지에 기초하여, 전자 장치(102)는 헤드마운트 오디오 디바이스(110)의 착용자로서 제1 사용자(108)를 검출할 수 있다. 예를 들어, 전자 장치(102)는 이미지에 대한 얼굴 인식 방법을 국부적으로 구현하여 제1 사용자(108)를 검출한 다음 훈련된 심층 신경망(deep neural network)(DNN)을 사용하여 검출된 제1 사용자(108)가 헤드마운트 오디오 디바이스(110)의 착용자인지의 여부를 결정할 수 있다.
다른 실시예에서, 전자 장치(102)는 헤드마운트 오디오 디바이스(110)를 제어하여 헤드마운트 오디오 디바이스(110)의 착용자로부터의 음성 입력을 캡처할 수 있다. 그 후, 전자 장치(102)는 음성 입력에 기초하여 음성 프로파일(이는 디지털 오디오 지문들을 포함할 수 있음)을 생성할 수 있고 생성된 음성 프로파일을 사용자들의 저장된 음성 프로파일들의 그룹과 비교할 수 있다. 이러한 비교에 기초하여, 전자 장치(102)는 제1 사용자(108)를 헤드마운트 오디오 디바이스(110)의 착용자로서 검출할 수 있다.
이러한 검출 후, 전자 장치(102)는 검출된 제1 사용자(108)에 연관되는 오디오 향상 프로파일을 취출할 수 있다. 오디오 향상 프로파일은 인간들에 대한 넓은 범위의 상이한 피치들 또는 가청 주파수들에 걸친 청력 레벨들(예를 들어, 데시벨(dB) 단위)의 표현을 포함할 수 있다. 예를 들어, 오디오 향상 프로파일은 좌측 귀 및 우측 귀 둘 다에 대한 제1 사용자(108)의 청력 곡선(hearing curve)을 포함할 수 있는 오디오그램일 수 있다. 취출된 오디오 향상 프로파일에 기초하여, 전자 장치(102)는 제1 오디오 콘텐츠의 하나 이상의 특징들을 수정할 수 있다. 예를 들어, 이러한 특징들 중 하나는 제1 오디오 콘텐츠에 연관되는 오디오 주파수 범위에 대한 청력 레벨들(dB)일 수 있다. 1000 Hz ±250 Hz 대역에 대한 제1 사용자(108)의 청력 레벨(dB 단위)이 요구된 임계값보다 낮음을 오디오 향상 프로파일이 나타내는 경우, 1000 Hz ±250 Hz 대역에 대한 제1 오디오 콘텐츠의 사운드 진폭 레벨들은 청력 레벨을 개선하기 위해 증가될 수 있다. 이러한 특징들의 다른 예들은 제1 오디오 콘텐츠의 다수의 오디오 프레임들의 진폭, 제1 오디오 콘텐츠의 동적 범위(dynamic range), 제1 오디오 콘텐츠에서의 스피치 프레임들의 진폭 레벨들, 및 제1 오디오 콘텐츠의 오디오 프레임들을 위한 이득 레벨들에서의 조정을 위한 규정 속력(regulation speed)을 포함할 수 있지만 그것들로 제한되지 않는다. 특징(들)의 수정에 대한 추가 세부사항들은, 예를 들어, 도 3, 도 4, 및 도 5에서 제공된다.
전자 장치(102)는 제1 오디오 콘텐츠의 수정에 기초하여 제2 오디오 콘텐츠를 생성할 수 있다. 제2 오디오 콘텐츠는 제1 오디오 콘텐츠의 향상된 버전일 수 있고 제1 사용자(108)의 청각 장애의 상태들에 따라 최적화될 수 있다. 이러한 상태들은 제1 사용자(108)의 오디오 향상 프로파일에서, 청력 레벨들과 같은 데이터포인트들을 통해 반영될 수 있다.
일단 제2 오디오 콘텐츠가 생성되면, 전자 장치(102)는 생성된 제2 오디오 콘텐츠를 헤드마운트 오디오 디바이스(110)와 공유할 수 있다. 전자 장치(102)로부터의 수신 시, 헤드마운트 오디오 디바이스(110)는 제1 사용자(108)를 위한 제2 오디오 콘텐츠의 플레이백을 제어할 수 있다. 일부 실시예들에서, 전자 장치(102)는 제2 오디오 콘텐츠가 공유된 청취 경험을 위해 헤드마운트 오디오 디바이스(110) 상에서 플레이되는 동안 제1 오디오 콘텐츠를 동시에 플레이하도록 오디오 재생 시스템(116)을 제어할 수 있다. 예를 들어, 제1 사용자(108)가 헤드마운트 오디오 디바이스(110)를 통해 선택적으로 향상된 제2 오디오 콘텐츠를 청취할 때, 제2 사용자(114)는 오디오 재생 시스템(116)을 통해 제1 오디오 콘텐츠를 동시에 청취할 수 있다.
수정들, 추가들, 또는 생략들이 본 개시의 범위로 벗어남 없이 도 1에 대해 이루어질 수 있다. 예를 들어, 청취 환경(100)은 본 개시에서 예시되고 설명되는 엘리먼트들보다 더 많거나 더 적은 엘리먼트들을 포함할 수 있다.
도 2는 본 개시의 일 실시예에 따른, 청각 장애가 있는 사용자에게 향상된 오디오 콘텐츠를 제공하는 예시적인 전자 장치를 도시하는 블록도이다. 도 2는 도 1로부터의 엘리먼트들과 연계하여 설명된다. 도 2를 참조하면, 전자 장치(102)의 블록도(200)가 도시되어 있다. 전자 장치(102)는 회로부(202), 메모리(204), 입출력(I/O) 디바이스(206), 및 네트워크 인터페이스(208)를 포함할 수 있다. 적어도 하나의 실시예에서, 전자 장치(102)는 디스플레이 디바이스(104), 이미지 캡처 디바이스(112), 및 오디오 재생 시스템(116)을 또한 포함할 수 있다.
회로부(202)는 전자 장치(102)에 의해 실행될 상이한 동작들에 연관되는 프로그램 명령어들을 실행하도록 구성될 수 있는 적합한 로직, 회로부, 및 인터페이스들을 포함할 수 있다. 회로부(202)는 하나 이상의 전문화된 프로세싱 유닛들의 기능들을 집단적으로 수행하는 통합된 프로세서 또는 프로세서들의 클러스터로서 구현될 수 있는 하나 이상의 전문화된 프로세싱 유닛들을 포함할 수 있다. 회로부(202)는 본 기술분야에서 공지된 다수의 프로세서 기술들에 기초하여 구현될 수 있다. 회로부(202)의 구현 예들은 x86 기반 프로세서, 그래픽 프로세싱 유닛(Graphics Processing Unit)(GPU), RISC(Reduced Instruction Set Computing) 프로세서, 주문형 집적회로(Application-Specific Integrated Circuit)(ASIC) 프로세서, CISC(Complex Instruction Set Computing) 프로세서, 마이크로제어기, 중앙 프로세싱 유닛(central processing unit)(CPU), 및/또는 다른 컴퓨팅 회로들일 수 있다.
메모리(204)는 회로부(202)에 의해 실행될 프로그램 명령어들을 저장하도록 구성될 수 있는 적합한 로직, 회로부, 및 인터페이스들을 포함할 수 있다. 적어도 하나의 실시예에서, 메모리(204)는 제1 오디오 콘텐츠, 제2 오디오 콘텐츠, 및 비디오 콘텐츠와 같은 파일들을 저장할 수 있다. 메모리(204)는 청취 환경(100)에 연관될 수 있는 그리고 전자 장치(102)에 액세스할 수 있는 사용자들에 대한 사용자 정보를 또한 저장할 수 있다. 예를 들어, 사용자 정보는 제1 사용자(108) 및 제2 사용자(114)에 대한 음성 프로파일들, 얼굴 인식 정보, 또는 오디오 향상 프로파일들을 포함할 수 있다. 메모리(204)의 구현 예들은 랜덤 액세스 메모리(Random Access Memory)(RAM), 판독 전용 메모리(Read Only Memory)(ROM), 전기 소거가능 프로그램가능 판독전용 메모리(Electrically Erasable Programmable Read-Only Memory)(EEPROM), 하드 디스크 드라이브(HDD), 고체상태 드라이브(SSD), CPU 캐시, 및/또는 SD(Secure Digital) 캐시를 포함할 수 있지만 이에 제한되지 않는다.
I/O 디바이스(206)는 입력을 수신하고 수신된 입력에 기초하여 출력을 제공하도록 구성될 수 있는 적합한 로직, 회로부, 및 인터페이스들을 포함할 수 있다. 다양한 입력 및 출력 디바이스들을 포함하는 I/O 디바이스(206)는 회로부(202)와 통신하도록 구성될 수 있다. I/O 디바이스(206)의 예들은 터치 스크린, 키보드, 마우스, 조이스틱, 마이크로폰, 디스플레이 디바이스(이를테면 디스플레이 디바이스(104)), 또는 버튼을 포함할 수 있지만 그것들로 제한되지 않는다.
네트워크 인터페이스(208)는 통신 네트워크(118)를 통해, 회로부(202), 디스플레이 디바이스(104), 미디어 소스(106), 이미지 캡처 디바이스(112), 및/또는 오디오 재생 시스템(116) 간의 통신을 용이하게 하도록 구성될 수 있는 적합한 로직, 회로부, 및 인터페이스들을 포함할 수 있다. 네트워크 인터페이스(208)는 통신 네트워크(118)와의 전자 장치(102)의 유선 또는 무선 통신을 지원하기 위해 다양한 공지된 기술들의 사용에 의해 구현될 수 있다. 네트워크 인터페이스(208)는 안테나, 라디오 주파수(radio frequency)(RF) 트랜시버, 하나 이상의 증폭기들, 튜너, 하나 이상의 발진기들, 디지털 신호 프로세서, 코더-디코더(CODEC) 칩셋, 가입자 식별 모듈(subscriber identity module)(SIM) 카드, 또는 국부 버퍼 회로부를 포함할 수 있으나 그것들로 제한되지 않는다.
네트워크 인터페이스(208)는 네트워크들, 이를테면 인터넷, 인트라넷 또는 무선 네트워크, 이를테면 셀룰러 전화기 네트워크, 무선 로컬 영역 네트워크(LAN), 및 도시권 통신망(MAN)과 무선 통신을 통해 통신하도록 구성될 수 있다. 무선 통신은 복수의 통신 표준들, 프로토콜들 및 기술들, 이를테면 GSM(Global System for Mobile Communications), EDGE(Enhanced Data GSM Environment), 광대역 코드 분할 다중 접속(wideband code division multiple access)(W-CDMA), LTE(Long Term Evolution), 코드 분할 다중 접속(code division multiple access)(CDMA), 시분할 다중 접속(time division multiple access)(TDMA), 블루투스, WiFi(Wireless Fidelity)(이를테면 IEEE 802.11a, IEEE 802.11b, IEEE 802.11g 또는 IEEE 802.11n), VoIP(voice over Internet Protocol), Li-Fi(light fidelity), Wi-MAX(Worldwide Interoperability for Microwave Access), 이메일용 프로토콜 , 인스턴트 메시징, 및 단문 메시지 서비스(Short Message Service)(SMS) 중 하나 이상을 사용할 수 있다.
전자 장치(102)에 의해 실행되는 기능들 또는 동작들은, 도 1에서 설명된 바와 같이, 회로부(202)에 의해 수행될 수 있다. 회로부(202)에 의해 실행되는 동작들은, 예를 들어, 도 3, 도 4, 도 5, 및 도 6에서 상세히 설명된다.
도 3은 본 개시의 일 실시예에 따른, 청각 장애가 있는 사용자에게 향상된 오디오 콘텐츠를 제공하기 위한 예시적인 동작들을 도시하는 블록도이다. 도 3은 도 1 및 도 2로부터의 엘리먼트들과 연계하여 설명된다. 도 3을 참조하면, 본 개시에서 설명되는 바와 같이, 302 내지 310의 예시적인 동작들을 예시하는 블록도(300)가 도시되어 있다. 블록도(300)에 예시되는 예시적인 동작들은 302에서 시작할 수 있고 임의의 컴퓨팅 시스템, 장치, 또는 디바이스에 의해, 이를테면 도 1 또는 도 2의 전자 장치(102)에 의해 수행될 수 있다. 개별 블록들로 예시되지만, 블록도(300)의 하나 이상의 블록들에 연관되는 예시적인 동작들은 예시적인 동작들의 구현예에 의존하여, 추가적인 블록들로 분할되거나, 더 적은 블록들로 결합되거나, 또는 제거될 수 있다.
302에서, 미디어 콘텐츠(302A)는 수신될 수 있다. 회로부(202)는 미디어 소스(106)로부터 미디어 콘텐츠(302A)를 수신할 수 있다. 수신된 미디어 콘텐츠(302A)는 제1 오디오 콘텐츠에 연관되는 제1 오디오 콘텐츠 및/또는 비디오 콘텐츠를 포함할 수 있다. 하나의 예로서, 미디어 콘텐츠(302A)는 비디오와 비디오에 연관되는 오디오를 포함할 수 있는 텔레비전 프로그램일 수 있다. 다른 예로서, 미디어 콘텐츠(302A)는 오디오만을 포함할 수 있는 라디오 쇼 또는 팟캐스트일 수 있다.
304에서, 착용자 검출이 수행될 수 있다. 회로부(202)는 청각 장애가 있는 제1 사용자(108)를 헤드마운트 오디오 디바이스(110)의 착용자로서 검출할 수 있다. 다양한 실시예들은 헤드마운트 오디오 디바이스(110)의 착용자로서의 제1 사용자(108)의 검출을 위해 본 개시에서 설명된다.
일 실시예에서, 회로부(202)는 이미지 캡처 디바이스(112)를 제어하여 제1 사용자(108)와 헤드마운트 오디오 디바이스(110)를 포함할 수 있는 청취 환경(100)의 이미지를 캡처할 수 있다. 캡처된 이미지에 기초하여, 회로부(202)는 제1 사용자(108)를 헤드마운트 오디오 디바이스(110)의 착용자로서 검출할 수 있다. 예를 들어, 회로부(202)는 그 이미지에 대한 얼굴 인식 방법을 국부적으로 구현하여 제1 사용자(108)를 검출한 다음 훈련된 DNN을 사용하여 검출된 제1 사용자(108)가 헤드마운트 오디오 디바이스(110)의 착용자인지의 여부를 결정할 수 있다.
다른 실시예에서, 회로부(202)는 헤드마운트 오디오 디바이스(110)를 제어하여 헤드마운트 오디오 디바이스(110)의 착용자로부터 음성 입력을 캡처할 수 있고 회로부(202)는 음성 입력에 기초하여 음성 프로파일(이는 디지털 오디오 지문들을 포함할 수 있음)을 생성할 수 있다. 그 후, 회로부(202)는 생성된 음성 프로파일을 사용자들의 저장된 음성 프로파일들의 그룹과 비교할 수 있고 이러한 비교에 기초하여, 회로부(202)는 제1 사용자(108)를 헤드마운트 오디오 디바이스(110)의 착용자로서 검출할 수 있다.
다른 실시예에서, 회로부(202)는 디스플레이 디바이스(104)를 제어하여 등록된 사용자 프로파일들의 리스트를 사용자 선택가능 옵션들로서 포함하는 사용자 인터페이스(User Interface)(Ul)를 렌더링할 수 있다. 헤드마운트 오디오 디바이스(110)에 연관되는 입력 디바이스를 통해, 회로부(202)는 제1 사용자(108)에 연관되는 등록된 사용자 프로파일의 선택을 수신할 수 있다. 등록된 사용자 프로파일은 제1 사용자(108)의 청각 장애에 연관되는 정보를 포함할 수 있다. 이러한 선택에 기초하여, 헤드마운트 오디오 디바이스(110)의 착용자는 제1 사용자(108)로서 검출될 수 있다.
306에서, 검출된 제1 사용자(108)에 연관되는 오디오 향상 프로파일이 메모리(204)로부터 취출될 수 있다. 오디오 향상 프로파일은 인간들에 대한 넓은 범위의 피치들 또는 가청 주파수들에 걸친 청력 레벨들(데시벨(dB) 단위)의 표현을 포함할 수 있다. 예를 들어, 오디오 향상 프로파일은, 좌측 귀 및 우측 귀 둘 다에 대한 제1 사용자(108)의 청력 곡선을 포함할 수 있는, 오디오그램을 통해 표현될 수 있다. 오디오 향상 프로파일의 오디오그램의 일 예가 도 5에서 제공된다.
오디오 향상 프로파일이 검출된 제1 사용자(108)에 대해 이용 불가능한 경우, 오디오 향상 프로파일은 본 개시에서 설명되는 바와 같이 생성될 수 있다. 회로부(202)는 해당 가청 주파수 세트에서 테스트 톤 세트를 순차적으로 플레이하기 위해 헤드마운트 오디오 디바이스(110)를 제어할 수 있다. 각각의 테스트 톤의 소리크기는 각각의 테스트 톤이 헤드마운트 오디오 디바이스(110) 상에서 플레이되는 동안 증가할 수 있다. 이는 헤드마운트 오디오 디바이스(110)의 검출된 제1 사용자(108)가 각각의 테스트 톤이 제1 사용자(108)에게 명확하게 들릴 수 있는 소리크기 레벨을 결정하는 것을 허용하기 위해 행해질 수 있다. 회로부(202)는 테스트 톤 세트가 헤드마운트 오디오 디바이스(110) 상에서 순차적으로 플레이되는 동안 사용자 입력 세트를 수신할 수 있다. 사용자 입력 세트의 각각의 사용자 입력은 각각의 테스트 톤에 대한 청취 임계 레벨(dB 단위)을 나타낼 수 있다. 수신된 사용자 입력 세트에 기초하여, 회로부(202)는 검출된 제1 사용자(108)에 대한 오디오 향상 프로파일로서 오디오그램에 대한 청력 곡선을 생성할 수 있다.
308에서, 오디오 향상은 검출된 제1 사용자(108)에 대해 수행될 수 있다. 그러한 향상에 대해, 회로부(202)는 검출된 제1 사용자(108)에 연관되는 오디오 향상 프로파일(302C에서 획득됨)에 기초하여 제1 오디오 콘텐츠의 하나 이상의 특징들을 수정할 수 있다. 이러한 특징들의 예들은 제1 오디오 콘텐츠의 다수의 오디오 프레임들의 진폭, 제1 오디오 콘텐츠의 가청 주파수 대역의 진폭 레벨들, 제1 오디오 콘텐츠의 동적 범위, 제1 오디오 콘텐츠에서의 스피치 프레임들의 진폭 레벨들, 및 제1 오디오 콘텐츠의 오디오 프레임들을 위한 이득 레벨들에서의 조정을 위한 규정 속력을 포함할 수 있지만 그것들로 제한되지 않는다.
하나의 시나리오에서, 제1 사용자(108)는 고주파수 청력 손실(통상적으로 2000 Hz 이상)을 겪을 수 있다. 그 결과, 제1 사용자(108)는 여성들, 아이들, 새들의 지저귐, 또는 다른 고음(high-pitched) 사운드들의 음성을 이해함에 있어서 어려움에 직면할 수 있다. 대안적으로, 제1 사용자(108)는 저주파수 청력 손실을 겪을 수 있다. 그 결과, 제1 사용자(108)는 사람들의 그룹들 내 또는 시끄러운 환경들에서 그리고 배경 잡음이 존재하는 장소들에서 대화들을 경청함에 있어서, 또는 음악의 베이스 사운드들을 청취함에 있어서 어려움에 직면할 수 있다. 이러한 시나리오에서, 회로부(202)는 오디오 향상 프로파일에 기초하여 검출된 제1 사용자(108)에 연관되는 청력 손실의 유형을 결정할 수 있다. 청력 손실의 결정된 유형에 기초하여, 회로부(202)는 검출된 제1 사용자(108)의 청력 레벨들이 임계 청력 레벨(dB 단위) 미만인 가청 주파수 대역을 결정할 수 있다. 그 후, 회로부(202)는 결정된 가청 주파수 대역을 포함하는 제1 오디오 콘텐츠의 다수의 오디오 프레임들의 진폭 레벨들을 선택적으로 증폭할 수 있다. 선택적 증폭은 제1 오디오 콘텐츠의 제1 특징의 수정에 대응할 수 있다.
다른 시나리오에서, 제1 사용자(108)는 60 dB 내지 70 dB의 청취 범위로 축소될 수 있는 가벼운 청력 손실을 갖는 것으로 검출될 수 있고 제1 사용자(108)의 청력의 동적 범위를 감소시킬 수 있다. 비교에서, 정상적인 청력 레벨들을 갖는 사용자가 임계값과 불편한 소리크기 레벨 사이에 약 100 dB의 청취 범위를 가질 수 있다. 여기서, 동적 범위는 오디오의 가장 강한 부분 또는 가장 큰 부분 대 오디오의 가장 약한 부분 또는 가장 은은한(softest) 부분의 비율로서 정의될 수 있다. 이러한 시나리오에서, 회로부(202)는 향상 프로파일에 기초하여 제1 오디오 콘텐츠의 제1 동적 범위와 검출된 제1 사용자(108)의 청력의 제2 동적 범위를 결정할 수 있다. 그 후, 회로부(202)는 수정된 제1 동적 범위와 제2 동적 범위에서의 차이가 최소가 되도록 컴프레서들(compressors), 익스팬더들(expanders), 또는 노이즈 게이트들(noise gates)을 사용하여 제1 오디오 콘텐츠의 제1 동적 범위를 수정할 수 있다. 다르게 말하면, 오디오 콘텐츠의 동적 범위는 제1 사용자(108)의 청력의 동적 범위에 맞도록 수정될 수 있다. 제1 동적 범위의 수정은 제1 오디오 콘텐츠의 제2 특징의 수정에 대응할 수 있다.
다른 시나리오에서, 제1 사용자(108)는 달팽이관 고주파수 영역이 심각하게 손상되어서 기존의 증폭에 의해 오디오 샘플들(이는 고주파 신호들을 포함함)의 가청도를 복원하는 것이 가능하지 않을 수 있는 중증(severe-to-profound) 청력 손실을 겪을 수 있다. 이러한 시나리오에서, 가청도는 제1 오디오 콘텐츠의 고주파 신호 성분들의 저 주파수 신호 성분들로의 시프트에 의해 성취될 수 있다. 회로부(202)는 제1 오디오 콘텐츠의 고주파 신호 성분들을 추출할 수 있고 추출된 고주파 신호 성분들을 저주파 신호 성분들로 변환할 수 있다. 추출된 고주파 신호 성분들의 변환은 제1 오디오 콘텐츠의 제3 특징의 수정에 해당할 수 있다.
회로부(202)는 제1 오디오 콘텐츠의 수정에 기초하여 제2 오디오 콘텐츠를 생성할 수 있다. 제2 오디오 콘텐츠는 제1 오디오 콘텐츠의 수정된 형태일 수 있고 제1 사용자(108)의 청각 장애에 연관되는 결함들을 해결하도록 적응될 수 있다. 구체적으로, 제2 오디오 콘텐츠는 스피치 양해도, 청취 편안함, 사운드 품질, 넓은 주파수 범위에 걸친 가청도, 또는 제1 오디오 콘텐츠에 연관되는 자연스러운 소리크기(loudness)의 사운드의 지각 중 하나 이상을 개선할 수 있다.
310에서, 오디오 콘텐츠는 헤드마운트 오디오 디바이스(110)와 공유될 수 있다. 회로부(202)는 생성된 제2 오디오 콘텐츠를, Bluetooth® 또는 Wi-Fi와 같은 무선 네트워크를 통해, 헤드마운트 오디오 디바이스(110)와 공유할 수 있다. 일 실시예에서, 회로부(202)는 공유된 청취 경험을 위해 헤드마운트 오디오 디바이스(110) 상의 제2 오디오 콘텐츠의 플레이백과 동시에 제1 오디오 콘텐츠를 플레이하도록 오디오 재생 시스템(116)을 제어할 수 있다. 그러므로, 제1 사용자(108)가 헤드마운트 오디오 디바이스(110)를 통해 제2 오디오 콘텐츠를 청취할 때, 제2 사용자(114)는 오디오 재생 시스템(116)을 통해 제1 오디오 콘텐츠를 동시에 청취할 수 있다. 제1 오디오 콘텐츠 및 제2 오디오 콘텐츠 둘 다가 동시에 플레이되므로, 양 사용자들(제1 사용자(108) 및 제2 사용자(114))은 공통 청취 환경에서 공유된 청취 경험을 즐길 수 있다.
도 4는 본 개시의 일 실시예에 따른, 청각 장애가 있는 사용자를 위한 오디오 콘텐츠를 향상시키기 위한 예시적인 시나리오를 도시하는 도면이다. 도 4는 도 1, 도 2, 및 도 3으로부터의 엘리먼트들과 연계하여 설명된다. 도 4를 참조하면, 예시적인 시나리오(400)가 도시되어 있다. 예시적인 시나리오(400)에서, 텔레비전(402)과 그 텔레비전의 디스플레이 패널(404), 제1 사용자(406), 헤드마운트 오디오 디바이스(408), 이미지 캡처 디바이스(410), 제2 사용자(412), 및 오디오 재생 시스템(414)가 도시되어 있다. 여기서, 텔레비전(402), 디스플레이 패널(404), 헤드마운트 오디오 디바이스(408), 이미지 캡처 디바이스(410), 및 오디오 재생 시스템(414)은 각각 전자 장치(102), 디스플레이 디바이스(104), 헤드마운트 오디오 디바이스(110), 이미지 캡처 디바이스(112), 및 오디오 재생 시스템(116)의 예시적인 구현예들일 수 있다.
텔레비전(402)은 ATSC 튜너와 같은 미디어 소스(106)를 통해 미디어 콘텐츠를 수신할 수 있다. 그 미디어 콘텐츠는 제1 오디오 콘텐츠에 연관되는 제1 오디오 콘텐츠 및 비디오 콘텐츠를 포함할 수 있다. 텔레비전(402)은 디스플레이 패널(404)를 제어하여 제1 오디오 콘텐츠에 연관되는 비디오 콘텐츠를 디스플레이할 수 있다. 청각 장애가 있는 제1 사용자(406)의 경우, 텔레비전(402)은 제1 오디오 콘텐츠의 하나 이상의 특징들의 수정에 기초하여 (도 3에서 설명된 바와 같이) 제2 오디오 콘텐츠를 생성할 수 있다. 제2 오디오 콘텐츠는 제1 오디오 콘텐츠의 수정된 형태일 수 있고 제1 사용자(406)의 청각 결함들을 해결하도록 적응될 수 있다.
통상적으로, 텔레비전(402)이 헤드마운트 오디오 디바이스(408)와 제2 오디오 콘텐츠를 무선으로 공유할 때, 제2 오디오 콘텐츠의 플레이백은 디스플레이 패널(404) 상의 비디오 콘텐츠의 플레이백과 비교하여 (예컨대, 수십 내지 수백 밀리초) 지연될 수 있다. 이는 제2 오디오 콘텐츠의 인코딩 또는 디코딩 및/또는 제2 오디오 콘텐츠를 위한 무선 공유를 위한 무선 오디오 프로세싱 방법들에 기인할 수 있다. 비디오 플레이백의 경우, 비디오 콘텐츠를 위한 프로세싱 방법들은, 특히 제2 오디오 콘텐츠의 플레이백에 연관되는 지연과 비교하여, 비디오 콘텐츠의 디스플레이 동안 사람의 눈들에 시각적으로 눈에 띄지 않을 수 있는 지연을 초래할 수 있다. 이는 제1 사용자(406)에 대한 립 싱크 문제를 생성할 수 있다. 또한, 오디오 재생 시스템(414)이 텔레비전(402)에 유선 연결되고 제1 오디오 콘텐츠를 플레이하는 경우, 제1 오디오 콘텐츠의 플레이백에 연관되는 지연은 제2 오디오 콘텐츠의 플레이백에 연관되는 지연과 비교하여 상당히 무시될 수 있다. 이러한 경우, 제1 오디오 콘텐츠의 사운드는 제2 오디오 콘텐츠의 사운드와 혼합되어, 제1 사용자(406)가 에코를 청취하게 할 수 있다.
이러한 문제를 완화하기 위하여, 회로부(202)는 헤드마운트 오디오 디바이스와의 무선 공유를 위해 제2 오디오 콘텐츠(408)의 인코딩에 연관되는 제1 프로세싱 지연을 컴퓨팅할 수 있다. 회로부(202)는 헤드마운트 오디오 디바이스(408)에서 제2 오디오 콘텐츠의 디코딩에 연관되는 제2 프로세싱 지연을 또한 컴퓨팅할 수 있다. 그 후, 회로부(202)는 컴퓨팅된 제1 프로세싱 지연 및 제2 프로세싱 지연에 기초하여 디스플레이 패널(404) 상의 비디오 콘텐츠의 디스플레이의 시간을 교정할 수 있다. 예를 들어, 이러한 교정은 컴퓨팅된 제1 프로세싱 지연 및 제2 프로세싱 지연의 합과 동일한 시간만큼 비디오 콘텐츠의 디스플레이의 시간에서의 시프트를 포함할 수 있다. 이러한 교정은 비디오 콘텐츠의 플레이백을 헤드마운트 오디오 디바이스의 제2 오디오 콘텐츠의 플레이백과 동기화할 수 있다. 추가적으로, 회로부(202)는 디스플레이 패널(404) 상의 비디오 콘텐츠(304B)의 플레이백과 동기화하기 위해 오디오 재생 시스템(414)을 통한 제1 오디오 콘텐츠의 플레이백의 시간을 또한 교정할 수 있다.
도 5는 본 개시의 일 실시예에 따른, 사용자의 오디오그램에 기초하여 청각 장애가 있는 사용자를 위한 오디오 향상을 위한 시나리오를 예시하는 도면이다. 도 5는 도 1, 도 2, 도 3 및 도 4로부터의 엘리먼트들과 연계하여 설명된다. 도 5를 참조하면, 청각 장애가 있는 제1 사용자(108)에 대한 청력 곡선(502)을 포함하는 제1 오디오그램(500)과 넓은 범위의 가청 주파수들에 걸쳐 정상적인 청력 레벨들을 갖는 다른 사용자의 청력 곡선(506)을 포함하는 제2 오디오그램(504)이 도시되어 있다.
제1 오디오그램(500)에서, 제1 사용자(108)의 청력 곡선(502)은 0 헤르츠(즉, Hz) 내지 250Hz의 가청 주파수 대역에 대해 청력 레벨들을 정상적인 것으로서 나타낸다. 그러나, 250Hz를 초과하는 가청 주파수 대역에 대해, 제1 사용자(108)의 청력 곡선(502)은, 특히 2000 Hz를 초과하는 가청 주파수들에서, 청력 레벨들의 저하를 나타낸다. 제1 오디오그램(500)은 제1 사용자(108)의 오디오 향상 프로파일이라고 지칭될 수 있다. 제1 사용자(108)의 청력 레벨들을 정정하기 위하여, 회로부(202)는 제1 사용자(108)의 청력 곡선(502)을 정상적인 청력 레벨들을 갖는 다른 사용자의 청력 곡선(506)과 비교할 수 있다. 그 비교에 기초하여, 회로부(202)는 제2 오디오 콘텐츠를 생성하기 위해 수정될 제1 오디오 콘텐츠의 하나 이상의 특징들을 결정할 수 있다. 예를 들어, 이 경우, 회로부(202)는 신호 에너지 레벨들이 제1 사용자(108)에 대한 청력 레벨들(dB 단위)을 교정하기 위해 선택적으로 증폭되어야 할 수 있는 가청 주파수 대역들의 수를 결정할 수 있다. 그 후, 회로부(202)는 결정된 오디오 프레임 수가 결정된 가청 주파수 대역 수를 포함한다는 결정에 기초하여 제1 오디오 콘텐츠의 오디오 프레임들의 수를 특징으로서(결정된 하나 이상의 특징들 중 하나로서) 결정할 수 있다. 그 후, 회로부(202)는 제1 오디오 콘텐츠의 결정된 수의 오디오 프레임들을 선택적으로 증폭하여 제2 오디오 콘텐츠를 생성할 수 있다. 제2 오디오 콘텐츠는 헤드마운트 오디오 디바이스(110)를 플레이백을 위해 공유될 수 있다.
제1 사용자(108)가 좌측 또는 우측 귀의 청각 장애를 겪을 경우, 회로부(202)는 제1 사용자(108)에 대한 청력 곡선(502)이 제1 사용자(108)의 좌측 귀 또는 우측 귀 중 하나에 대한 청각 장애 상태를 나타낸다는 결정에 기초하여 제1 오디오 콘텐츠의 좌측 채널 오디오 또는 우측 채널 오디오 중 하나로서 제1 오디오 부분을 선택할 수 있다. 회로부(202)는 제1 오디오 콘텐츠의 선택된 제1 오디오 부분의 하나 이상의 특징들(예컨대, 청력 레벨들(dB 단위))의 수정에 기초하여 제2 오디오 콘텐츠를 생성할 수 있다.
도 6은 본 개시의 일 실시예에 따른, 청각 장애가 있는 사용자에게 향상된 오디오 콘텐츠를 제공하기 위한 예시적인 동작들을 도시하는 흐름도이다. 도 6은 도 1, 도 2, 도 3, 도 4, 및 도 5로부터의 엘리먼트들과 연계하여 설명된다. 도 6을 참조하면, 흐름도(600)가 도시되어 있다. 602 내지 610의 동작들은 임의의 컴퓨팅 시스템에 의해, 이를테면 도 1 또는 도 2의 전자 장치(102)에 의해 구현될 수 있다. 그 동작들은 602에서 시작할 수 있고 604로 진행할 수 있다.
602에서, 제1 오디오 콘텐츠는 미디어 소스(106)로부터 수신될 수 있다. 적어도 하나의 실시예에서, 회로부(202)는 미디어 소스(106)로부터 제1 오디오 콘텐츠를 수신하도록 구성될 수 있다.
604에서, 청각 장애가 있는 제1 사용자(108)는 헤드마운트 오디오 디바이스(110)의 착용자로서 검출될 수 있다. 적어도 하나의 실시예에서, 회로부(202)는 청각 장애가 있는 제1 사용자(108)를 헤드마운트 오디오 디바이스(110)의 착용자로서 검출하도록 구성될 수 있다.
606에서, 제1 오디오 콘텐츠의 하나 이상의 특징들은 검출된 제1 사용자(108)에 연관되는 오디오 향상 프로파일에 기초하여 수정될 수 있다. 적어도 하나의 실시예에서, 회로부(202)는 검출된 제1 사용자(108)에 연관되는 오디오 향상 프로파일(606)에 기초하여 제1 오디오 콘텐츠의 하나 이상의 특징들을 수정하도록 구성될 수 있다.
608에서, 제2 오디오 콘텐츠는 수정에 기초하여 생성될 수 있다. 적어도 하나의 실시예에서, 회로부(202)는 수정에 기초하여 제2 오디오 콘텐츠를 생성하도록 구성될 수 있다.
610에서, 생성된 제2 오디오 콘텐츠는 헤드마운트 오디오 디바이스(110)와 공유될 수 있다. 적어도 하나의 실시예에서, 회로부(202)는 생성된 제2 오디오 콘텐츠를 헤드마운트 오디오 디바이스(110)와 공유하도록 구성될 수 있다. 제어는 종료로 전달될 수 있다.
흐름도(600)가 602, 604, 606, 608 및 610과 같은 개별 동작들로서 설명되었다. 그러나, 특정 실시예들에서, 이러한 개별 동작들은 개시된 실시예들의 본질을 손상시키는 일 없이 구현예에 의존하여, 추가적인 동작들로 추가로 분할되거나, 더 적은 동작들로 결합되거나, 또는 제거될 수 있다.
본 개시의 다양한 실시예들은 전자 장치(102)와 같은 전자 장치를 동작시키기 위해 머신 및/또는 컴퓨터에 의해 실행 가능한 명령들을 저장한 비일시적 컴퓨터 판독가능 매체 및/또는 저장 매체를 제공할 수 있다. 명령어들은 머신 및/또는 컴퓨터로 하여금 미디어 소스(106)로부터 제1 오디오 콘텐츠를 수신하는 것과 청각 장애가 있는 제1 사용자(108)를 헤드마운트 오디오 디바이스(110)의 착용자로서 검출하는 것을 포함하는 동작들을 수행하게 할 수 있다. 그 동작들은 검출된 제1 사용자(108)에 연관되는 오디오 향상 프로파일에 기초하여 제1 오디오 콘텐츠의 하나 이상의 특징들을 수정하는 것을 더 포함할 수 있다. 그 동작들은 그 수정에 기초하여 제2 오디오 콘텐츠를 생성하는 것과 헤드마운트 오디오 디바이스(110)와 생성된 제2 오디오 콘텐츠를 공유하는 것을 더 포함할 수 있다.
본 개시의 예시적인 양태들은 헤드마운트 오디오 디바이스(이를테면 도 1의 헤드마운트 오디오 디바이스(110))에 통신적으로 커플링될 수 있는 회로부(이를테면 회로부(202))를 포함하는 전자 장치(이를테면 도 1의 전자 장치(102))를 포함할 수 있다. 회로부는 미디어 소스(이를테면 도 1의 미디어 소스(106))로부터 제1 오디오 콘텐츠를 수신하고 청각 장애가 있는 제1 사용자(이를테면 제1 사용자(104))를 헤드마운트 오디오 디바이스의 착용자로서 검출하도록 구성될 수 있다. 회로부는 검출된 제1 사용자에 연관되는 오디오 향상 프로파일에 기초하여 제1 오디오 콘텐츠의 하나 이상의 특징들을 수정하도록 추가로 구성될 수 있다. 제한이 아니라 예로서, 하나 이상의 특징들은 제1 오디오 콘텐츠의 다수의 오디오 프레임들의 진폭, 제1 오디오 콘텐츠의 가청 주파수 대역의 진폭 레벨들, 제1 오디오 콘텐츠의 동적 범위, 제1 오디오 콘텐츠에서의 스피치 프레임들의 진폭 레벨들, 제1 오디오 콘텐츠의 오디오 프레임들을 위한 이득 레벨들에서의 조정을 위한 규정 속력 등을 포함할 수 있다. 그 후, 회로부는 그 수정에 기초하여 제2 오디오 콘텐츠를 생성하고 헤드마운트 오디오 디바이스와 생성된 제2 오디오 콘텐츠를 공유하도록 구성될 수 있다.
일 실시예에 따라, 회로부는 공유된 청취 경험을 위해 헤드마운트 오디오 디바이스 상의 제2 오디오 콘텐츠의 플레이백과 동시에 제1 오디오 콘텐츠를 플레이하기 위해 오디오 재생 시스템(이를테면 도 1의 오디오 재생 시스템(114))을 제어하도록 추가로 구성될 수 있다. 예를 들어, 오디오 재생 시스템은 외부 무선 스피커, 내부 스피커 세트, 외부 유선 스피커, 서브우퍼, 트위터, 사운드바, 또는 광학적 오디오 디바이스 중 하나 이상을 포함할 수 있다.
일 실시예에 따라, 전자 장치는 회로부에 통신적으로 커플링되는 이미지 캡처 디바이스(이를테면 이미지 캡처 디바이스(112))를 포함할 수 있다. 회로부는 제1 사용자와 헤드마운트 오디오 디바이스를 포함하는 청취 환경(이를테면 청취 환경(100))의 이미지를 캡처하고 캡처된 이미지에 기초하여 제1 사용자를 헤드마운트 오디오 디바이스의 착용자로서 검출하기 위해 이미지 캡처 디바이스를 제어하도록 구성될 수 있다.
일 실시예에 따라, 오디오 향상 프로파일은 제1 사용자의 좌측 귀 및 우측 귀 둘 다에 대한 제1 사용자의 청력 곡선을 포함할 수 있는 오디오그램일 수 있다. 회로부는 제1 사용자의 청력 곡선을 정상적인 청력 레벨들을 갖는 제2 사용자의 기준 청력 곡선과 비교하고 그 비교에 기초하여 수정을 위한 제1 오디오 콘텐츠의 하나 이상의 특징들을 결정하도록 구성될 수 있다.
일 실시예에 따라, 회로부는 제1 사용자에 대한 청력 곡선이 제1 사용자의 좌측 귀 또는 우측 귀 중 하나에 대한 청각 장애 상태를 나타낸다는 결정에 기초하여 제1 오디오 부분을 제1 오디오 콘텐츠의 좌측 채널 오디오 또는 우측 채널 오디오 중 하나로서 선택하도록 추가로 구성될 수 있다. 그 후, 회로부는 제1 오디오 콘텐츠의 선택된 제1 오디오 부분의 하나 이상의 특징들을 수정하고 그 수정에 기초하여 제2 오디오 콘텐츠를 생성할 수 있다.
일 실시예에 따라, 회로부는 해당 가청 주파수 세트에서 테스트 톤 세트를 순차적으로 플레이하기 위해 헤드마운트 오디오 디바이스를 제어하도록 구성될 수 있다. 테스트 톤 세트에서의 각각의 테스트 톤의 소리크기는 각각의 테스트 톤이 헤드마운트 오디오 디바이스 상에 플레이되는 동안 증가할 수 있다. 그 후, 회로부는 테스트 톤 세트가 헤드마운트 오디오 디바이스 상에서 순차적으로 플레이되는 동안 사용자 입력 세트를 수신할 수 있다. 각각의 사용자 입력은 각각의 테스트 톤에 대한 청취 임계 레벨을 나타낼 수 있다. 수신된 사용자 입력 세트에 기초하여, 회로부는 제1 사용자에 대한 오디오 향상 프로파일로서 오디오그램에 대한 청력 곡선을 생성할 수 있다.
일 실시예에 따라, 전자 장치는 제1 오디오 콘텐츠에 연관될 수 있는 비디오 콘텐츠를 디스플레이하도록 구성되는 디스플레이 디바이스(이를테면 디스플레이 디바이스(104))를 포함할 수 있다. 회로부는 헤드마운트 오디오 디바이스와의 무선 공유를 위해 제2 오디오 콘텐츠의 인코딩에 연관되는 제1 프로세싱 지연을 컴퓨팅하고 헤드마운트 오디오 디바이스에서의 제2 오디오 콘텐츠의 디코딩에 연관되는 제2 프로세싱 지연을 컴퓨팅하도록 구성될 수 있다. 그 후, 회로부는 컴퓨팅된 제1 프로세싱 지연 및 제2 프로세싱 지연에 기초하여 헤드마운트 오디오 디바이스 상의 제2 오디오 콘텐츠의 플레이백과 동기화하기 위해 비디오 콘텐츠의 디스플레이의 시간을 교정하도록 추가로 구성될 수 있다.
본 개시는 하드웨어, 또는 하드웨어 및 소프트웨어의 조합으로 실현될 수 있다. 본 개시는 중앙 집중식으로, 적어도 하나의 컴퓨터 시스템에, 또는 상이한 엘리먼트들이 여러 상호연결된 컴퓨터 시스템들에 걸쳐 확산될 수 있는 분산 방식으로 실현될 수 있다. 본 개시에서 설명되는 방법들을 수행하도록 적응되는 컴퓨터 시스템 또는 다른 장치가 적합할 수 있다. 하드웨어 및 소프트웨어의 조합이, 로딩되고 실행되는 경우, 컴퓨터 시스템을 본 개시에서 설명되는 방법들을 수행하도록 제어할 수 있는 컴퓨터 프로그램을 갖는 범용 컴퓨터 시스템일 수 있다. 본 개시는 다른 기능들을 또한 수행하는 집적 회로의 부분을 포함하는 하드웨어에서 실현될 수 있다.
본 개시는 또한 본 개시에서 설명되는 방법들의 구현예를 가능하게 하는 모든 특징들을 포함하고 컴퓨터 시스템에 로딩될 때 이들 방법들을 수행할 수 있는 컴퓨터 프로그램 제품에 내장될 수 있다. 컴퓨터 프로그램은, 현재 맥락에서, 정보처리 능력을 갖는 시스템이 특정 기능을 직접 수행하게 하도록, 또는 a) 다른 언어, 코드 또는 표기법(notation)으로의 변환; b) 상이한 자료 형태로 재현 중 어느 하나 또는 양쪽 모두의 후에 수행하게 하도록 의도되는 명령 세트의 임의의 언어, 코드 또는 표기법에서의 임의의 표현을 의미한다.
본 개시가 특정한 실시예들을 참조하여 설명되지만, 다양한 변경들이 이루어질 수 있고 동등물들이 본 개시의 범위로부터 벗어남 없이 대체될 수 있다는 것이 본 기술분야의 통상의 기술자들에 의해 이해될 것이다. 추가적으로, 많은 수정들이 본 개시의 교시에 그것의 범위로부터 벗어남 없이 상황 또는 자료를 적용하기 위해 이루어질 수 있다. 그러므로, 본 개시는 개시된 실시예로 제한되지 않고, 본 개시는 첨부의 청구항들의 범위 내에 속하는 모든 실시예들을 포함할 것으로 의도된다.

Claims (20)

  1. 전자 장치로서,
    헤드마운트 오디오 디바이스에 통신적으로 커플링되는 회로부
    를 포함하며,
    상기 회로부는,
    미디어 소스로부터 제1 오디오 콘텐츠를 수신하며;
    청각 장애가 있는 제1 사용자를 상기 헤드마운트 오디오 디바이스의 착용자로서 검출하며;
    검출된 제1 사용자에 연관되는 오디오 향상 프로파일에 기초하여 상기 제1 오디오 콘텐츠의 하나 이상의 특징들을 수정하며;
    상기 수정에 기초하여 제2 오디오 콘텐츠를 생성하며; 그리고
    생성된 제2 오디오 콘텐츠를 상기 헤드마운트 오디오 디바이스와 공유하도록
    구성되는, 전자 장치.
  2. 제1항에 있어서,
    상기 회로부는 공유된 청취 경험을 위해 상기 헤드마운트 오디오 디바이스 상의 상기 제2 오디오 콘텐츠의 플레이백과 동시에 상기 제1 오디오 콘텐츠를 플레이하기 위해 오디오 재생 시스템을 제어하도록 구성되는, 전자 장치.
  3. 제2항에 있어서, 상기 오디오 재생 시스템은 외부 무선 스피커, 내부 스피커 세트, 외부 유선 스피커, 서브우퍼, 트위터, 사운드바, 또는 광학적 오디오 디바이스 중 하나 이상을 포함하는, 전자 장치.
  4. 제1항에 있어서,
    상기 회로부에 통신적으로 커플링되는 이미지 캡처 디바이스를 더 포함하며,
    상기 회로부는,
    상기 제1 사용자와 상기 헤드마운트 오디오 디바이스를 포함하는 청취 환경의 이미지를 캡처하도록 상기 이미지 캡처 디바이스를 제어하며; 그리고
    캡처된 이미지에 기초하여 상기 제1 사용자를 상기 헤드마운트 오디오 디바이스의 상기 착용자로서 검출하도록 추가로 구성되는, 전자 장치.
  5. 제1항에 있어서, 상기 오디오 향상 프로파일은 상기 제1 사용자의 좌측 귀 및 우측 귀 둘 다에 대한 상기 제1 사용자의 청력 곡선을 포함하는 오디오그램인, 전자 장치.
  6. 제5항에 있어서, 상기 회로부는,
    상기 제1 사용자의 상기 청력 곡선을 정상적인 청력 레벨들을 갖는 제2 사용자의 기준 청력 곡선과 비교하며; 그리고
    상기 비교에 기초하여 상기 수정을 위해 상기 제1 오디오 콘텐츠의 상기 하나 이상의 특징들을 결정하도록 추가로 구성되는, 전자 장치.
  7. 제5항에 있어서, 상기 회로부는,
    상기 제1 사용자에 대한 상기 청력 곡선이 상기 제1 사용자의 상기 좌측 귀 또는 상기 우측 귀 중 하나에 대한 청각 장애 상태를 나타낸다는 결정에 기초하여 제1 오디오 부분을 상기 제1 오디오 콘텐츠의 좌측 채널 오디오 또는 우측 채널 오디오 중 하나로서 선택하며;
    상기 제1 오디오 콘텐츠의 선택된 제1 오디오 부분의 상기 하나 이상의 특징들을 수정하며; 그리고
    상기 수정에 기초하여 상기 제2 오디오 콘텐츠를 생성하도록 추가로 구성되는, 전자 장치.
  8. 제1항에 있어서, 상기 회로부는,
    해당 가청 주파수 세트에서 테스트 톤 세트를 순차적으로 플레이하기 위해 상기 헤드마운트 오디오 디바이스를 제어하며,
    상기 테스트 톤 세트에서의 각각의 테스트 톤의 소리크기는 상기 각각의 테스트 톤이 상기 헤드마운트 오디오 디바이스 상에서 플레이되는 동안 증가되며;
    상기 테스트 톤 세트가 상기 헤드마운트 오디오 디바이스 상에서 순차적으로 플레이되는 동안 사용자 입력 세트 ― 각각의 사용자 입력은 상기 각각의 테스트 톤에 대한 청취 임계 레벨을 나타냄 ― 를 수신하며; 그리고
    수신된 사용자 입력 세트에 기초하여 오디오그램 상의 청력 곡선을 상기 제1 사용자에 대한 상기 오디오 향상 프로파일로서 생성하도록 추가로 구성되는, 전자 장치.
  9. 제1항에 있어서, 상기 제1 오디오 콘텐츠에 연관되는 비디오 콘텐츠를 디스플레이하도록 구성되는 디스플레이 디바이스를 더 포함하는, 전자 장치.
  10. 제9항에 있어서, 상기 회로부는,
    상기 헤드마운트 오디오 디바이스와의 무선 공유를 위해 상기 제2 오디오 콘텐츠의 인코딩에 연관되는 제1 프로세싱 지연을 컴퓨팅하며;
    상기 헤드마운트 오디오 디바이스에서 상기 제2 오디오 콘텐츠의 디코딩에 연관되는 제2 프로세싱 지연을 컴퓨팅하며; 그리고
    컴퓨팅된 상기 제1 프로세싱 지연 및 상기 제2 프로세싱 지연에 기초하여 상기 헤드마운트 오디오 디바이스 상의 상기 제2 오디오 콘텐츠의 플레이백과 동기화하기 위해 상기 비디오 콘텐츠의 상기 디스플레이의 시간을 교정하도록 추가로 구성되는, 전자 장치.
  11. 제1항에 있어서, 상기 하나 이상의 특징들은 상기 제1 오디오 콘텐츠의 다수의 오디오 프레임들의 진폭, 상기 제1 오디오 콘텐츠의 가청 주파수 대역의 진폭 레벨들, 상기 제1 오디오 콘텐츠의 동적 범위, 상기 제1 오디오 콘텐츠에서의 스피치 프레임들의 진폭 레벨들, 또는 상기 제1 오디오 콘텐츠의 오디오 프레임들을 위한 이득 레벨들에서의 조정을 위한 규정 속력을 포함하는, 전자 장치.
  12. 방법으로서,
    미디어 소스로부터 제1 오디오 콘텐츠를 수신하는 단계;
    청각 장애가 있는 제1 사용자를 헤드마운트 오디오 디바이스의 착용자로서 검출하는 단계;
    검출된 제1 사용자에 연관되는 오디오 향상 프로파일에 기초하여 상기 제1 오디오 콘텐츠의 하나 이상의 특징들을 수정하는 단계;
    상기 수정에 기초하여 제2 오디오 콘텐츠를 생성하는 단계; 및
    생성된 제2 오디오 콘텐츠를 상기 헤드마운트 오디오 디바이스와 공유하는 단계
    를 포함하는, 방법.
  13. 제12항에 있어서, 공유된 청취 경험을 위해 상기 헤드마운트 오디오 디바이스 상의 상기 제2 오디오 콘텐츠의 플레이백과 동시에 상기 제1 오디오 콘텐츠를 플레이하기 위해 오디오 재생 시스템을 제어하는 단계를 더 포함하는, 방법.
  14. 제12항에 있어서,
    상기 제1 사용자와 상기 헤드마운트 오디오 디바이스를 포함하는 청취 환경의 이미지를 캡처하도록 상기 이미지 캡처 디바이스를 제어하는 단계; 및
    캡처된 이미지에 기초하여 상기 제1 사용자를 상기 헤드마운트 오디오 디바이스의 상기 착용자로서 검출하는 단계를 더 포함하는, 방법.
  15. 제12항에 있어서, 상기 오디오 향상 프로파일은 상기 제1 사용자의 좌측 귀 및 우측 귀 둘 다에 대한 상기 제1 사용자의 청력 곡선을 포함하는 오디오그램인, 방법.
  16. 제15항에 있어서,
    상기 제1 사용자의 상기 청력 곡선을 정상적인 청력 레벨들을 갖는 제2 사용자의 기준 청력 곡선과 비교하는 단계; 및
    상기 비교에 기초하여 상기 수정을 위해 상기 제1 오디오 콘텐츠의 상기 하나 이상의 특징들을 결정하는 단계를 더 포함하는, 방법.
  17. 제15항에 있어서,
    상기 제1 사용자에 대한 상기 청력 곡선이 상기 제1 사용자의 상기 좌측 귀 또는 상기 우측 귀 중 하나에 대한 청각 장애 상태를 나타낸다는 결정에 기초하여 제1 오디오 부분을 상기 제1 오디오 콘텐츠의 좌측 채널 오디오 또는 우측 채널 오디오 중 하나로서 선택하는 단계;
    상기 제1 오디오 콘텐츠의 선택된 제1 오디오 부분의 상기 하나 이상의 특징들을 수정하는 단계; 및
    상기 수정에 기초하여 상기 제2 오디오 콘텐츠를 생성하는 단계를 더 포함하는, 방법.
  18. 제12항에 있어서,
    해당 가청 주파수 세트에서 테스트 톤 세트를 순차적으로 플레이하기 위해 상기 헤드마운트 오디오 디바이스를 제어 ― 각각의 테스트 톤의 소리크기는 상기 각각의 테스트 톤이 상기 헤드마운트 오디오 디바이스 상에서 플레이되는 동안 증가됨 ― 하는 단계;
    상기 테스트 톤 세트가 상기 헤드마운트 오디오 디바이스 상에서 순차적으로 플레이되는 동안 사용자 입력 세트 ― 각각의 사용자 입력은 상기 각각의 테스트 톤에 대한 청취 임계 레벨을 나타냄 ― 를 수신하는 단계; 및
    수신된 사용자 입력 세트에 기초하여 오디오그램 상의 청력 곡선을 상기 제1 사용자에 대한 상기 오디오 향상 프로파일로서 생성하는 단계를 더 포함하는, 방법.
  19. 제12항에 있어서,
    상기 헤드마운트 오디오 디바이스와의 무선 공유를 위해 상기 제2 오디오 콘텐츠의 인코딩에 연관되는 제1 프로세싱 지연을 컴퓨팅하는 단계;
    상기 헤드마운트 오디오 디바이스에서 상기 제2 오디오 콘텐츠의 디코딩에 연관되는 제2 프로세싱 지연을 컴퓨팅하는 단계; 및
    컴퓨팅된 상기 제1 프로세싱 지연 및 상기 제2 프로세싱 지연에 기초하여 상기 헤드마운트 오디오 디바이스 상의 상기 제2 오디오 콘텐츠의 플레이백과 동기화하기 위해 상기 제1 오디오 콘텐츠에 연관되는 비디오 콘텐츠의 디스플레이의 시간을 교정하는 단계를 더 포함하는, 방법.
  20. 전자 장치에서 컴퓨터에 의해 실행될 때, 상기 전자 장치로 하여금 동작들을 실행하게 하는 컴퓨터 실행가능 명령어들을 저장한 비일시적 컴퓨터 판독가능 매체로서,
    상기 동작들은,
    미디어 소스로부터 제1 오디오 콘텐츠를 수신하는 동작;
    청각 장애가 있는 제1 사용자를 헤드마운트 오디오 디바이스의 착용자로서 검출하는 동작;
    검출된 제1 사용자에 연관되는 오디오 향상 프로파일에 기초하여 상기 제1 오디오 콘텐츠의 하나 이상의 특징들을 수정하는 동작; 및
    상기 수정에 기초하여 제2 오디오 콘텐츠를 생성하는 동작; 및
    생성된 제2 오디오 콘텐츠를 상기 헤드마운트 오디오 디바이스와 공유하는 동작
    을 포함하는, 비일시적 컴퓨터 판독가능 매체.
KR1020227040839A 2020-08-28 2021-08-26 공유된 청취 환경에서 청각 장애인을 위한 오디오 향상 KR20230004754A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US17/006,476 US11622197B2 (en) 2020-08-28 2020-08-28 Audio enhancement for hearing impaired in a shared listening environment
US17/006,476 2020-08-28
PCT/IB2021/057837 WO2022043916A1 (en) 2020-08-28 2021-08-26 Audio enhancement for hearing impaired in a shared listening environment

Publications (1)

Publication Number Publication Date
KR20230004754A true KR20230004754A (ko) 2023-01-06

Family

ID=77595596

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227040839A KR20230004754A (ko) 2020-08-28 2021-08-26 공유된 청취 환경에서 청각 장애인을 위한 오디오 향상

Country Status (6)

Country Link
US (1) US11622197B2 (ko)
EP (1) EP4165882A1 (ko)
JP (1) JP2023538448A (ko)
KR (1) KR20230004754A (ko)
CN (1) CN115136620A (ko)
WO (1) WO2022043916A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AT525364B1 (de) * 2022-03-22 2023-03-15 Oliver Odysseus Schuster Audiosystem
US20240143144A1 (en) * 2022-10-27 2024-05-02 Sony Group Corporation Quick and easy audio profile creation and use
US20240155178A1 (en) * 2022-11-03 2024-05-09 Roku, Inc. Private listening system for streaming audio and video

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100926469B1 (ko) 2002-01-31 2009-11-13 톰슨 라이센싱 가변 지연을 제공하는 오디오/비디오 시스템과, 제 1 지연된 디지털 신호에 대해 제 2 디지털 신호를 동기화하기 위한 방법
CA2485100C (en) 2002-05-06 2012-10-09 David Goldberg Localized audio networks and associated digital accessories
GB2469793B (en) 2009-04-24 2012-11-28 Hearing Products Internat Ltd A hearing assistance amplification device with headset and microphone detection
JP2013057705A (ja) 2011-09-07 2013-03-28 Sony Corp 音声処理装置、音声処理方法および音声出力装置
US10433081B2 (en) 2012-07-06 2019-10-01 Jacoti Bvba Consumer electronics device adapted for hearing loss compensation
WO2014040667A1 (en) 2012-09-12 2014-03-20 Sony Corporation Audio system, method for sound reproduction, audio signal source device, and sound output device
US9531921B2 (en) * 2013-08-30 2016-12-27 Audionow Ip Holdings, Llc System and method for video and secondary audio source synchronization
US9971319B2 (en) * 2014-04-22 2018-05-15 At&T Intellectual Property I, Lp Providing audio and alternate audio simultaneously during a shared multimedia presentation
WO2017025946A1 (en) * 2015-08-13 2017-02-16 Meq Inc. Playing modified audio signals to a group of listeners

Also Published As

Publication number Publication date
CN115136620A (zh) 2022-09-30
US11622197B2 (en) 2023-04-04
EP4165882A1 (en) 2023-04-19
WO2022043916A1 (en) 2022-03-03
US20220070583A1 (en) 2022-03-03
JP2023538448A (ja) 2023-09-07

Similar Documents

Publication Publication Date Title
US20230209284A1 (en) Communication device and hearing aid system
US10129729B2 (en) Smartphone Bluetooth headset receiver
US10241741B2 (en) Audio processing based upon camera selection
US11622197B2 (en) Audio enhancement for hearing impaired in a shared listening environment
US20140226842A1 (en) Spatial audio processing apparatus
US10121491B2 (en) Intelligent volume control interface
US20220369034A1 (en) Method and system for switching wireless audio connections during a call
US20150049879A1 (en) Method of audio processing and audio-playing device
TWM519370U (zh) 具有可依據聽力生理狀況調整等化器設定之電子裝置及聲音播放裝置
CN110996143B (zh) 数字电视信号处理方法、电视机、装置及存储介质
US11330371B2 (en) Audio control based on room correction and head related transfer function
CN112088353A (zh) 动态处理效果体系架构
US20150281858A1 (en) Method of processing voice signal output and earphone
US11042354B1 (en) Audio adjustment control for wireless device
US11895472B2 (en) Audio system with mixed rendering audio enhancement
US11449305B2 (en) Playing sound adjustment method and sound playing system
US20230292032A1 (en) Dual-speaker system
Know Widex Hearing Aids in The UK & Ireland
CN116048448A (zh) 一种音频播放方法及电子设备
WO2017157986A1 (en) Audio processing device
TW201703491A (zh) 電話語音處理方法及可撥打電話之電子裝置
JP2016019263A (ja) 音声通信装置およびプログラム

Legal Events

Date Code Title Description
E902 Notification of reason for refusal