JP7501632B2 - ユーザ入力に基づく複数出力制御 - Google Patents

ユーザ入力に基づく複数出力制御 Download PDF

Info

Publication number
JP7501632B2
JP7501632B2 JP2022534838A JP2022534838A JP7501632B2 JP 7501632 B2 JP7501632 B2 JP 7501632B2 JP 2022534838 A JP2022534838 A JP 2022534838A JP 2022534838 A JP2022534838 A JP 2022534838A JP 7501632 B2 JP7501632 B2 JP 7501632B2
Authority
JP
Japan
Prior art keywords
audio
audio portion
output
output port
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022534838A
Other languages
English (en)
Other versions
JP2023505986A (ja
Inventor
マーヤー ネジャト
ブラント キャンデロア
ピーター シンタニ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Sony Group Corp
Original Assignee
Sony Corp
Sony Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp, Sony Group Corp filed Critical Sony Corp
Publication of JP2023505986A publication Critical patent/JP2023505986A/ja
Application granted granted Critical
Publication of JP7501632B2 publication Critical patent/JP7501632B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • G06V40/193Preprocessing; Feature extraction
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B21/00Teaching, or communicating with, the blind, deaf or mute
    • G09B21/001Teaching or communicating with blind persons
    • G09B21/006Teaching or communicating with blind persons using audible presentation of the information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/4104Peripherals receiving signals from specially adapted client devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4722End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration
    • H04N21/4852End-user interface for client configuration for modifying audio parameters, e.g. switching between mono and stereo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B21/00Teaching, or communicating with, the blind, deaf or mute
    • G09B21/001Teaching or communicating with blind persons
    • G09B21/003Teaching or communicating with blind persons using tactile presentation of the information, e.g. Braille displays
    • G09B21/004Details of particular tactile cells, e.g. electro-mechanical or mechanical layout
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2420/00Details of connection covered by H04R, not provided for in its groups
    • H04R2420/03Connection circuits to selectively connect loudspeakers or headphones to amplifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2420/00Details of connection covered by H04R, not provided for in its groups
    • H04R2420/07Applications of wireless loudspeakers or wireless microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2420/00Details of connection covered by H04R, not provided for in its groups
    • H04R2420/09Applications of special connectors, e.g. USB, XLR, in loudspeakers, microphones or headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/15Transducers incorporated in visual displaying devices, e.g. televisions, computer displays, laptops

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Educational Technology (AREA)
  • Educational Administration (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Ophthalmology & Optometry (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • User Interface Of Digital Computer (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Television Signal Processing For Recording (AREA)

Description

〔関連出願との相互参照/引用による組み入れ〕
なし
本開示の様々な実施形態は、メディア制御装置の出力制御に関する。具体的には、本開示の様々な実施形態は、ユーザ入力に基づいてメディア制御装置の出力ポートを制御する装置及び方法に関する。
最近のメディアコンテンツ再生分野の進歩は、メディア制御装置(例えば、テレビ)を制御するための様々な技術の発展をもたらした。いくつかの状況では、レンダリングされたメディアコンテンツ(例えば、オーディオビデオコンテンツ)が、現在レンダリングされているメディアコンテンツのビデオ部分を記述できるアクセシビリティ情報としての記述情報の再生を含むことができる。健常者及び(視覚障害者などの)障害者の両方を含む複数の人々を含むことができる共有視聴環境では、メディアコンテンツ内の記述情報の再生が絶対不可欠でない場合もあり、ユーザ(例えば、健常者)によってはこれを望まない可能性もある。
当業者には、説明したシステムと、本出願の残り部分において図面を参照しながら示す本開示のいくつかの態様とを比較することにより、従来の慣習的な手法のさらなる限界及び不利点が明らかになるであろう。
実質的に少なくとも1つの図に関連して図示及び/又は説明し、特許請求の範囲にさらに完全に示すような、メディア制御装置、及びメディア制御装置の出力ポートの制御方法を提供する。
全体を通じて同じ要素を同じ参照符号によって示す添付図面を参照しながら本開示の以下の詳細な説明を検討することにより、本開示のこれらの及びその他の特徴及び利点を理解することができる。
本開示の実施形態による、ユーザ入力に基づいてメディア制御装置の出力ポートを制御する例示的なネットワーク環境を示すブロック図である。 本開示の実施形態による、図1の例示的なメディア制御装置を示すブロック図である。 本開示の実施形態による、図1のメディア制御装置の出力ポートを制御する例示的なシナリオを示す図である。 本開示の実施形態による、図1のメディア制御装置の出力ポートを制御する例示的なシナリオを示す図である。 本開示の実施形態による、図1のメディア制御装置の出力ポートを制御する例示的なシナリオを示す図である。 本開示の実施形態による、メディア制御装置の出力ポートを制御する例示的な方法を示すフローチャートである。
メディアコンテンツの異なるオーディオ部分の出力を視聴者の設定に応じて制御する本開示のメディア制御装置及び方法では、後述する実装を見出すことができる。本開示の例示的な態様では、メディアコンテンツ(例えば、映画などのオーディオビデオコンテンツ)の様々なオーディオ部分(例えば、限定するわけではないが、会話部分、ビデオ記述)をメディアコンテンツの視聴者の設定に基づいて出力する複数の出力ポートを含むことができるメディア制御装置(例えば、テレビ)を提供する。メディア制御装置は、(視聴者などの)ユーザの障害情報(例えば、視覚障害に関する情報)を示すユーザ入力を受け取るように構成することができる。ユーザ入力は、ユーザの設定に対応することができる。さらに、メディア制御装置は、複数の出力ポートのうちの第1の出力ポートを、メディアコンテンツの第1のオーディオ部分(例えば、会話部分及び背景音楽)を出力するように制御するよう構成される。メディア制御装置は、複数の出力ポートのうちの第2の出力ポートを、受け取られたユーザ入力(すなわち、設定)に基づいて第1のオーディオ部分及び第2のオーディオ部分(例えば、メディアコンテンツの画像部分の音声形態での記述)を出力するように制御するようさらに構成される。画像部分の記述の例としては、以下に限定するわけではないが、メディアコンテンツ内の登場人物の記述、レンダリングされるメディアコンテンツのシーンの場所の記述、メディアコンテンツのシーン内の環境条件の記述、又はメディアコンテンツのシーン内に現れるテキストの記述などを挙げることができる。画像部分は、第1の出力ポートを介した第1のオーディオ部分の出力と共にメディア制御装置上でレンダリングされる画像フレーム、ショット又はシーンとすることができる。
メディア制御装置上でレンダリングされるメディアコンテンツには、1人のユーザ(例えば、健常者ユーザ又は障害者ユーザとすることができる視聴者)がアクセス又は視聴することも、或いは集団でメディアコンテンツにアクセスできる複数のユーザ(すなわち、健常者ユーザ及び視覚障害者のような障害者ユーザ)を含む共有視聴環境でアクセスすることもできる。共有視聴環境では、これらのユーザが、メディアコンテンツのオーディオに関連する異なる要件又は設定を有することがある。例えば、健常者ユーザは、メディアコンテンツの第2のオーディオ部分(すなわち、音声形態での画像部分の記述)を必要としない可能性があるのに対し、(視覚障害者ユーザなどの)障害者ユーザは、レンダリングされたメディアコンテンツを理解するために第2のオーディオ部分を必要とする可能性がある。従って、開示するメディア制御装置は、第1の出力ポートを介した第1のオーディオ部分(すなわち、画像部分の音声記述を含まない音声会話)の出力を健常者ユーザのために制御するとともに、第2のポートを介した第1のオーディオ部分及び第2のオーディオ部分(すなわち、音声形態での画像部分の記述)の両方の出力を障害者ユーザのために制御することができる。従って、共有視聴環境では、一方のユーザ(例えば、障害者ユーザ)の設定に基づいて複数のユーザ(健常者ユーザ及び障害者ユーザ)にメディアコンテンツの異なるオーディオ部分を同時にレンダリングすることができる。
さらに、第1の出力ポートからは第2のオーディオ部分が出力されないので、第1の出力ポートを介して第1のオーディオ部分のみを受け取ることができる健常者ユーザが、第2の出力ポート上での第2のオーディオ部分のレンダリングによって気を散らされたり又は邪魔されたりしないようにすることができる。さらに、障害者ユーザは、自身が必要とする通りに又は設定した通りに第2の出力ポートを介して第1のオーディオ部分及び第2のオーディオ部分(すなわち、音声形態での画像/ビデオ記述)の両方を含むメディアコンテンツのレンダリングを体験することができる。従って、開示するメディア制御装置は、共有視聴環境においてそれぞれの設定に基づいてメディアコンテンツの異なる部分を健常者ユーザ及び障害者ユーザの両方にまとめて出力することができる。
いくつかの実装では、メディア制御装置が、2つの別個のオーディオトラック、すなわち(会話部分などの第1のオーディオ部分と第2のオーディオ部分との組み合わせを含むトラックのような)音声形態での画像部分の記述を含む第1のトラックと、(第1のオーディオ部分のみのような)音声形態での画像部分の記述を含まない第2のトラックとを受け取り又は予め記憶しておくことができると理解することができる。メディア制御装置は、障害者ユーザについては画像部分の音声記述と会話部分とを含む第1のトラックを第2のポートを介して直接レンダリングすることができる。メディア制御装置は、2つの完全に独立したオーディオトラックを復号して第1のトラック及び第2のトラックを抽出することができる。いくつかの実施形態では、第1のトラックが、音声形態での画像部分の記述のみを第2のオーディオ部分として含み、第1のオーディオ部分を含まないことができる。従って、このような場合、メディア制御装置は、(音声形態での記述を含む)第1のトラックと(記述のない会話部分を含む)第2のトラックとを融合して結合オーディオを形成し、障害者ユーザのために第2のポートを介してレンダリングすることができる。他のいくつかの実施形態では、メディア制御装置が、画像部分の記述(すなわち、ビデオ記述)をテキスト形態で受信又は記憶し、さらにテキスト-音声変換動作を実行してテキスト形態を音声形態に変換し、これを第2のトラック(記述のない会話部分を含む)とさらに融合して結合オーディオを形成し、障害者ユーザのために第2のポートを介してレンダリングすることができる。上述した全ての実施形態では、画像部分(すなわち、ビデオ記述)を完全なオーディオトラック又は単なるテキスト形態のいずれかとして受け取ることができ、開示するメディア制御装置は、第1のオーディオ部分(すなわち、記述を含まないオーディオ部分)をレンダリングできる第1のオーディオポートとは別のポートとすることができるポート(すなわち、第2のオーディオポート)に音声形態(すなわち、第2のオーディオ部分)でレンダリングされるように画像部分を自動的に制御することができる。
図1は、本開示の実施形態による、ユーザ入力に基づいてメディア制御装置の出力ポートを制御する例示的なネットワーク環境を示すブロック図である。図1にはネットワーク環境100を示す。ネットワーク環境100は、第1の出力ポート104と、複数の出力ポート106と、内部オーディオ再生装置108とをさらに含むことができるメディア制御装置102を含むことができる。複数の出力ポート106は、第2の出力ポート106A、第3の出力ポート106B、及び第Nの出力ポート106Nを含むことができる。図1に示すように、ネットワーク環境100は、第1の外部オーディオ再生装置110、第2の外部オーディオ再生装置112、画像取り込み装置114、サーバ116、及び通信ネットワーク118をさらに含むことができる。メディア制御装置102、画像取り込み装置114及びサーバ116は、通信ネットワーク118を介して互いに結合することができる。さらに、図1に示すように、第2の外部オーディオ再生装置112は、無線通信媒体120を介してメディア制御装置102に結合することができる。
図1に示すように、ネットワーク環境100は、メディア制御装置102に関連する第1のユーザ122A及び第2のユーザ122Bをさらに含むことができる。第1のユーザ122A及び第2のユーザ122Bは、メディア制御装置102がメディアコンテンツ(例えば、オーディオビデオコンテンツ)をレンダリングする対象のユーザ又は視聴者とすることができる。ある実施形態では、第1のユーザ122Aを健常者ユーザとし、第2のユーザを障害者ユーザ(例えば、視覚障害者ユーザ)とすることができる。図1では、画像取り込み装置114をメディア制御装置102から分離して示しているが、本開示はこのように限定されるものではない。いくつかの実施形態では、本開示の範囲から逸脱することなく、画像取り込み装置114をメディア制御装置102に統合することもできる。
メディア制御装置102は、視聴者の設定に従ってメディアコンテンツの異なるオーディオ部分の出力を制御するように構成できる好適なロジック、回路、インターフェイス及び/又はコードを含むことができる。メディア制御装置102は、サーバ116と通信してメディアコンテンツのオーディオ部分を含むメディアコンテンツを受け取るように構成することができる。ある実施形態によれば、メディア制御装置102は、サーバ116から受け取られたメディアコンテンツを記憶するようにさらに構成することができる。メディア制御装置102は、ユーザ(例えば、第2のユーザ122B)の障害情報を示すユーザ入力を受け取り、第1の出力ポートをメディアコンテンツの第1のオーディオ部分を出力するように制御するようさらに構成することができる。メディア制御装置102は、受け取られたユーザ入力に基づいて、メディアコンテンツの第1の画像部分を記述する第2のオーディオ部分を検索するようにさらに構成されるとともに、第2の出力ポートを、受け取られたユーザ入力に基づいて第1のオーディオ部分及び第2のオーディオ部分を出力するようにさらに制御することができる。或いは、メディア制御装置102は、第2のオーディオ部分を完全に独立したオーディオトラック(すなわち、第1のオーディオ部分のオーディオコンテンツを含むことができるオーディオトラック)として受け取った場合には、受け取られたユーザ入力に基づいて第2の出力ポートを介して第2のオーディオ部分(すなわち、完全なオーディオトラック)を出力することもできる。メディア制御装置102の例としては、以下に限定するわけではないが、テレビ、携帯電話機、スマートフォン、タブレットコンピュータ装置、パーソナルコンピュータ、ラップトップ、ゲーム機、メディアプレーヤ、ディスプレイ能力付きサウンドシステム、スマートオーディオ装置、ホームシアターシステム、デジタルカメラ、ヘッドマウント装置、自動車電子装置、電子楽器、又はメディアレンダリング能力を有するその他の消費者電子装置を挙げることができる。
第1の出力ポート104は、メディア制御装置102を第1の外部オーディオ再生装置110に結合するように構成できる好適なロジック、回路及び/又はインターフェイスを含むことができる。メディア制御装置102は、第1の出力ポート104を介して第1の外部オーディオ再生装置110に第1のオーディオ部分を出力することができる。第1の出力ポート104の例としては、以下に限定するわけではないが、ユニバーサルシリアルバス(USB)オーディオポート、3.5ミリメートル(mm)オーディオポート、2.5mmオーディオポート、6.3mmオーディオポート、ラジオコーポレーションオブアメリカ(RCA)オーディオポート、高品位マルチメディアインターフェイス(HDMI)オーディオポート、HDMIオーディオリターンチャンネル(ARC)オーディオポート、又は光オーディオポートを挙げることができる。いくつかの実施形態では、図1に示すように、第1の出力ポート104が、有線接続又はケーブル124を通じてメディア制御装置102と第1の外部オーディオ再生装置110とを結合することができる。有線ケーブル124の例としては、以下に限定するわけではないが、USBケーブル、6.3/3.5/2.5mmケーブル、RCAケーブル、HDMIケーブル、HDMI ARCケーブル、又はオーディオ信号を伝えることができる有線ケーブルを挙げることができる。いくつかの実施形態では、図1に示すように、有線接続126を介して第1の出力ポート104を内部オーディオ再生装置108に内部的に接続することができる。
なお、図1に示すメディア制御装置102と第1の外部オーディオ再生装置110との間の有線接続又はケーブル124は一例として示すものにすぎない。本開示は、第1の出力ポート104が無線通信媒体120を介してメディア制御装置102と第1の外部オーディオ再生装置110とを結合できる他のシナリオにも適用可能である。このようなシナリオでは、第1の出力ポート104の例として、以下に限定するわけではないが、Bluetooth(登録商標)オーディオポート、Wi-Fiオーディオポート、Zigbee(登録商標)オーディオポート、近距離通信ポート、又は短距離通信ポートを挙げることができる。
第2の出力ポート106Aは、(例えば、無線通信媒体120を介して)メディア制御装置102と第2の外部オーディオ再生装置112とを結合するように構成できる好適なロジック、回路及び/又はインターフェイスを含むことができる。メディア制御装置102は、第2の出力ポート106Aを介して第1のオーディオ部分(すなわち、会話部分)及び第2のオーディオ部分(すなわち、記述)を第2の外部オーディオ再生装置112に出力することができる。第2の出力ポート106Aの例としては、以下に限定するわけではないが、Bluetooth(登録商標)オーディオポート、Wi-Fiオーディオポート、Zigbee(登録商標)オーディオポート、近距離通信ポート、又は短距離通信ポートなどの無線オーディオポートを挙げることができる。なお、図1に示すメディア制御装置102と第2の外部オーディオ再生装置112との間の無線通信媒体120は一例として示すものにすぎない。本開示は、第2の出力ポート106Aが(有線接続又はケーブル124などの)有線接続を介してメディア制御装置102と第2の外部オーディオ再生装置112とを結合できる他のシナリオにも適用可能である。このようなシナリオでは、第2の出力ポート106Aの例として、以下に限定するわけではないが、USBポート、3.5/2.5/6.3mmオーディオポート、光オーディオポート、HDMIオーディオポート、HDMI ARCオーディオポート又はRCAオーディオポートなどの有線オーディオポートを挙げることができる。
内部オーディオ再生装置108は、メディアコンテンツの第1のオーディオ部分などのオーディオ出力を再生するように構成できる好適なロジック、回路及び/又はインターフェイスを含むことができる。内部オーディオ再生装置108は、メディア制御装置102の(図2に示す)回路から第1のオーディオ部分に関連する電気オーディオ信号を受け取り、受け取った電気オーディオ信号をオーディオ/サウンド出力に変換するように構成することができる。内部オーディオ再生装置108の例としては、以下に限定するわけではないが、スピーカ、ラウドスピーカ、ウーファ、サブウーファ、ツイータ、ワイヤレススピーカ、モニタスピーカ、又はその他のスピーカ又はサウンド出力装置を挙げることができる。図1に示すように、内部オーディオ再生装置108は、メディア制御装置102に内蔵又は一体化されたスピーカとすることができる。
第1の外部オーディオ再生装置110は、メディアコンテンツの第1のオーディオ部分及び/又は第2のオーディオ部分などのオーディオ出力を再生するように構成できる好適なロジック、回路及び/又はインターフェイスを含むことができる。第1の外部オーディオ再生装置110は、メディア制御装置102から第1のオーディオ部分又は第2のオーディオ部分のいずれかに関連する電気オーディオ信号を受け取り、受け取った電気オーディオ信号をオーディオ/サウンド出力に変換するように構成することができる。いくつかの実施形態では、第1の外部オーディオ再生装置110が、第1の出力ポート104及び有線接続又はケーブル124(又は無線通信媒体120)を介してメディア制御装置102に通信可能に結合することができる。第1の外部オーディオ再生装置110の例としては、以下に限定するわけではないが、ヘッドホン、イヤホン、ハンズフリー、ワイヤレスイヤホン、ワイヤレスヘッドセット、ラウドスピーカ、ワイヤレススピーカ、サウンドバー、Bluetooth(登録商標)(オーディオビデオ)AVシステム、Bluetooth(登録商標)サウンドバーなどを挙ることができる。
第2の外部オーディオ再生装置112の機能は、例えば図1で説明した第1の外部オーディオ再生装置110の機能と同じものとすることができる。従って、第2の外部オーディオ再生装置112の説明については、簡潔さのために本開示からは省略する。
画像取り込み装置114は、第1のユーザ122A又は第2のユーザ122Bなどのユーザの1又は2以上の画像を取り込むように構成できる好適なロジック、回路、インターフェイス及び/又はコードを含むことができる。ある実施形態によれば、画像取り込み装置114は、メディア制御装置102から1又は2以上の制御命令を受け取った時に1又は2以上の画像を取り込むことができる。1又は2以上の画像は、(視覚障害を有する第2のユーザ122Bなどの)ユーザの障害情報を示すことができる。画像取り込み装置114の例としては、以下に限定するわけではないが、イメージセンサ、広角カメラ、360度カメラ、アクションカメラ、閉回路テレビ(CCTV)カメラ、カムコーダ、デジタルカメラ、カメラフォン、飛行時間カメラ(ToFカメラ)、暗視カメラ、及び/又はその他の画像取り込み装置を挙げることができる。
サーバ116は、通信ネットワーク118を介してメディア制御装置102と通信するように構成できる好適なロジック、回路、インターフェイス及び/又はコードを含むことができる。サーバ116は、メディア制御装置102に配信するメディアコンテンツを記憶するように構成することができる。サーバ116は、メディア制御装置102からコンテンツ要求を受け取り、受け取ったコンテンツ要求に基づいて、記憶されたメディアコンテンツをメディア制御装置102に提供することができる。サーバ116の例としては、以下に限定するわけではないが、アプリケーションサーバ、メディアコンテンツサーバ、クラウドサーバ、メインフレームサーバ、データベースサーバ、ファイルサーバ、ウェブサーバ、又はその他のタイプのサーバを挙げることができる。
通信ネットワーク118は、メディア制御装置102、画像取り込み装置114及びサーバ116が互いに通信できるようにする通信媒体を含むことができる。通信ネットワーク118の例としては、以下に限定するわけではないが、インターネット、クラウドネットワーク、ワイヤレスフィデリティ(Wi-Fi)ネットワーク、パーソナルエリアネットワーク(PAN)、ローカルエリアネットワーク(LAN)、又はメトロポリタンエリアネットワーク(MAN)を挙げることができる。サーバ116及び画像取り込み装置114などのネットワーク環境100内の様々なエンティティは、様々な有線及び無線通信プロトコルに従って通信ネットワーク118に接続するように構成することができる。このような有線及び無線通信プロトコルの例としては、以下に限定するわけではないが、伝送制御プロトコル・インターネットプロトコル(TCP/IP)、ユーザデータグラムプロトコル(UDP)、ハイパーテキスト転送プロトコル(HTTP)、ファイル転送プロトコル(FTP)、ZigBee、EDGE、IEEE802.11、ライトフィデリティ(Li-Fi)、802.16、IEEE802.11s、IEEE802.11g、マルチホップ通信及び無線アクセスポイント(AP)のうちの少なくとも1つを挙げることができる。
無線通信媒体120は、メディア制御装置102及び第2の外部オーディオ再生装置112(又は第1の外部オーディオ再生装置110)が互いに無線で通信できるようにする無線通信チャンネルを含むことができる。無線通信媒体120の例としては、以下に限定するわけではないが、ワイヤレスフィデリティ(Wi-Fi)ネットワーク、近距離通信(NFC)チャンネル及びBluetooth(登録商標)(BT)通信ネットワークなどの短距離通信技術を挙げることができる。第2の外部オーディオ再生装置112などのネットワーク環境100内の様々なエンティティは、様々な無線通信プロトコルに従って無線通信媒体120に接続するように構成することができる。このような無線通信プロトコルの例としては、以下に限定するわけではないが、無線装置間通信プロトコル、又はBluetooth(登録商標)通信プロトコルのうちの少なくとも1つを挙げることができる。
メディア制御装置102は、動作時にユーザ(例えば、第2のユーザ122B)の障害情報を示すユーザ入力を受け取ることができる。第2のユーザ122Bに関連する障害情報は、第2のユーザ122Bにおける(視覚障害などの)障害の存在を肯定することができる。ある実施形態によれば、第2のユーザ122Bにおける視覚障害に関するユーザ入力を第1のユーザ122A又は第2のユーザ122Bから受け取ることができる。一例として、メディア制御装置102は、第1のユーザ122Aから「視覚健常者」としてのユーザ入力を受け取り、第2のユーザ122Bから「視覚障害者」としての別のユーザ入力を受け取ることができる。第2のユーザ122B(すなわち、視覚障害者)からのユーザ入力は、第2のユーザ122Bがメディアコンテンツの画像部分を理解するために第1のオーディオ部分(すなわち、会話部分)及び音声形態の第2のオーディオ部分(すなわち、記述)を望むことを示すことができる。同様に、第1のユーザ122A(すなわち、視覚健常者)からのユーザ入力は、第1のユーザ122Aが音声形態の第2のオーディオ部分(すなわち、記述)を望まないことを示すことができる。いくつかの実施形態では、メディア制御装置102が、第1のユーザ122A及び第2のユーザ122Bの一方/両方の障害情報をユーザ入力として決定するために、画像取り込み装置114を第1のユーザ122A及び/又は第2のユーザ122Bの画像を取り込むように制御することができる。障害情報を示すユーザ入力の受信、及び画像取り込み装置114によって取り込まれた画像に基づく障害情報の判定については、例えば図3Aにおいてさらに説明する。
メディア制御装置102は、第1の出力ポート104をメディアコンテンツの第1のオーディオ部分を出力するように制御するようさらに構成することができる。第1のオーディオ部分は、メディアコンテンツ、或いはメディアコンテンツに含まれる特定のフレーム、撮影ショット又は撮影シーンに関連する会話部分及び/又は背景音楽などのオーディオ出力に対応することができる。第1の出力ポート104を介した第1のオーディオ部分の出力の詳細については、例えば図3Aにおいて説明する。
メディア制御装置102は、受け取られたユーザ入力に基づいて、メディアコンテンツの第1の画像部分を記述できる第2のオーディオ部分を検索するようにさらに構成することができる。第2のオーディオ部分は、メディアコンテンツの第1の画像部分を記述できる音声形態での記述情報とすることができる。いくつかの実施形態では、第2の音声形態を、音声形態での記述と第1のオーディオ部分とを含むことができるオーディオトラックとすることができる。第1の画像部分は、メディアコンテンツの1又は2以上の画像フレーム、1又は2以上の撮影ショット、又は特定の撮影シーンを含むことができる。ある実施形態では、メディアコンテンツの撮影シーンが1又は2以上の撮影ショットを含むことができる。第1の画像部分は、メディアコンテンツの第1のオーディオ部分(すなわち、会話部分)に関連することができる。第2のオーディオ部分の詳細については、例えば図3Aにおいてさらに説明する。第2のユーザ122B(例えば、視覚障害者)は、第1の画像部分又は関連する文脈を理解するために第2のオーディオ部分(すなわち、現在表示されている第1の画像部分の音声記述)にアクセスしたいと望むことができる。メディア制御装置102は、ユーザ(例えば、第2のユーザ122B)の障害に関する受け取られたユーザ入力に基づいて、第2の出力ポート106Aを第1のオーディオ部分(すなわち、会話部分)及び第2のオーディオ部分(すなわち、記述)を出力するように制御するようさらに構成することができる。メディア制御装置102は、第2の出力ポート106Aを介した第1のオーディオ部分及び第2のオーディオ部分の出力のタイミングをさらに制御することができる。第2の出力ポート106Aを介した第1のオーディオ部分及び第2のオーディオ部分のタイミング制御及び出力については、例えば図3A~図3Cにおいて説明する。ある実施形態では、第1の出力ポート104を、第1のユーザ122Aが出力された第1のオーディオ部分にアクセスできるようにする(ラウドスピーカなどの)第1の外部オーディオ再生装置110に結合することができる。ある実施形態では、第2の出力ポート106Aを、第2のユーザ122Bが第2のオーディオ部分及び第1のオーディオ部分にアクセスできるようにする第2の外部オーディオ再生装置112に無線で結合することができる。従って、第1のユーザ122A(すなわち健常者ユーザ)及び第2のユーザ122B(すなわち視覚障害者ユーザ)は、いずれも開示するメディア制御装置102を使用して、共有視聴環境においてそれぞれの設定(すなわち、障害情報に関するユーザ入力)に基づいて同時にメディアコンテンツにアクセスし又はこれを視聴することができる。メディア制御装置102は、第1のユーザ122Aには第1の出力ポート104において第1のオーディオ部分(すなわち、第2のオーディオ部分を含まないオーディオ部分)のみを提供し、第2のユーザ122Bには第2の出力ポート106Aにおいて第1のオーディオ部分及び第2のオーディオ部分を提供することができる。従って、第1のユーザ122A及び第2のユーザ122Bは、いずれも共有視聴環境においてそれぞれの設定に従ってメディアコンテンツの必要なオーディオ部分にアクセスすることができる。
図2は、本開示の実施形態による、図1の例示的なメディア制御装置を示すブロック図である。図2にはメディア制御装置102のブロック図200を示す。メディア制御装置102は、回路202、第1の出力ポート104、及び複数の出力ポート106を含むことができる。複数の出力ポート106は、第2の出力ポート106A、第3の出力ポート106B、及び第Nの出力ポート106Nをさらに含むことができる。メディア制御装置102は、その統合部分としての画像取り込み装置114をさらに含むことができる。メディア制御装置102は、(ディスプレイ装置206及び内部オーディオ再生装置108を含むことができる)入力出力(I/O)装置204、メモリ208及びメディア制御装置102を(図2には示していない)通信ネットワーク118に接続できるようにするネットワークインターフェイス210をさらに含むことができる。さらに、メディア制御装置102は、テキスト-音声変換器212及びチューナ214をさらに含むことができる。
回路202は、メディア制御装置102によって実行されるべき異なる動作に関連するプログラム命令を実行するように構成できる好適なロジック、回路及び/又はインターフェイスを含むことができる。例えば、これらの動作の一部としては、メディアコンテンツのレンダリング、画像取り込み装置114の制御、障害情報を示すユーザ入力の受信、メディアコンテンツの第1のオーディオ部分を出力するための第1の出力ポート104の制御、受け取られたユーザ入力に基づいてメディアコンテンツの第1の画像部分を記述できる第2のオーディオ部分の検索、及び受け取られたユーザ入力に基づいて第1のオーディオ部分及び第2のオーディオ部分を出力するための第2の出力ポートの制御を挙げることができる。回路202は、独立したプロセッサとして実装できる1又は2以上の特殊処理ユニットを含むことができる。ある実施形態では、1又は2以上の特殊処理ユニットを、1又は2以上の特殊処理ユニットの機能をまとめて実行する統合プロセッサ又はプロセッサ群として実装することができる。回路202は、当業で周知の複数のプロセッサ技術に基づいて実装することができる。回路202の実装例は、X86ベースのプロセッサ、グラフィックプロセッシングユニット(GPU)、縮小命令セットコンピューティング(RISC)プロセッサ、特定用途向け集積回路(ASIC)プロセッサ、複合命令セットコンピューティング(CISC)プロセッサ、マイクロコントローラ、中央処理装置(CPU)、及び/又はその他の制御回路とすることができる。ある実施形態では、第1の出力ポート104及び複数の出力ポート106が、メディア制御装置102に含めることができるプロセッサ又は回路202のポートである。このようなシナリオでは、第1の出力ポート104及び複数の出力ポート106を、プロセッサの入力/出力ピン(図示せず)とすることができる。
I/O装置204は、入力(例えば、ユーザ入力)を受け取り、受け取った入力に基づいて出力を提供するように構成できる好適なロジック、回路、インターフェイス及び/又はコードを含むことができる。I/O装置204は、回路202と通信するように構成できる様々な入力装置及び出力装置を含むことができる。I/O装置204の例としては、以下に限定するわけではないが、タッチ画面、キーボード、マウス、ジョイスティック、ディスプレイ装置(例えば、ディスプレイ装置206)、マイク、又はオーディオ再生装置(例えば、内部オーディオ再生装置108)を挙げることができる。
ディスプレイ装置206は、メディア制御装置102の出力を表示するように構成できる好適なロジック、回路及びインターフェイスを含むことができる。ディスプレイ装置206は、メディアコンテンツの第1の画像部分(例えば、画像フレーム/ショット/シーン)をレンダリングするために利用することができる。いくつかの実施形態では、ディスプレイ装置206を、外部ディスプレイ装置、又はメディア制御装置102に関連するディスプレイ画面とすることができる。ディスプレイ装置206は、ユーザがディスプレイ装置206を介して障害情報などのユーザ入力を提供できるようにするタッチ画面とすることができる。タッチ画面は、抵抗膜式タッチ画面、静電容量式タッチ画面、熱式タッチ画面、又は回路202に入力を提供するために使用できる他のいずれかのタッチ画面のうちの少なくとも1つとすることができる。ディスプレイ装置206は、以下に限定するわけではないが、液晶ディスプレイ(LCD)ディスプレイ、発光ダイオード(LED)ディスプレイ、プラズマディスプレイ、又は有機LED(OLED)ディスプレイ技術、又はその他のディスプレイ装置のうちの少なくとも1つなどの複数の既知の技術を通じて実現することができる。ある実施形態によれば、ディスプレイ装置206は、ヘッドマウント装置(HMD)のディスプレイ画面、スマートメガネ装置、シースルーディスプレイ、投影型ディスプレイ、エレクトロクロミックディスプレイ、又は透明ディスプレイを示すことができる。
メモリ208は、回路202によって実行されるべき1又は2以上の命令を記憶するように構成できる好適なロジック、回路、インターフェイス及び/又はコードを含むことができる。メモリ208は、レンダリングすべきメディアコンテンツを記憶するように構成することができる。メモリ208は、第1のユーザ122A及び/又は第2のユーザ122Bに関連する障害情報を示すユーザ入力を記憶するようにさらに構成することができる。いくつかの実施形態では、メモリ208が、メディアコンテンツの第1の画像部分を記述できるテキスト情報を記憶することができる。テキスト情報は、第2のオーディオ部分のテキスト表現とすることができる。メモリ208の実装例としては、以下に限定するわけではないが、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、電気的に消去可能なプログラマブルリードオンリメモリ(EEPROM)、ハードディスクドライブ(HDD)、固体ドライブ(SSD)、CPUキャッシュ、及び/又はセキュアデジタル(SD)カードなどを挙げることができる。
ネットワークインターフェイス210は、通信ネットワーク118を介してメディア制御装置102、サーバ116、画像取り込み装置114間の通信を容易にするように構成できる好適なロジック、回路及び/又はインターフェイスを含むことができる。ネットワークインターフェイス210は、メディア制御装置102と通信ネットワーク118との有線又は無線通信をサポートする様々な既知の技術を使用して実装することができる。ネットワークインターフェイス210は、以下に限定するわけではないが、アンテナ、無線周波数(RF)トランシーバ、1又は2以上の増幅器、チューナ、1又は2以上の発振器、デジタルシグナルプロセッサ、コーダ-デコーダ(CODEC)チップセット、加入者IDモジュール(SIM)カード、又はローカルバッファ回路を含むことができる。
テキスト-音声変換器212は、第1の画像部分のテキスト記述などのテキスト情報を第2のオーディオ部分などの音声形態に変換するように構成できる好適なロジック、回路、インターフェイス及び/又はコードを含むことができる。テキスト-音声変換器212は、当業で周知の複数のプロセッサ技術に基づいて実装することができる。プロセッサ技術の例としては、以下に限定するわけではないが、中央処理装置(CPU)、X86ベースのプロセッサ、縮小命令セットコンピューティング(RISC)プロセッサ、特定用途向け集積回路(ASIC)プロセッサ、複合命令セットコンピューティング(CISC)プロセッサ、グラフィカルプロセッシングユニット(GPU)及びその他のプロセッサを挙げることができる。
チューナ214は、無線通信チャンネル(図示せず)を介して無線局からメディアコンテンツ(例えば、AVプログラム又はコンテンツ)を受け取るように構成できる好適なロジック、回路、インターフェイス及び/又はコードを含むことができる。メディア制御装置102(例えば、テレビ)は、チューナ214を、無線局からメディアコンテンツを受け取ることができる特定の無線周波数(RF)又はRFチャンネルに設定するように制御することができる。チューナ21は、メディアコンテンツをRF信号(すなわち、アナログ又はデジタル無線送信信号とすることができる信号)として受け取り、受け取ったRF信号をオーディオ信号及び/又はビデオ信号に変換するようにさらに構成することができる。オーディオ信号及び/又はビデオ信号は、メディアコンテンツに関連する(第1のオーディオ部分及び/又は第2のオーディオ部分などの)オーディオ信号及び(第1の画像部分などの)ビデオ信号を再生するようにさらに処理することができる。チューナ214は、異なるメディアコンテンツを受け取るためにRFチャンネルを変更するようにさらに制御することができる。チューナ214は、メディアコンテンツに関連する受信RF信号に含まれるノイズ信号をフィルタ処理又は除去するようにさらに構成することができる。ある実施形態では、チューナ214をメディア制御装置102に外部的に接続することができる。チューナ214は、位相反転線(PAL)規格、高度テレビシステム委員会(ATSC)規格、全米テレビシステム委員会(NTSC)規格、統合デジタル放送サービス(ISDB)規格などの異なるテレビ規格に使用することができる。チューナ214の例としては、以下に限定するわけではないが、アナログチューナ、デジタルチューナ、ハイブリッドチューナ、TVチューナカード及びセットトップボックスなどを挙げることができる。
当業者であれば、図2のメディア制御装置102は、本開示の機能及び動作を説明するために本明細書に示したコンポーネント又はシステムに加えて、他の好適なコンポーネント又はシステムを含むこともできると理解するであろう。メディア制御装置102の他のコンポーネント又はシステムに関する詳細な説明については、簡潔さのために本開示からは省略する。回路202の動作については、例えば図3A、図3B及び図3Cにおいてさらに説明する。
図3A~図3Cは、本開示の実施形態による、図1のメディア制御装置の出力ポートを制御する例示的なシナリオを集合的に示す図である。図3A、図3B及び図3Cの説明は、図1及び図2の要素に関連して行う。図3Aには、メディア制御装置302(例えば、テレビ(TV))、第1の出力ポート304、第2の出力ポート306、内部オーディオ再生装置308(例えば、内蔵スピーカ)、画像取り込み装置310(例えば、カメラ)、無線通信媒体312、ディスプレイ装置314(又はディスプレイ画面)、及び第2の外部オーディオ再生装置316を示す。
ある実施形態では、メディア制御装置302、第1の出力ポート304、第2の出力ポート306、内部オーディオ再生装置308、画像取り込み装置310、無線通信媒体312、ディスプレイ装置314及び第2の外部オーディオ再生装置316の機能性を、図1で説明したメディア制御装置102、第1の出力ポート104、第2の出力ポート106A、内部オーディオ再生装置108、画像取り込み装置114、無線通信媒体120、ディスプレイ装置206及び第2の外部オーディオ再生装置112の機能性とそれぞれ同様のものとすることができる。従って、メディア制御装置302、第1の出力ポート304、第2の出力ポート306、内部オーディオ再生装置308、画像取り込み装置310、無線通信媒体312、ディスプレイ装置314及び第2の外部オーディオ再生装置316の説明については、簡潔さのために本開示からは省略する。図3Aに示すように、画像取り込み装置310はメディア制御装置302と一体化することができる。
図3Aには、メディア制御装置302に関連する第1のユーザ(例えば、第1のユーザ122A)及び第2のユーザ(例えば、第2のユーザ122B)をさらに示す。第1のユーザ122A及び第2のユーザ122Bは共有視聴環境内に存在することができ、これらはいずれも、メディア制御装置302のディスプレイ装置314上にレンダリングされるメディアコンテンツの視聴者とすることができる。第1のユーザ122A及び第2のユーザ122Bは、メディア制御装置302に関連する画像取り込み装置310の視野(FOV)内に存在することができる。なお、図3Aに示す(テレビとしての)メディア制御装置302、第1の出力ポート304、第2の出力ポート306、内部オーディオ再生装置308、画像取り込み装置310及び第2の外部オーディオ再生装置316は一例として示すものにすぎない。本開示は、本開示の範囲から逸脱することなく、他のタイプのメディア制御装置302、第1の出力ポート304、第2の出力ポート306、内部オーディオ再生装置308、画像取り込み装置310及び第2の外部オーディオ再生装置316にも適用可能である。他のタイプの説明については、簡潔さのために本開示からは省略した。
図3Aを参照すると、メディア制御装置302の回路202は、第2のユーザ122Bの障害情報を示すユーザ入力を受け取るように構成することができる。ある実施形態によれば、回路は、画像取り込み装置310を(視覚障害者ユーザなどの)第2のユーザ122Bの画像を取り込むように制御するよう構成することができる。複数のユーザが存在できる共有視聴環境では、回路202を、画像取り込み装置310を第1のユーザ122A及び第2のユーザ122Bなどの複数のユーザの画像を取り込むように制御するよう構成することができる。さらに、回路202は、取り込まれた画像に基づいて複数のユーザのうちの(第2のユーザ122Bのような)1人ユーザの障害情報を決定するように構成することができる。視覚障害者ユーザに対応する障害情報は、当業で周知の画像処理技術に基づいて決定することができる。例えば、回路202は、画像取り込み装置310によって取り込まれた画像を受け取り、画像内の(斜視、ユーザの目の色などの)目の特徴又は(一般に視覚障害者によって使用されるメガネなどの)アイギア(eye gear)の存在を分析して、(第2のユーザ122Bなどの)ユーザにおける視覚障害の存在を障害情報として識別することができる。いくつかの実施形態では、回路202が、取り込み画像から識別された障害情報を受信ユーザ入力とみなすことができる。回路202は、ユーザ入力としての障害情報をさらなる使用のためにメディア制御装置302のメモリ208にさらに記憶することができる。ある実施形態では、回路202を、共有視聴環境内に存在する複数のユーザのうちの1人のユーザから、複数のユーザの障害情報を含む又は示すことができるユーザ入力を直接受け取るように構成することができる。ある実施形態では、回路202を、I/O装置204を介してテキストユーザ入力、オーディオユーザ入力又は視覚ユーザ入力の形態のユーザ入力を受け取るように構成することができる。例えば、図3A~図3Cによれば、第1のユーザ122Aは視覚健常者ユーザであり、第2のユーザ122Bは視覚障害者ユーザである。
ある実施形態によれば、回路202は、ユーザとしての視覚障害者からユーザ入力を受け取るようにさらに構成することができる。ある例では、回路202を、ディスプレイ装置314上に質問を表示して、I/O装置204を介してテキストユーザ入力の形態のユーザ入力を受け取るように構成することができる。図3Aの例示的な実装では、共有視聴環境内に存在する第1のユーザ122A及び第2のユーザ122Bなどの2人のユーザが、第1のユーザ122Aが視覚健常者であるのに対して第2のユーザ122Bが視覚障害者であることを示すそれぞれのユーザ入力を提供することができる。別の例では、回路202を、「視覚障害者が存在するか、「はい」又は「いいえ」を選択せよ」という質問をディスプレイ装置314に表示するように構成することができる。メディア制御装置302は、共有視聴環境内に視覚障害者である第2のユーザ122Bが存在する時には、第1のユーザ122A又は第2のユーザ122Bが「はい」という選択肢を選択できるようにすることができる。なお、第2のユーザ122B(すなわち、視覚障害者)は、当業で周知の従来の支援技術を利用してメディア制御装置302に障害情報を示すユーザ入力を行うことができる。例えば、I/O装置204は、第2のユーザ122Bからユーザ入力を受け取るための再生可能な点字ディスプレイを含むことができる。別の実施形態では、回路202が、画像取り込み装置310を通じて、(第2のユーザ122Bなどの)ユーザから手のジェスチャー又は頭のジェスチャーの形態で(障害情報を示す)ユーザ入力を受け取ることができる。ある例では、第2のユーザ122Bが、ユーザ入力として特定の形で頭を動かして自身の視覚障害の存在を示すことができる。
ある実施形態では、回路202を、ユーザがメディアコンテンツにアクセスするために利用したいと望む(第1の出力ポート304又は第2の出力ポート306のような)出力ポートに対応するユーザ入力を受け取るようにさらに構成することができる。例えば、回路202は、メディアコンテンツにアクセスするために第1の出力ポート304を選択できる第1のユーザ122Aからユーザ入力を受け取り、第2の出力ポート306を選択できる第2のユーザ122Bから別のユーザ入力を受け取ることができる。
別の実施形態では、回路202を、第1のユーザ122A又は第2のユーザ122Bなどのユーザのうちのいずれか1人がアクセスする必要があるメディアコンテンツ又はメディアコンテンツのタイプに対応するユーザ入力を受け取るようにさらに構成することができる。ある例では、回路202が、第1のユーザ122Aから映画(すなわち、メディアコンテンツ)の題名を示すことができるユーザ入力を受け取ることができる。別の例では、回路202が、第2のユーザ122Bから「ニュース」などのメディアコンテンツのタイプに対応するユーザ入力を受け取ることができる。ある実施形態によれば、回路202は、共有視聴環境内のユーザの数、共有視聴環境内の視覚障害者ユーザの数、ユーザがメディア制御装置302を介してアクセスしたいと望むことができるオーディオコンテンツ又はオーディオビデオコンテンツなどのコンテンツのタイプなどに対応するユーザ入力を受け取るように構成することができる。
ある実施形態では、回路202を、サーバ116又はメディア制御装置302のメモリ208からメディアコンテンツを検索するように構成することができる。メディアコンテンツの例としては、以下に限定するわけではないが、ビデオコンテンツ、オーディオビデオ(AV)コンテンツ、双方向オーディオビデオコンテンツ、可聴音を含む画像のスライドショー、ゲームコンテンツ、又はマルチメディアコンテンツを挙げることができる。メディアコンテンツは、第1の画像部分及び第1のオーディオ部分を含むことができる。第1の画像部分は、ディスプレイ装置314上にレンダリングできる画像フレーム又はピクチャとすることができる。ある実施形態では、第1の画像部分を、現在ディスプレイ装置314上にレンダリングされている画像ショット又は撮影シーンとすることができる。メディアコンテンツの第1のオーディオ部分は、第1の画像部分に関連する会話部分、可聴指示及び背景音楽などに対応することができる。例えば、メディアコンテンツは映画であることができ、第1のオーディオ部分を、映画、又は第1の画像部分に含まれるオブジェクトに関連する会話部分又は背景音楽であることができる。別の例では、メディアコンテンツが(双方向ゲームなどの)双方向ビデオコンテンツであることができ、ゲームに関連する可聴音又は背景音楽が第1のオーディオ部分に対応することができる。いくつかの実施形態では、メディアコンテンツを、チューナ214を通じてテレビ放送局から受け取ることができるテレビ番組とすることができる。回路202は、テレビ放送局からメディアコンテンツを受け取るために、チューナ214を特定のチャンネル周波数に同調するように制御することができる。回路202は、第1の出力ポート304を介してメディアコンテンツの第1のオーディオ部分のみを出力できる形で第1の出力ポート304を制御するようにさらに構成することができる。回路202は、メディアコンテンツの第1の画像部分を表示するようにディスプレイ装置314を制御し、表示されたメディアコンテンツの第1のオーディオ部分を同時に又は同期して出力するように第1の出力ポート304を制御するよう構成することができる。
ある実施形態によれば、回路202は、メディアコンテンツの第1の画像部分を記述できる第2のオーディオ部分を検索するようにさらに構成することができる。回路202は、受け取られたユーザ入力(すなわち、第2のユーザ122Bが、表示された第1の画像部分を理解するために第2のオーディオ部分を必要とし得る視覚障害視聴者であることを示すユーザ入力)に基づいてメモリ208から第2のオーディオ部分を検索することができる。ある例では、メディアコンテンツが、ディスプレイ装置314上にレンダリングされている(「崖の上に立っている男」を示すシーンなどの)フレーム又はシーンを含むことができる映画である。従って、このシーン(例えば、「崖の上に立っている男」)の画像フレームは第1の画像部分であり、一方でシーンの音声記述は第2のオーディオ部分に対応することができる。上述した例を参照すると、第2のオーディオ部分は、「崖の縁に男が立っている」という音声メッセージに相当することができる。なお、このようなメディアコンテンツの画像部分の音声記述は、(第2のユーザ122Bなどの)視覚障害者ユーザがメディアコンテンツを理解するために有益であることができる。メモリ208に記憶された第2のオーディオ部分には、記憶された第1のオーディオ部分(すなわち、会話部分又は背景音楽)と第2のオーディオ部分(すなわち、シーン記述)とを一意的に区別できる識別子(例えばラベル識別)を関連付けることができる。回路202は、第2のオーディオ部分に関連付けられて記憶された識別子に基づいて第2のオーディオ部分を認識し、メモリ208から検索するように構成することができる。いくつかの実施形態では、第2のオーディオ部分を、第1のオーディオ部分(すなわち、会話部分)も含むことができる完全なオーディオトラックとして受信又は記憶することができる。
第1の画像部分を記述できる第2のオーディオ部分の例としては、以下に限定するわけではないが、メディアコンテンツの第1の画像部分におけるエンティティの存在の記述、メディアコンテンツの第1の画像部分における美的感覚又は装飾物の記述、第1の画像部分におけるシーンの場所の記述、メディアコンテンツのタイトル(例えば、映画のタイトル)などのシーン内に現れるテキストの記述、第1の画像部分における環境条件に関連する記述、第1の画像部分に含まれる登場人物の感情に関する記述、第1の画像部分における照明条件に関する記述、背景情報に関する記述、撮影ショット間の移行に関する記述、第1の画像部分における登場人物の体格又は表情に関する記述、第1の画像部分における登場人物の職業又は役割に関する記述、第1の画像部分における登場人物の衣服に関する記述、又は第1の画像部分に描かれる登場人物間の空間的関係に関する記述を挙げることができる。
回路202は、第1の画像部分をディスプレイ装置314においてレンダリングできる時に、第1の出力ポート304を、第1の画像部分に関連する背景音楽及び会話部分などの第1のオーディオ部分を出力するように制御するよう構成することができる。ある実施形態によれば、メディア制御装置302のメモリ208は、第1のオーディオ部分及び第1の画像部分を含むメディアコンテンツを記憶するように構成できるとともに、メディアコンテンツの第1の画像部分を記述できる第2のオーディオ部分のテキスト表現としてのテキスト情報を記憶するようにさらに構成することができる。いくつかの実施形態では、テキスト情報をメディアコンテンツに含めることができる。ある実施形態では、回路202が、例えばディスプレイ装置314上における第1の画像部分及び第1のオーディオ部分のレンダリング前にメディアコンテンツからテキスト情報を検索することができる。回路202は、検索されたテキスト情報(すなわち、第1の画像部分を記述する情報)を第2のオーディオ部分に変換するようにさらに構成することができる。回路202は、テキスト-音声変換器212を、検索されたテキスト情報を第2のオーディオ出力に変換するように制御することができる。テキスト情報(すなわち、テキスト形態のシーン記述)には、記憶された第1のオーディオ部分(すなわち、会話部分又は背景音楽)、或いはテキスト字幕又はクローズドキャプションのようなテキスト形態の第1のオーディオ部分とテキスト情報(すなわち、シーン記述)とを一意的に区別できる識別子(例えば、ラベル識別)を関連付けることができる。回路202は、テキスト情報に関連付けられて記憶された識別子に基づいてテキスト情報を認識してメモリ208から検索するように構成することができる。
さらに、回路202は、第2の出力ポート306を、第2のユーザ122B(すなわち、視覚障害者)から受け取られたユーザ入力に基づいて第1のオーディオ部分(すなわち、シーンの会話部分)及び第2のオーディオ部分(すなわち、シーン記述)を出力するように制御するよう構成することができる。ユーザ入力は、第2のユーザ122Bが、ディスプレイ装置314においてレンダリングされたシーン(すなわち、第1の画像部分)を理解するために音声形態でのシーン記述を望むことができる視覚障害者ユーザであることを示すことができる。ある例では、回路202が、メディアコンテンツに関連するオーディオ(第1及び第2のオーディオ部分)を受け取るための(第2の出力ポート306などの)出力ポートの選択をユーザ入力において受け取ることができる。回路202は、第2の出力ポート306を、第2のユーザ122Bから受け取られたユーザ入力に基づいて第1のオーディオ部分及び第2のオーディオ部分を出力するようにさらに制御することができる。いくつかの実施形態では、記憶された第2のオーディオ部分を(会話部分などの第1のオーディオ部分及び音声形態での記述などの第2のオーディオ部分の両方を含むことができる)完全なオーディオトラックとすることができる。このような場合、回路202は、第2のユーザ122Bから受け取られたユーザ入力に基づいて第2のオーディオ部分(すなわち、完全なオーディオトラック)を出力するように第2の出力ポート306をさらに制御することができる。
視覚健常者ユーザとすることができる第1のユーザ122Aは第1の出力ポート304を利用することができ、従って第1の出力ポート304の出力は、メディアコンテンツの第1の画像部分の音声記述を含む第2のオーディオ部分を除外することができる。ある例では、図3Aに示す共有視聴環境において、視覚健常者ユーザとすることができる第1のユーザ122Aが、メディア制御装置302を介して(映画などの)メディアコンテンツにアクセスしたいと望むことができる。メディア制御装置302の回路202は、視覚健常者である第1のユーザ122Aの障害情報及び視覚障害者である第2のユーザ122Bの障害情報を示すユーザ入力を受け取ることができる。これらのユーザ入力は、第2のユーザ122Bは視覚障害者であるため(第2のオーディオ部分としての)音声形態でのシーン記述を望む可能性があり、第1のユーザ122Aはディスプレイ装置314上でテキスト形態のシーン記述を見ることができるので音声形態でのシーン記述を望まない可能性があることをメディア制御装置302に示すことができる。従って、回路202は、第1の出力ポート304を、視覚健常者ユーザである第1のユーザ122Aのために(映画の会話部分及び背景音楽などの)第1のオーディオ部分を出力するように制御することができる。ある実施形態によれば、メディア制御装置302は、図1に示す有線接続126を通じて第1の出力ポート304に接続できる内部オーディオ再生装置308をさらに含むことができる。有線接続126は、回路202と、第1の出力ポート304にも接続できる内部オーディオ再生装置308との間の内部接続とすることができる。図3Aに示すように、回路202は、第1のユーザ122Aのためにメディアコンテンツの第1のオーディオ部分(すなわち、現在のシーンの会話部分)を出力するように内部オーディオ再生装置308(例えば、内蔵スピーカ)を制御するよう構成することができる。ある実施形態によれば、内部オーディオ再生装置308を通じた第1のオーディオ部分の出力は第2のオーディオ部分(すなわち、シーン又はビデオ記述)を除外することができる。ある実施形態では、回路202を、第1のユーザ122Aのために第1の出力ポート304を介してメディアコンテンツの第1のオーディオ部分を出力するように内部オーディオ再生装置308(例えば、内蔵スピーカ)を制御するよう構成することができる。ある例では、第1のユーザ122Aが、メディアコンテンツの第1のオーディオ部分のみへのアクセスを必要とすることができる視覚健常者ユーザである。回路202は、第1のオーディオ部分に関連する対応する第1の画像部分(すなわち、シーン又は画像)をディスプレイ装置314上に表示するようにさらに構成することができる。いくつかの実施形態では、回路202が、ディスプレイ装置314を、ディスプレイ装置314上での第1の画像部分及び内部オーディオ再生装置308上での第1のオーディオ部分の出力と共にテキスト情報(すなわち、テキスト形態のシーン記述)を表示するように制御することができる。
ある実施形態によれば、回路202は、第2のユーザ122Bに関連する受け取られたユーザ入力に基づいて(現在ディスプレイ装置314上にレンダリングされているシーンの音声記述などの)第2のオーディオ部分を検索するように構成することができる。さらに、回路202は、第2の出力ポート306を、視覚障害者である第2のユーザ122Bのために第1のオーディオ部分及び第2のオーディオ部分を出力するように制御することができる。さらに、回路202は、受け取られたユーザ入力に基づいて、第2の出力ポート306を介して第1のオーディオ部分及び第2のオーディオ部分を外部オーディオ再生装置に無線で出力することができる。例えば、外部オーディオ再生装置は、図3Aに示す第2の外部オーディオ再生装置316(例えば、ワイヤレスヘッドセット)とすることができる。
ある実施形態によれば、回路202は、第2の出力ポートを介した第1のオーディオ部分及び第2のオーディオ部分の出力のタイミングを、第1のオーディオ部分(すなわち、会話部分)の出力が第2のオーディオ部分(すなわち、シーン記述)の出力に干渉しないように調整するようさらに構成することができる。回路202は、第1のオーディオ部分及び第2のオーディオ部分の出力のタイミングを、第2の出力ポート306を介して第1のオーディオ部分及び第2のオーディオ部分を異なる期間に第2の外部オーディオ再生装置316に出力できるように調整することができる。さらに、回路202は、第1のオーディオ部分の出力をディスプレイ装置206上のメディアコンテンツの第1の画像部分の表示と同期して制御することができる。回路202は、第1のオーディオ部分の出力前に存在できる期間、現在のシーンの2つの第1のオーディオ部分の出力間の期間、又は第1のオーディオ部分の出力後の期間を含むことができる特定の期間中に第2のオーディオ部分(すなわち、シーン記述)を出力することができる。念のため、ある例では、メディアコンテンツが54秒の継続時間を有するオーディオビデオコンテンツであり、オーディオビデオコンテンツの特定のシーンが、それぞれ5秒目~14秒目の間隔、21秒目~33秒目の間隔、及び36秒目~44秒目の間隔においてレンダリングすべき3つの第1のオーディオ部分(すなわち、会話部分)を含む。従って、回路202は、第2のオーディオ部分の出力タイミングを、第2のオーディオ部分の継続時間に基づいて0秒目~5秒目、14秒目~21秒目、33秒目~36秒目、又は44秒目~54秒目に存在する期間に来るように調整するよう構成することができる。換言すれば、回路202は、現在レンダリングされているメディアコンテンツのシーンの第1のオーディオ部分(すなわち、会話部分)間のギャップを識別し、さらにこの識別されたギャップ間に第2のオーディオ部分(すなわち、シーン記述)の出力を制御することができる。
ある実施形態では、図3Aに示すように、回路202が、第2の出力ポート306を介して第1のオーディオ部分(すなわち、会話部分)及び第2のオーディオ部分(すなわち、シーン記述)を第2の外部オーディオ再生装置316(すなわち、第2の外部オーディオ再生装置112と同様のもの)に無線で出力することができる。回路202は、無線通信媒体312(すなわち、図1の無線通信媒体120と同様のもの)を通じて第1のオーディオ部分及び第2のオーディオ部分を第2の外部オーディオ再生装置316に無線で出力することができる。第2の外部オーディオ再生装置316は、第2のユーザ122B(すなわち、視覚障害者)が第1のオーディオ部分及び第2のオーディオ部分の両方を受け取ることができるように、第2のユーザ122Bによって装着される無線ウェアラブル装置(例えば、ワイヤレスヘッドホン又はヘッドセット)とすることができる。従って、開示するメディア制御装置302は、第1のユーザ122Aのために内部オーディオ再生装置308(すなわち、第1の出力ポート304に接続されたオーディオ再生装置)を介して第1のオーディオ部分(すなわち、会話部分)を出力すると同時に、第2のユーザ122B(すなわち、視覚障害者)のために第2の出力ポート306を介して第1のオーディオ部分を出力することができる。しかしながら、(オーディオシーン記述を有する)第2のオーディオ部分は、第1のユーザ122A(すなわち、健常者ユーザ)にとっては必要不可欠でなく、(第2の出力ポート306などの)同じチャンネルを通じて会話部分及びシーン記述の両方を音声形態で受け取りたいと望むことができる視覚障害者である第2のユーザ122Bからは必要とされる場合があるので、開示するメディア制御装置302は、第2のオーディオ部分を(第1の出力ポート304ではなく)第2の出力ポート306のみを通じて出力することができる。
ある実施形態によれば、回路202は、第1の出力ポート304及び第2の出力ポート306を介して出力される第1のオーディオ部分と、ディスプレイ装置314を介して出力される第1の画像部分とを同期させるようにさらに構成することができる。第1の出力ポート304及び第2の出力ポート306の両方を介して出力される第1のオーディオ部分の出力タイミングは、第1の出力ポート304及び第2の出力ポート306の両方を介して出力される第1のオーディオ部分(すなわち、会話部分)がディスプレイ装置314を介した第1の画像部分(すなわち、画像フレーム又はシーン)の出力と同期するように維持することができる。ある例では、特定のシーンの会話部分がメディアコンテンツのシーン(すなわち、第1の画像部分)内に存在する(限定するわけではないが、俳優、楽器、動物又は車両を含む音源のような)対応するオブジェクトに一致するように又はこれらを同時にレンダリングできるように、第1のオーディオ部分を第1の画像部分と同期させることができる。ある実施形態では、回路202が、第2の出力ポート306を介した第1のオーディオ部分及び第2のオーディオ部分の出力タイミングの調整に基づいて、ディスプレイ装置314を介した第1の画像部分の出力と、内部オーディオ再生装置308、第1の出力ポート304又は第2の出力ポート306のいずれかを介した第1のオーディオ部分の出力とが同期するように第1の画像部分の再生を遅らせることができる。
ある実施形態によれば、回路202は、第1の出力ポート304又は内部オーディオ再生装置308を介した第1のオーディオ部分の出力を制御すると同時に、第2の出力ポート306を介した第2のオーディオ部分及び第1のオーディオ部分の出力を制御するように構成することができる。従って、図3Aに示すように、共有視聴環境では、開示するメディア制御装置302が、第1のユーザ122A及び第2のユーザ122Bが共にメディアコンテンツにアクセスすることを可能にすることができる。第1のオーディオ部分は、異なるユーザのために異なる出力ポートにおいて同時に(すなわち、両ユーザが共にメディアコンテンツにアクセスできるように)提供することができるが、開示するメディア制御装置302は、第2のユーザ122B(すなわち、視覚障害者)がユーザ入力を使用して選択した通りに、第2の出力ポート306における第1のオーディオ部分(すなわち、会話部分)の出力を第2のオーディオ部分(すなわち、シーン記述)の出力と共に制御することもできる。
ある実施形態によれば、回路202は、それぞれが障害情報(例えば、共有視聴環境内に存在する複数のユーザの視覚障害)を示す複数のユーザ入力を受け取るようにさらに構成することができる。回路202は、視覚障害者とすることができる複数のユーザのうちの1人又は2人以上からユーザ入力を受け取ることができる。回路202は、(第2の出力ポート306を含むこともできる)複数の出力ポート106を、受け取られた複数のユーザ入力に基づいて複数のユーザのために第1のオーディオ部分及び第2のオーディオ部分を同様に出力するように制御するようさらに構成することができる。ある実施形態では、回路202を、健常者ユーザがアクセスする第1の複数の出力ポート106の組において第1のオーディオ部分を出力し、複数のユーザのうち視覚障害ユーザがアクセスできる、第1の組とは異なることができる第2の複数の出力ポート106の組において第2のオーディオ部分をさらに出力するように構成することができる。ある例では、共有視聴環境が、2人のユーザが視覚健常者であって他の2人のユーザが視覚障害者ユーザであるような4人のユーザを含む。回路202は、第1の出力ポート304、第2の出力ポート306、(図1に示す)第3の出力ポート106B及び第4の出力ポート(図示せず)において第1のオーディオ部分(すなわち、会話部分)を出力し、さらに2人の視覚障害者ユーザのために第2の出力ポート306及び第4の出力ポートのみにおいて第2のオーディオ部分(すなわち、シーン記述)を無線で出力することができる。回路202は、視覚健常者ユーザのために第1の出力ポート104を介して第1のオーディオ部分を内部オーディオ再生装置308に出力し、さらに視覚障害者ユーザのために第2の複数の出力ポートの組106を介して(タイミング調整された)第1のオーディオ部分及び第2のオーディオ部分の両方を第2の外部オーディオ再生装置316又は同様のヘッドセットに無線で出力することができる。従って、開示するメディア制御装置302は、複数のユーザがそれぞれの設定に基づいて複数の出力ポート106を使用してメディアコンテンツにアクセスすることを可能にすることができる。
図3Bには、(図1に示す第1の出力ポート104及び第1の外部オーディオ再生装置110を接続する有線接続又はケーブル124と同様の)ケーブル320を介して第2の出力ポート306に接続できる第2の外部オーディオ再生装置318(例えば、有線ヘッドホン)を示す。図3Bには、第1のユーザ122A(例えば、視覚健常者)及び第2のユーザ122B(例えば、視覚障害者)を含む共有視聴環境をさらに示す。ある実施形態によれば、例えば図3Aで説明したように、第1の出力ポート304に内部オーディオ再生装置308(すなわち、内蔵スピーカ)を内部的に接続することができる。
回路202は、内部オーディオ再生装置308を、第1の出力ポート304を介してメディアコンテンツの第1のオーディオ部分を出力するように制御するようさらに構成することができる。いくつかの実施形態では、回路202が、メディアコンテンツの第1のオーディオ部分(すなわち、会話部分)のみへのアクセスを必要として可聴形態のシーン記述(すなわち、第2のオーディオ部分)へのアクセスを必要としないことができる第1のユーザ122A(すなわち、視覚健常者)のために第1のオーディオ部分を出力又は再生するように内部オーディオ再生装置308を直接制御することができる。回路202は、受け取られたユーザ入力(すなわち、第2のユーザ122Bの障害を示すユーザ入力)に基づいて、第2の出力ポート306及びケーブル320を介して第1のオーディオ部分及び第2のオーディオ部分を第2の外部オーディオ再生装置318(すなわち、有線ヘッドセット)にさらに出力することができる。ケーブル320は、メディアコンテンツの第1のオーディオ部分及び第2のオーディオ部分を受け取るように相補的な第2の出力ポート306に接続することができる。ある例では、ケーブル320が、複数のポート106のうちの1つのポート(又は第2の出力ポート306)とすることができるHDMI出力ポートに接続できるHDMIケーブルである。メディアコンテンツの第1のオーディオ部分及び第2のオーディオ部分は、メディア制御装置302の同じチャンネル(すなわち、第2の出力ポート306)を通じてメディアコンテンツの第1のオーディオ部分及び第2のオーディオ部分の両方にアクセスすることを必要とすることができる第2のユーザ122B(すなわち、視覚障害者)の第2の外部オーディオ再生装置318(すなわち、有線ヘッドセット又はヘッドホン)に第2の出力ポート306を介して出力することができる。従って、図3Bでは、開示するメディア制御装置302が、第1のユーザ122Aのために第1のオーディオ部分(すなわち、会話部分)を出力するように内部オーディオ再生装置308(内蔵スピーカ)を制御すると同時に、第2のユーザ122Bのために第2の外部オーディオ再生装置318(すなわち、有線ヘッドセット)を使用して第1のオーディオ部分及び第2のオーディオ部分(すなわち、シーン記述)の両方を出力するように第2の出力ポート306を制御することができる。
なお、図1及び図3A~図3Cで説明するシーン記述としての第2のオーディオ部分の出力は一例として示すものにすぎない。第2のオーディオ部分は、例えばディスプレイ装置206上に表示される(限定するわけではないが、アイコン、ボタン又はメニューのような)1又は2以上のグラフィカルユーザインターフェイス(GUI)要素を記述できる情報などの画面情報を含み又は表すこともできる。このような場合、第2のオーディオ部分は、以下に限定するわけではないが、強調表示されたテキストの動き、GUI要素の記述、GUI要素の動き、GUI要素の選択又は制御(例えば、音量、チャンネル又は設定ボタン)を表すことができる。
図3Cには、(第1のユーザ122Aによって装着される無線ヘッドホンなどの)第1の外部オーディオ再生装置322、無線通信媒体324、(第2のユーザ122Bによって装着される有線ヘッドホンなどの)第2の外部オーディオ再生装置326、及び有線ケーブル328を示す。図3Cには、第1のユーザ122A(例えば視覚健常者)及び第2のユーザ122B(例えば視覚障害者)を含む共有視聴環境をさらに示しており、第1のユーザ122Aは、第1の外部オーディオ再生装置322(すなわち、無線ヘッドホン又はヘッドセット)を使用してメディアコンテンツの第1のオーディオ部分(すなわち、会話部分)にアクセスしたいと望むことができる。
ある実施形態によれば、図3Cに示すように、回路202は、第1の出力ポート304及び無線通信媒体324を介して第1のユーザ122Aの第1の外部オーディオ再生装置322(すなわち、無線ヘッドホン)に第1のオーディオ部分を無線で出力するようにさらに構成することができる。無線通信媒体324は、第2の外部オーディオ再生装置112に関して図1に示すような無線通信媒体120と同様のものとすることができる。ある例では、第1のユーザ122Aを、第1の外部オーディオ再生装置322(すなわち、図3Cに示すような無線ヘッドホン)を介してメディアコンテンツの第1のオーディオ部分(すなわち、会話部分)のみにアクセスすることを必要とすることができる視覚健常者ユーザとすることができる。回路202は、第2のユーザ122Bから受け取られたユーザ入力に基づいて、第2の出力ポート306及び有線ケーブル328を介して第1のオーディオ部分(すなわち、会話部分)及び第2のオーディオ部分(すなわち、シーン記述)を第2のユーザ122Bの第2の外部オーディオ再生装置326(例えば有線ヘッドホン)に出力するようにさらに構成することができる。例えば、有線ケーブル328は、図3Bに示す有線ケーブル320と同様のものである。第1の外部オーディオ再生装置322は、第2の外部オーディオ再生装置326とは異なることができる。ある例では、第2のユーザ122Bを、第2の外部オーディオ再生装置326(有線ヘッドホン)及びメディア制御装置302の同じチャンネル(すなわち、第2の出力ポート306)を通じてメディアコンテンツの第1のオーディオ部分及び第2のオーディオ部分の両方にアクセスすることを必要とすることができる視覚障害者ユーザとすることができる。従って、図3Cでは、開示するメディア制御装置302が、第1のユーザ122Aのために第1の外部オーディオ再生装置322を使用して第1のオーディオ部分(すなわち、会話部分)を無線で出力するように第1の出力ポート304を制御すると同時に、第2のユーザ122Bのために第2の外部オーディオ再生装置326(すなわち有線ヘッドホン又はヘッドセット)を使用して第1のオーディオ部分及び第2のオーディオ部分(すなわち、シーン記述)の両方を出力するように第2の出力ポート306を制御することができる。なお、図3Cの第1の出力ポート304を介した第1のオーディオ部分の無線出力、並びに第2の出力ポート306を介した第1のオーディオ部分及び第2のオーディオ部分の両方の出力は一例として示すものにすぎない。別の実施形態では、メディア制御装置302が、本開示の範囲から逸脱することなく、第1の出力ポート304を介して第1のオーディオ部分を出力すると同時に、第2の出力ポート306を介して第1のオーディオ部分及び第2のオーディオ部分の両方を無線で出力することもできる。
なお、図1及び図3A~図3Cで説明したシーン記述としての第2のオーディオ部分の出力は一例として示すものにすぎない。第2のオーディオ部分は、例えばディスプレイ装置206上に表示される(限定するわけではないが、アイコン、ボタン又はメニューのような)1又は2以上のグラフィカルユーザインターフェイス(GUI)要素を記述できる情報などの画面情報を含み又は表すこともできる。このような場合、第2のオーディオ部分は、以下に限定するわけではないが、強調表示されたテキストの動き、GUI要素の記述、GUI要素の動き、GUI要素の選択又は制御(例えば、音量、チャンネル又は設定ボタン)を表すことができる。このような場合、(第1の出力ポート304又は第2の出力ポート306を介して)視覚障害者ユーザに出力される第2のオーディオ部分は、ディスプレイ装置206上に表示されるGUI要素又は情報の画面リーダに相当することができる。
図4は、本開示の実施形態による、メディア制御装置の出力ポートを制御する例示的な方法を示すフローチャートである。図4の説明は、図1、図2、図3A、図3B及び図3Cの要素に関連して行う。図4にはフローチャート400を示す。フローチャート400の動作は、メディア制御装置102、メディア制御装置302又は回路202などのコンピュータシステムによって実行することができる。動作は402から開始して410まで進むことができる。
404において、ユーザの障害情報を示すユーザ入力を受け取ることができる。1又は2以上の実施形態では、例えば図3Aで説明したように、メディア制御装置302の回路202を、(第1のユーザ122A又は第2のユーザ122Bなどの)ユーザの障害情報を示すユーザ入力を受け取るように構成することができる。いくつかの実施形態では、例えば図3Aで説明したように画像取り込み装置310からユーザ入力を受け取ることができる。
406において、第1の出力ポート304を、メディアコンテンツの第1のオーディオ部分を出力するように制御することができる。1又は2以上の実施形態では、例えば図3Aで説明したように、メディア制御装置302の回路202を、メディアコンテンツの第1のオーディオ部分(すなわち、会話部分)を出力するように第1の出力ポート304を制御するよう構成することができる。第1の出力ポート304は、メディアコンテンツの第1のオーディオ部分の出力のために内部オーディオ再生装置308(すなわち、例えば内蔵スピーカ)又は第1の外部オーディオ再生装置110のいずれかに接続することができる。
408において、受け取られたユーザ入力に基づいて、メディアコンテンツの第1の画像部分を記述できる第2のオーディオ部分を検索することができる。1又は2以上の実施形態では、例えば図3Aで説明したように、メディア制御装置302の回路202を、受け取られたユーザ入力に基づいてメディアコンテンツに関連する第2のオーディオ部分を検索するように構成することができる。
410において、第2の出力ポート306を、受け取られたユーザ入力に基づいて第1のオーディオ部分及び第2のオーディオ部分を出力するように制御することができる。1又は2以上の実施形態では、例えば図3Aで説明したように、メディア制御装置302の回路202を、受け取られたユーザ入力に基づいて(第2のユーザ122Bなどの)視覚障害者のために第1のオーディオ部分(すなわち、音声形態での会話部分)及び第2のオーディオ部分(すなわち、音声形態でのシーン記述)を出力するように第2の出力ポート306を制御するよう構成することができる。制御は終了に進むことができる。
フローチャート400については、404、406、408及び410などの離散的動作として示しているが、本開示はこのように限定されるものではない。従って、いくつかの実施形態では、開示する実施形態の本質を損なうことなく、特定の実装に応じてこのような離散的動作をさらなる動作にさらに分割し、より少ない動作に結合し、又は削除することもできる。
本開示の様々な実施形態は、第1の出力ポート及び第2の出力ポートを含むメディア制御装置によって実行された時にメディア制御装置に動作を実行させるコンピュータ実行可能命令を記憶した非一時的コンピュータ可読媒体を提供することができる。動作は、ユーザの障害情報を示すユーザ入力を受け取ることを含む。動作は、メディアコンテンツの第1のオーディオ部分を出力するように第1の出力ポートを制御することをさらに含む。動作は、受け取られたユーザ入力に基づいて、メディアコンテンツの第1の画像部分を記述する第2のオーディオ部分を検索することをさらに含む。第1の画像部分は第1のオーディオ部分に関連する。動作は、受け取られたユーザ入力に基づいて第1のオーディオ部分及び第2のオーディオ部分を出力するように第2の出力ポートを制御することをさらに含む。
本開示の例示的な態様は、(メディア制御装置102などの)メディア制御装置を含むことができる。メディア制御装置102は、(第1の出力ポート104などの)第1の出力ポートと、(第2の出力ポート106Aなどの)第2の出力ポートと、第1の出力ポート104及び第2の出力ポート106Aに結合された(回路202などの)回路とを含むことができる。回路202は、(第1のユーザ122A及び第2のユーザ122Bなどの)ユーザの障害情報を示すユーザ入力を受け取るように構成することができる。回路202は、メディアコンテンツの第1のオーディオ部分を出力するように第1の出力ポート104を制御するようさらに構成することができる。回路202は、受け取られたユーザ入力に基づいて、メディアコンテンツの第1の画像部分を記述する第2のオーディオ部分を検索するようにさらに構成することができる。第1の画像部分は第1のオーディオ部分に関連する。回路202は、受け取られたユーザ入力に基づいて第1のオーディオ部分及び第2のオーディオ部分を出力するように第2の出力ポート106Aを制御するようさらに構成することができる。ある実施形態によれば、第1の出力ポート104を介した出力が第2のオーディオ部分を含まない。
ある実施形態によれば、メディア制御装置102は、第1の出力ポート104に接続された(内部オーディオ再生装置108などの)内部オーディオ再生装置をさらに含む。回路202は、第1の出力ポート104を介してメディアコンテンツの第1のオーディオ部分を出力するように内部オーディオ再生装置108を制御するようさらに構成することができる。回路202は、受け取られたユーザ入力に基づいて、第2の出力ポートを介して第1のオーディオ部分及び第2のオーディオ部分を(第2の外部オーディオ再生装置112などの)外部オーディオ再生装置に無線で出力するようにさらに構成することができる。
ある実施形態によれば、メディア制御装置102は、第1の出力ポート104に接続された内部オーディオ再生装置108をさらに含む。回路202は、第1の出力ポート104を介してメディアコンテンツの第1のオーディオ部分を出力するように内部オーディオ再生装置108を制御するようさらに構成することができる。回路202は、受け取られたユーザ入力に基づいて、第2の出力ポートを介して第1のオーディオ部分及び第2のオーディオ部分を(第2の外部オーディオ再生装置112などの)外部オーディオ再生装置に出力するようにさらに構成することができる。
ある実施形態によれば、回路202は、第1の出力ポートを介して第1のオーディオ部分を(第1の外部オーディオ再生装置110などの)第1の外部オーディオ再生装置に無線で出力するようにさらに構成することができる。回路202は、受け取られたユーザ入力に基づいて、第2の出力ポートを介して第1のオーディオ部分及び第2のオーディオ部分を(第2の外部オーディオ再生装置112などの)第2の外部オーディオ再生装置に出力するようにさらに構成することができる。第1の外部オーディオ再生装置110は、第2の外部オーディオ再生装置112とは異なることができる。ある実施形態によれば、回路202を、第1の出力ポート104を介した第1のオーディオ部分の出力を制御すると同時に、第2の出力ポート106Aを介した第1のオーディオ部分の出力及び第2のオーディオ部分の出力を制御するようにさらに構成することができる。
ある実施形態によれば、メディア制御装置102は、第2の出力ポート106Aを含む(複数の出力ポート106などの)複数の出力ポートをさらに含む。回路202は、それぞれが複数のユーザの障害情報を示す複数のユーザ入力を受け取るようにさらに構成することができる。回路202は、受け取られた複数のユーザ入力に基づいて第1のオーディオ部分及び第2のオーディオ部分を出力するように複数の出力ポート106を制御するようさらに構成することができる。
ある実施形態によれば、メディア制御装置102は、第1のオーディオ部分及び第1の画像部分を含むメディアコンテンツを記憶するように構成されるとともにメディアコンテンツの第1の画像部分を記述するテキスト情報を記憶するように構成された(メモリ208などの)メモリをさらに含むことができる。回路202は、第1の画像部分を記述する記憶されたテキスト情報を第2のオーディオ部分に変換するようにさらに構成することができる。
ある実施形態によれば、回路202は、第2の出力ポート106Aを介した第1のオーディオ部分及び第2のオーディオ部分の出力のタイミングを調整するようにさらに構成することができる。ある実施形態によれば、回路202は、第1の出力ポート104及び第2の出力ポート106Aを介して出力される第1のオーディオ部分と、(ディスプレイ装置206などの)ディスプレイ装置を介して出力される第1の画像部分とを同期させるようにさらに構成することができる。ある実施形態によれば、回路202は、(第2のユーザ122Bなどの)ユーザとしての視覚障害者からユーザ入力を受け取るようにさらに構成することができる。
ある実施形態によれば、メディア制御装置102は、(画像取り込み装置114などの)画像取り込み装置をさらに含むことができる。回路202は、ユーザの画像を取り込むように画像取り込み装置114を制御するようさらに構成することができる。回路202は、取り込まれた画像に基づいてユーザの障害情報を決定するようにさらに構成することができる。回路202は、決定された障害情報に基づいて第1のオーディオ部分及び第2のオーディオ部分を出力するように第2の出力ポート106Aを制御するようさらに構成することができる。
本開示は、ハードウェアで実現することも、又はハードウェアとソフトウェアの組み合わせで実現することもできる。本開示は、少なくとも1つのコンピュータシステム内で集中方式で実現することも、又は異なる要素を複数の相互接続されたコンピュータシステムにわたって分散できる分散方式で実現することもできる。本明細書で説明した方法を実行するように適合されたコンピュータシステム又はその他の装置が適することができる。ハードウェアとソフトウェアとの組み合わせは、ロードされて実行された時に本明細書で説明した方法を実行するようにコンピュータシステムを制御することができるコンピュータプログラムを含む汎用コンピュータシステムとすることができる。本開示は、他の機能も実行する集積回路の一部を含むハードウェアで実現することができる。
本開示は、本明細書で説明した方法の実装を可能にする全ての特徴を含み、コンピュータシステムにロードされた時にこれらの方法を実行できるコンピュータプログラム製品に組み込むこともできる。本文脈におけるコンピュータプログラムは、情報処理能力を有するシステムに特定の機能を直接的に、或いはa)別の言語、コード又は表記法への変換、b)異なる内容形態での複製、のいずれか又は両方を行った後に実行させるように意図された命令セットの、いずれかの言語、コード又は表記法におけるいずれかの表現を意味する。
いくつかの実施形態を参照しながら本開示を説明したが、当業者であれば、本開示の範囲から逸脱することなく様々な変更を行うことができ、同等物を代用することもできると理解するであろう。また、本開示の範囲から逸脱することなく、特定の状況又は内容を本開示の教示に適合させるように多くの修正を行うこともできる。従って、本開示は、開示した特定の実施形態に限定されるものではなく、添付の特許請求の範囲内に収まる全ての実施形態を含むように意図される。
100 ネットワーク環境
102 メディア制御装置
104 第1の出力ポート
106 複数の出力ポート
106A 第2の出力ポート
106B 第3の出力ポート
106N 第Nの出力ポート
108 内部オーディオ再生装置
110 第1の外部オーディオ再生装置
112 第2の外部オーディオ再生装置
114 画像取り込み装置
116 サーバ
118 通信ネットワーク
120 無線通信媒体
122A 第1のユーザ
122B 第2のユーザ
124 有線ケーブル
126 有線接続

Claims (18)

  1. メディア制御装置であって、
    第1の出力ポートと、
    前記第1の出力ポートとは異なる第2の出力ポートと、
    画像取り込み装置と、
    前記第1の出力ポート、前記第2の出力ポート、及び前記画像取り込み装置に結合された回路と、
    を備え、前記回路は、
    メディアコンテンツの第1のオーディオ部分を出力するように前記第1の出力ポートを制御し、ここで第1のオーディオ部分は、メディアコンテンツの画像部分と関連付けられ、
    前記画像取り込み装置を制御してユーザの画像を取り込み、
    取り込まれたユーザの画像におけるユーザの目の特性又はユーザのアイギアの存在の少なくとも1つに基づいて、ユーザの視覚障害を決定し、
    決定されたユーザの視覚障害に基づいて、ユーザの障害情報を決定し、
    受け取られたユーザ入力に基づいて、第2のオーディオ部分を検索し、ここで第2のオーディオ部分は、画像部分のコンテンツの記述の音声形態であり、
    第2のオーディオ部分を再生可能な期間である第1のオーディオ部分におけるギャップを識別し、ここでギャップは第2のオーディオ部分の継続時間に基づいて識別され、
    識別された前記ギャップに基づいて、第1のオーディオ部分及び第2のオーディオ部分の出力のタイミングを調整し、
    決定された障害情報及び第1のオーディオ部分及び第2のオーディオ部分の調整されたタイミングに基づいて前記第1のオーディオ部分及び前記第2のオーディオ部分の各々を出力するように前記第2の出力ポートを制御する、
    ように構成される、
    ことを特徴とするメディア制御装置。
  2. 前記第2のオーディオ部分は前記第1のオーディオ部分を含む
    請求項1に記載のメディア制御装置。
  3. 前記第1の出力ポートを介した前記出力は、前記第2のオーディオ部分を含まない、
    請求項1に記載のメディア制御装置。
  4. 前記第1の出力ポートに接続された内部オーディオ再生装置をさらに備え、前記回路は、
    前記第1の出力ポートを介して前記メディアコンテンツの前記第1のオーディオ部分を出力するように前記内部オーディオ再生装置を制御し、
    前記受け取られたユーザ入力に基づいて、前記第2の出力ポートを介して前記第1のオーディオ部分及び前記第2のオーディオ部分の各々を外部オーディオ再生装置に無線で出力する、
    ようにさらに構成され、第1のオーディオ部分及び第2のオーディオ部分の各々の出力は、決定された障害情報に基づく、
    請求項1に記載のメディア制御装置。
  5. 前記第1の出力ポートに接続された内部オーディオ再生装置をさらに備え、前記回路は、
    前記第1の出力ポートを介して前記メディアコンテンツの前記第1のオーディオ部分を出力するように前記内部オーディオ再生装置を制御し、
    前記受け取られたユーザ入力に基づいて、前記第2の出力ポートを介して前記第1のオーディオ部分及び前記第2のオーディオ部分の各々を外部オーディオ再生装置に出力する、
    ようにさらに構成され、第1のオーディオ部分及び第2のオーディオ部分の各々の出力は、決定された障害情報に基づく、
    請求項1に記載のメディア制御装置。
  6. 前記回路は、
    前記第1の出力ポートを介して前記第1のオーディオ部分を第1の外部オーディオ再生装置に無線で出力し、
    前記受け取られたユーザ入力に基づいて、前記第2の出力ポートを介して前記第1のオーディオ部分及び前記第2のオーディオ部分の各々を第2の外部オーディオ再生装置に出力する、
    ようにさらに構成され、第1のオーディオ部分及び第2のオーディオ部分の各々の出力は、決定された障害情報に基づき、前記第1の外部オーディオ再生装置は前記第2の外部オーディオ再生装置と異なる、
    請求項1に記載のメディア制御装置。
  7. 前記回路は、前記第1の出力ポートを介した前記第1のオーディオ部分の前記出力を制御すると同時に、前記第2の出力ポートを介した前記第1のオーディオ部分及び前記第2のオーディオ部分の各々の前記出力を制御するようにさらに構成される、
    請求項1に記載のメディア制御装置。
  8. 前記第2の出力ポートを含む複数の出力ポートをさらに備え、前記回路は、
    それぞれが複数のユーザの前記障害情報を示す複数のユーザ入力を受け取り、
    前記受け取られた複数のユーザ入力に基づいて前記第1のオーディオ部分及び前記第2のオーディオ部分の各々を出力するように前記複数の出力ポートを制御する、
    ようにさらに構成される、
    請求項1に記載のメディア制御装置。
  9. 前記第1のオーディオ部分、前記画像部分、及び前記メディアコンテンツの前記画像部分を記述するテキスト情報を記憶するように構成されたメモリをさらに備え、
    前記回路は、前記記憶されたテキスト情報を前記第2のオーディオ部分に変換するようにさらに構成される、
    請求項1に記載のメディア制御装置。
  10. 前記回路は、前記第1の出力ポート及び前記第2の出力ポートを介して出力される前記第1のオーディオ部分と、ディスプレイ画面を介して出力される前記画像部分とを同期させるようにさらに構成される、
    請求項1に記載のメディア制御装置。
  11. 前記回路は、前記ユーザとしての視覚障害者から前記ユーザ入力を受け取るようにさらに構成され、障害情報の決定は、受け取られたユーザ入力に基づく、
    請求項1に記載のメディア制御装置。
  12. 画像取り込み装置と、第1の出力ポートと、前記第1の出力ポートとは異なる第2の出力ポートとを含むメディア制御装置において、
    メディアコンテンツの第1のオーディオ部分を出力するように前記第1の出力ポートを制御するステップと、ここで、第1のオーディオ部分はメディアコンテンツの画像部分と関連づけられ、
    前記画像取り込み装置を制御してユーザの画像を取り込み、
    取り込まれたユーザの画像におけるユーザの目の特性又はユーザのアイギアの存在の少なくとも1つに基づいて、ユーザの視覚障害を決定し、
    決定されたユーザの視覚障害に基づいて、ユーザの障害情報を決定し、
    決定された障害情報に基づいて、第2のオーディオ部分を検索するステップと、ここで第2のオーディオ部分は、画像部分のコンテンツの記述の音声形態であり、
    第2のオーディオ部分を再生可能な期間である第1のオーディオ部分におけるギャップを識別し、ここでギャップは第2のオーディオ部分の継続時間に基づいて識別され、
    識別された前記ギャップに基づいて、第1のオーディオ部分及び第2のオーディオ部分の出力のタイミングを調整し、
    決定された障害情報及び第1のオーディオ部分及び第2のオーディオ部分の調整されたタイミングに基づいて前記第1のオーディオ部分及び前記第2のオーディオ部分の各々を出力するように前記第2の出力ポートを制御するステップと、
    を含むことを特徴とする方法。
  13. 前記第1の出力ポートを介した前記出力は、前記第2のオーディオ部分を含まない、
    請求項12に記載の方法。
  14. 前記第1の出力ポートを介した前記第1のオーディオ部分の前記出力を制御し、前記第2の出力ポートを介した前記第1のオーディオ部分及び前記第2のオーディオ部分の各々の前記出力とを同時に制御するステップをさらに含む、
    請求項12に記載の方法。
  15. 前記第1の出力ポートに接続された内部オーディオ再生装置を、前記第1の出力ポートを介して前記メディアコンテンツの前記第1のオーディオ部分を出力するように制御するステップと、
    記第2の出力ポートを介して前記第1のオーディオ部分及び前記第2のオーディオ部分を外部オーディオ再生装置に無線で出力するステップと、
    をさらに含み、第1のオーディオ部分及び第2のオーディオ部分の各々の出力は、決定された障害情報に基づく、請求項12に記載の方法。
  16. 前記第1の出力ポートに接続された内部オーディオ再生装置を、前記第1の出力ポートを介して前記メディアコンテンツの前記第1のオーディオ部分を出力するように制御するステップと、
    記第2の出力ポートを介して前記第1のオーディオ部分及び前記第2のオーディオ部分を外部オーディオ再生装置に出力するステップと、
    をさらに含み、第1のオーディオ部分及び第2のオーディオ部分の各々の出力は、決定された障害情報に基づく、請求項12に記載の方法。
  17. 前記第1の出力ポートを介して前記第1のオーディオ部分を第1の外部オーディオ再生装置に無線で出力するステップと、
    記第2の出力ポートを介して前記第1のオーディオ部分及び前記第2のオーディオ部分を第2の外部オーディオ再生装置に出力するステップと、
    をさらに含み、第1のオーディオ部分及び第2のオーディオ部分の各々の出力は、決定された障害情報に基づき、前記第1の外部オーディオ再生装置は前記第2の外部オーディオ再生装置と異なる、
    請求項12に記載の方法。
  18. 画像取り込み装置、第1の出力ポート及び第2の出力ポートを含むメディア制御装置によって実行された時に前記メディア制御装置に動作を実行させるコンピュータ実行可能命令を記憶した非一時的コンピュータ可読媒体であって、前記動作は、
    メディアコンテンツの第1のオーディオ部分を出力するように前記第1の出力ポートを制御することと、ここで、第1のオーディオ部分はメディアコンテンツの画像部分と関連づけられ、
    前記画像取り込み装置を制御してユーザの画像を取り込むことと、
    取り込まれたユーザの画像におけるユーザの目の特性又はユーザのアイギアの存在の少なくとも1つに基づいて、ユーザの視覚障害を決定することと、
    決定されたユーザの視覚障害に基づいて、ユーザの障害情報を決定することと、
    決定された障害情報に基づいて、前記メディアコンテンツの前記第1のオーディオ部分に関連する第1の画像部分を記述する第2のオーディオ部分を検索することと、ここで第2のオーディオ部分は、画像部分のコンテンツの記述の音声形態であり、
    第2のオーディオ部分を再生可能な期間である第1のオーディオ部分におけるギャップを識別することと、ここでギャップは第2のオーディオ部分の継続時間に基づいて識別され、
    識別された前記ギャップに基づいて、第1のオーディオ部分及び第2のオーディオ部分の出力のタイミングを調整することと、
    決定された障害情報及び第1のオーディオ部分及び第2のオーディオ部分の調整されたタイミングに基づいて前記第1のオーディオ部分及び前記第2のオーディオ部分の各々を出力するように前記第2の出力ポートを制御することと、
    を含む、ことを特徴とする非一時的コンピュータ可読媒体。
JP2022534838A 2020-06-18 2021-06-17 ユーザ入力に基づく複数出力制御 Active JP7501632B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/905,045 2020-06-18
US16/905,045 US11669295B2 (en) 2020-06-18 2020-06-18 Multiple output control based on user input
PCT/US2021/037839 WO2021257838A1 (en) 2020-06-18 2021-06-17 Multiple output control based on user input

Publications (2)

Publication Number Publication Date
JP2023505986A JP2023505986A (ja) 2023-02-14
JP7501632B2 true JP7501632B2 (ja) 2024-06-18

Family

ID=79023496

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022534838A Active JP7501632B2 (ja) 2020-06-18 2021-06-17 ユーザ入力に基づく複数出力制御

Country Status (6)

Country Link
US (1) US11669295B2 (ja)
EP (1) EP4122211A4 (ja)
JP (1) JP7501632B2 (ja)
KR (1) KR20230006865A (ja)
CN (1) CN114667737B (ja)
WO (1) WO2021257838A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240155178A1 (en) * 2022-11-03 2024-05-09 Roku, Inc. Private listening system for streaming audio and video

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007184740A (ja) 2006-01-06 2007-07-19 Nippon Hoso Kyokai <Nhk> コンテンツ送信装置およびコンテンツ出力装置
JP2007331615A (ja) 2006-06-15 2007-12-27 National Univ Corp Shizuoka Univ 番組共視聴システム
JP2015061112A (ja) 2013-09-17 2015-03-30 Npo法人メディア・アクセス・サポートセンター 携帯デバイスへのセカンドスクリーン情報の提供方法
US20150149902A1 (en) 2013-11-26 2015-05-28 At&T Intellectual Property I, Lp Manipulation of media content to overcome user impairments

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0955902A (ja) * 1995-08-17 1997-02-25 Sumitomo Wiring Syst Ltd 映像表示装置
US6483568B1 (en) * 2001-06-29 2002-11-19 Harris Corporation Supplemental audio content system for a cinema and related methods
KR100926469B1 (ko) 2002-01-31 2009-11-13 톰슨 라이센싱 가변 지연을 제공하는 오디오/비디오 시스템과, 제 1 지연된 디지털 신호에 대해 제 2 디지털 신호를 동기화하기 위한 방법
EP1510031A4 (en) 2002-05-06 2009-02-04 Syncronation Inc LOCALIZED AUDIO NETWORKS AND ASSOCIATED DIGITAL TOOLS
US7054804B2 (en) * 2002-05-20 2006-05-30 International Buisness Machines Corporation Method and apparatus for performing real-time subtitles translation
US20040196405A1 (en) * 2003-04-04 2004-10-07 Thomas Spinelli Method and apparatus for listening to audio corresponding to a PIP display
US7757258B2 (en) * 2005-07-19 2010-07-13 Chrysler Group Llc System for controlling display and operation of simultaneous transmissions of at least two media
US7852416B2 (en) * 2005-11-30 2010-12-14 Broadcom Corporation Control device with language selectivity
US20080063215A1 (en) * 2006-09-07 2008-03-13 Ati Technologies Ulc Multi-window picture audio visual system with targeted audio
ES2300214B1 (es) * 2006-11-16 2009-05-01 Centro Especial De Integracion Audiovisual Y Formacion S.L.L. Sistema de distribucion de subtitulos y audiodescripcion para salas d e cine.
JP4304636B2 (ja) * 2006-11-16 2009-07-29 ソニー株式会社 音響システム、音響装置及び最適音場生成方法
US8179475B2 (en) * 2007-03-09 2012-05-15 Legend3D, Inc. Apparatus and method for synchronizing a secondary audio track to the audio track of a video source
US8990848B2 (en) * 2008-07-22 2015-03-24 At&T Intellectual Property I, L.P. System and method for temporally adaptive media playback
US8359399B2 (en) * 2008-10-16 2013-01-22 Echostar Technologies L.L.C. Method and device for delivering supplemental content associated with audio/visual content to a user
US8497939B2 (en) * 2008-12-08 2013-07-30 Home Box Office, Inc. Method and process for text-based assistive program descriptions for television
CA2754173C (en) 2009-03-03 2016-12-06 Centre De Recherche Informatique De Montreal (Crim) Adaptive videodescription player
US9191639B2 (en) * 2010-04-12 2015-11-17 Adobe Systems Incorporated Method and apparatus for generating video descriptions
ES2394695B1 (es) * 2010-11-18 2013-10-02 Dimas LASTERRA HUARTE Unidad de accesibilidad audiovisual.
US8549569B2 (en) * 2011-06-17 2013-10-01 Echostar Technologies L.L.C. Alternative audio content presentation in a media content receiver
US8930975B2 (en) 2013-05-17 2015-01-06 Rovi Guides, Inc. Methods and systems for compensating for disabilities when presenting a media asset
US20150078595A1 (en) * 2013-09-13 2015-03-19 Sony Corporation Audio accessibility
US20150103154A1 (en) 2013-10-10 2015-04-16 Sony Corporation Dual audio video output devices with one device configured for the sensory impaired
WO2015101395A1 (en) * 2013-12-30 2015-07-09 Arcelik Anonim Sirketi Method for operating an image display device with voice-over feature
US9971319B2 (en) * 2014-04-22 2018-05-15 At&T Intellectual Property I, Lp Providing audio and alternate audio simultaneously during a shared multimedia presentation
US9451335B2 (en) 2014-04-29 2016-09-20 At&T Intellectual Property I, Lp Method and apparatus for augmenting media content
US20160098395A1 (en) * 2014-10-01 2016-04-07 Charter Communications Operating, Llc System and method for separate audio program translation
US11190855B2 (en) * 2017-08-30 2021-11-30 Arris Enterprises Llc Automatic generation of descriptive video service tracks
US10459686B1 (en) * 2018-08-08 2019-10-29 Nuance Communications, Inc. Audio stream mixing system and method
CN111263204B (zh) * 2018-11-30 2022-09-20 青岛海尔多媒体有限公司 用于多媒体播放设备的控制方法、装置及计算机存储介质
US10740063B2 (en) * 2018-12-03 2020-08-11 Ford Global Technologies, Llc Method and apparatus for enhanced content replacement and strategic playback
US11729475B2 (en) * 2018-12-21 2023-08-15 Bce Inc. System and method for providing descriptive video
CN109977836B (zh) * 2019-03-19 2022-04-15 维沃移动通信有限公司 一种信息采集方法及终端
CN110139151A (zh) * 2019-05-23 2019-08-16 青岛海信传媒网络技术有限公司 音频数据的处理方法及电子设备
US10999566B1 (en) * 2019-09-06 2021-05-04 Amazon Technologies, Inc. Automated generation and presentation of textual descriptions of video content
US11430485B2 (en) * 2019-11-19 2022-08-30 Netflix, Inc. Systems and methods for mixing synthetic voice with original audio tracks

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007184740A (ja) 2006-01-06 2007-07-19 Nippon Hoso Kyokai <Nhk> コンテンツ送信装置およびコンテンツ出力装置
JP2007331615A (ja) 2006-06-15 2007-12-27 National Univ Corp Shizuoka Univ 番組共視聴システム
JP2015061112A (ja) 2013-09-17 2015-03-30 Npo法人メディア・アクセス・サポートセンター 携帯デバイスへのセカンドスクリーン情報の提供方法
US20150149902A1 (en) 2013-11-26 2015-05-28 At&T Intellectual Property I, Lp Manipulation of media content to overcome user impairments

Also Published As

Publication number Publication date
CN114667737A (zh) 2022-06-24
US11669295B2 (en) 2023-06-06
JP2023505986A (ja) 2023-02-14
WO2021257838A1 (en) 2021-12-23
KR20230006865A (ko) 2023-01-11
EP4122211A1 (en) 2023-01-25
CN114667737B (zh) 2024-07-09
EP4122211A4 (en) 2023-09-13
US20210397405A1 (en) 2021-12-23

Similar Documents

Publication Publication Date Title
US11948076B2 (en) Media rendering device control based on trained network model
JP6741873B2 (ja) バーチャルリアリティ分野における装置および関連する方法
US20180077461A1 (en) Electronic device, interractive mehotd therefor, user terminal and server
US20160162015A1 (en) Electronic device, audio device, and methods of controlling electronic device and audio device power supply
US20160014540A1 (en) Soundbar audio content control using image analysis
WO2011118838A1 (ja) 表示装置、制御装置、テレビジョン受像機、表示装置の制御方法、プログラム及び記録媒体
JPWO2018193687A1 (ja) 情報処理装置、情報処理方法、および記録媒体
US20150237300A1 (en) On Demand Experience Sharing for Wearable Computing Devices
CN110999328B (zh) 装置以及相关联的方法
US11632642B2 (en) Immersive media with media device
CN106980482B (zh) 一种信息展示方法及第一电子设备
JP2023538448A (ja) 共有リスニング環境における聴覚障害者のためのオーディオ強化
CN102202206B (zh) 通信设备
JP7501632B2 (ja) ユーザ入力に基づく複数出力制御
CN114630057B (zh) 确定特效视频的方法、装置、电子设备及存储介质
CN114422935B (zh) 音频处理方法、终端及计算机可读存储介质
JP6364130B2 (ja) レコーディング方法、装置、プログラム及び記録媒体
CN114615536B (zh) 显示设备及音效处理方法
CN115767158A (zh) 同步播放方法、终端设备及存储介质
JP2024512200A (ja) 視線に基づくメディア表示装置の制御
JP2024505988A (ja) シーン説明の再生制御
KR20130122349A (ko) 영상표시장치 및 휴대 단말기의 동작 방법
JP2015015728A (ja) 制御装置、および制御方法
US20240236596A1 (en) Audio processing method and electronic device
Daly et al. Creative Intent on the Windward Slopes

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220608

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230612

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230626

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230825

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231023

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240304

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240520