JP6630798B2 - 触覚データを符号化及びストリーミングする方法及びシステム - Google Patents

触覚データを符号化及びストリーミングする方法及びシステム Download PDF

Info

Publication number
JP6630798B2
JP6630798B2 JP2018181077A JP2018181077A JP6630798B2 JP 6630798 B2 JP6630798 B2 JP 6630798B2 JP 2018181077 A JP2018181077 A JP 2018181077A JP 2018181077 A JP2018181077 A JP 2018181077A JP 6630798 B2 JP6630798 B2 JP 6630798B2
Authority
JP
Japan
Prior art keywords
haptic
data
haptic data
data stream
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018181077A
Other languages
English (en)
Other versions
JP2019024228A (ja
JP2019024228A5 (ja
Inventor
ロク ファン,
ロク ファン,
シン バティア,サトヴィール
シン バティア,サトヴィール
ディー. ランク,ステファン
ディー. ランク,ステファン
ジェイ. ウルリッヒ,クリストファー
ジェイ. ウルリッヒ,クリストファー
フランソワ ディオンヌ,ジャン
フランソワ ディオンヌ,ジャン
オリバー,ヒューズ‐アントワーヌ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Immersion Corp
Original Assignee
Immersion Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Immersion Corp filed Critical Immersion Corp
Publication of JP2019024228A publication Critical patent/JP2019024228A/ja
Publication of JP2019024228A5 publication Critical patent/JP2019024228A5/ja
Application granted granted Critical
Publication of JP6630798B2 publication Critical patent/JP6630798B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/637Control signals issued by the client directed to the server or network components
    • H04N21/6377Control signals issued by the client directed to the server or network components directed to server
    • H04N21/6379Control signals issued by the client directed to the server or network components directed to server directed to encoder, e.g. for requesting a lower encoding rate
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/20Input arrangements for video game devices
    • A63F13/21Input arrangements for video game devices characterised by their sensors, purposes or types
    • A63F13/215Input arrangements for video game devices characterised by their sensors, purposes or types comprising means for detecting acoustic signals, e.g. using a microphone
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/25Output arrangements for video game devices
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/25Output arrangements for video game devices
    • A63F13/28Output arrangements for video game devices responding to control signals received from the game device for affecting ambient conditions, e.g. for vibrating players' seats, activating scent dispensers or affecting temperature or light
    • A63F13/285Generating tactile feedback signals via the game input device, e.g. force feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/016Input arrangements with force or tactile feedback as computer generated output to the user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B6/00Tactile signalling systems, e.g. personal calling systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234336Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by media transcoding, e.g. video is transformed into a slideshow of still pictures or audio is converted into text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/23614Multiplexing of additional data and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/438Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving encoded video stream packets from an IP network
    • H04N21/4382Demodulation or channel decoding, e.g. QPSK demodulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/438Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving encoded video stream packets from an IP network
    • H04N21/4385Multiplex stream processing, e.g. multiplex stream decrypting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4516Management of client data or end-user data involving client characteristics, e.g. Set-Top-Box type, software version or amount of memory available
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/633Control signals issued by server directed to the network components or client
    • H04N21/6332Control signals issued by server directed to the network components or client directed to client
    • H04N21/6336Control signals issued by server directed to the network components or client directed to client directed to decoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6582Data stored in the client, e.g. viewing habits, hardware capabilities, credit card number
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages
    • H04N21/8113Monomedia components thereof involving special audio data, e.g. different tracks for different languages comprising music, e.g. song in MP3 format
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8126Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
    • H04N21/8133Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts specifically related to the content, e.g. biography of the actors in a movie, detailed information about an article seen in a video program
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/816Monomedia components thereof involving special video data, e.g 3D video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Details Of Audible-Bandwidth Transducers (AREA)

Description

(関連出願の相互参照)
本出願は、米国特許仮出願第61/827,341号(出願日:2013年5月24日、名称:「触覚メディア符号化のシステム及び方法」)、米国特許仮出願第61/874,920号(出願日:2013年9月6日、名称:「触覚コンテンツの生成、配信、及び再生の方法」)、及び米国特許仮出願第61/907,318号(出願日:2013年11月21日、名称:「触覚データを符号化及びストリーミングする方法及びシステム」)に基づく優先権を主張し、その内容は全体として参照により本明細書に組み込まれる。
本発明は、ネットワーク経由で保存及び/又は伝送するために触覚ストリームをデジタル・コンテンツの一部として符号化するシステム及び方法に関する。
過剰に存在するデジタル・コンテンツ・アプリケーションにおけるユーザの体験を向上させるために、触覚効果がより一層使用されるようになっている。これに伴って、触覚データを他のデジタル・コンテンツ(例えば、マルチメディア・データ)とともにネットワーク経由で効率的に保存及び/又は伝送することが望ましい。触覚データ・ストリームは、通常未加工のパルス・コード変調(「PCM」)データ・フォーマットで表される。8ビットで1秒間に8000回サンプリングされる触覚データを(有線又は無線の)ネットワーク経由でストリーミングするためには、毎秒64Kビット(8KB)、又はさらに8KBをその帯域幅で伝送する必要がある。しかし、ストリーム中にはサイレントな期間、すなわち触覚データがストリーミングされない期間があり、これは何も伝送しないか或いは不要なデータをネットワーク経由でストリーミングすることで時間と帯域幅を浪費することになり、コンテンツ配信者及びエンド・ユーザの双方にとって理想的ではない。触覚データの保存についても同様の問題がある。
デジタル・コンテンツ・ストリーミングでは、デジタル・ネットワーク経由で大量のデータをストリーミング又は伝送する場合に音声/動画信号の品質を変化させるために、適応ビットレート・ストリーミングを用いることが一般的である。このため、様々なネットワーク速度及び/又は輻輳に適応することによって、音声及び動画信号の円滑なストリーミングが依然として実現可能である。例えば、動画が非常に高い品質でストリーミングされ、そのストリームが経由するネットワークが重大なネットワーク輻輳に陥るか、またはダウンロード速度が突然低下した場合でも、ストリーミング・サーバはやはりデータを送信することができる。ただし、ネットワーク帯域幅を節約するために低品質でのデータ送信となる。輻輳が軽減しネットワーク速度が向上すると、ネットワーク帯域幅がより自由に使用できるようになり、送信されるデータの品質も高くなる。これは、複数のビット・レートでデータを符号化し送信されるデータの量を大きく低減することにより行われる。
触覚信号は、単純に波形の信号であれば、音声信号(audio signal)として解釈されてもよい。しかし、触覚信号を単純に音声信号として扱い、複数のビット・レートでコード変換すると、様々なネットワーク速度に品質を適応させる余地が得られない。高品質触覚信号とはサンプル・レートが8kHzの信号と考えられており、これは音声信号としてはかなり低いサンプル・レートであって、低品質信号ということもできる。触覚信号の品質を単純に低下させることにより、完全に異なるユーザ体験を導入することができ、単に同じストリームの任意のビットを除去することで品質を低下させれば、意図しない質感が表れ、信号の明瞭さが低減する。
より効率的に触覚データをネットワーク経由で保存及び/又は伝送できるようにする触覚データ符号化方式を提供することが望まれている。
本発明の一態様によれば、提供される方法は、音声データ及び/又は動画データを含むデジタル・コンテンツ・データを受信する工程と、受信したデジタル・コンテンツ・データの少なくとも一部を用いて触覚データを生成する工程と、通信ネットワーク経由で効率的に伝送するために触覚データを符号化する工程と、符号化した触覚データを受信したデジタル・コンテンツ・データと多重化する工程と、多重化したデータ・ストリームのメタ・データ内に、符号化した触覚データを復号するための情報を埋め込む工程と、多重化したデータを通信ネットワーク経由で送信する工程と、を含む。
一実施形態において、この方法は、触覚データを用いてユーザのデジタル・コンテンツ体験を豊かにするためのコンピュータ実装型の方法であり、コンピュータ・プログラム・モジュールを書き込まれたプロセッサを有する計算装置上で実装される。このコンピュータ実装型の方法は、触覚データを他のデジタル・コンテンツ・データとともに通信ネットワーク経由でエンド・ユーザに向けて伝送し、このエンド・ユーザがネットワークに接続されたエンド・ユーザ装置上で生成された触覚効果を体験する。
一実施形態において、この方法は、触覚データを分析して触覚データの少なくとも1つの特性を決定する工程を含み、触覚データを符号化する工程は、決定された特性に基づいて、所定の基準を満たすように触覚データを符号化することを含む。
一実施形態において、この所定の基準は、最小のビット数を有する出力符号化触覚ビット・ストリームを含む。
一実施形態において、この方法は、エンド・ユーザ装置のエンド・ポイント構成を当該エンド・ユーザ装置から受信する工程を含み、前記所定の基準は、受信したエンド・ユーザ装置のエンド・ポイント構成に対応する触覚データの周波数の範囲を維持することを含む。
一実施形態において、触覚データを符号化する工程は、決定された特性に基づいて所定のエンコーダのリストからエンコーダを選択する工程と、選択したエンコーダを触覚データを変換するために適用する工程と、を含む。
一実施形態において、所定のエンコーダのリストは、高等音声符号化エンコーダ(Advanced Audio Coding encoder)及び/又はフリー無損失音声エンコーダ(Free Lossless Audio encoder)を含む。
一実施形態において、触覚データの特性は、触覚データに基づいて触覚効果を生成するために用いる触覚出力装置の一又は複数の種類と、触覚データの意図される使用事例と、触覚データの重要度と、触覚データの周波数と、触覚データ内の無音部分の長さと、を含む。
一実施形態において、触覚出力装置の種類は、偏心回転質量体アクチュエータ、リニア共振アクチュエータ、及び圧電アクチュエータからなる群のうちの一又は複数を含む。
一実施形態において、触覚データの意図される使用事例は、音楽、映画、及びゲームからなる群から選択される。
一実施形態において、触覚データを符号化する工程は、所定のエンコーダのリストの各々を触覚データに適用して、符号化された触覚データの対応するリストを生成する工程と、所定の基準を用いて、符号化された触覚データ・ストリームのリストから符号化された触覚データ・ストリームを選択する工程と、を含む。
一実施形態において、触覚データを符号化する工程は、密度係数の所定のリストに対応して触覚データを符号化して、各々が密度係数の所定のリストの1つの密度係数に対応する複数の符号化された触覚データ・ストリームを生成する工程を含む。また、この方法は、エンド・ユーザ装置から通信ネットワーク経由でネットワーク帯域幅情報を受信する工程と、通信ネットワーク帯域幅の条件に合致する対応する密度係数に基づいて、符号化された触覚データ・ストリームの1つを選択し、受信したデジタル・コンテンツ・データと多重化する工程と、を含む。
一実施形態において、複数の符号化されたデータ・ストリームのうちの第1の符号化されたデータ・ストリームは、密度係数の所定のリストのうちの第1の密度係数に対応しており、前記複数の符号化されたデータ・ストリームのうちの第2の符号化されたデータ・ストリームは、密度係数の所定のリストのうちの第2の密度係数に対応しており、第2の符号化されたデータ・ストリームは、第1のデータ・ストリームよりも多くの触覚データを含み、第2の密度係数は第1の密度係数よりも大きい。
一実施形態において、この方法は、ネットワーク帯域幅情報の変化を検出する工程と、通信ネットワーク帯域幅の条件と合致する対応する密度係数に基づいて、複数の符号化された触覚データ・ストリームのうちの異なる触覚データ・ストリームを選択する工程と、複数の符号化された触覚データ・ストリームのうちの前記選択された異なる触覚データ・ストリームをエンド・ユーザ装置に伝送する工程と、を含む。
本発明の一態様によれば、提供されるシステムは、音声データ及び/又は動画データを含むデジタル・コンテンツ・データを受信し、受信したデジタル・コンテンツ・データの少なくとも一部を用いて触覚データを生成し、通信ネットワーク経由で効率的に伝送するために触覚データを符号化し、符号化した触覚データを受信したデジタル・コンテンツ・データと多重化し、多重化したデータ・ストリームのメタ・データ内に、符号化した触覚データを復号するための情報を埋め込み、多重化したデータを通信ネットワーク経由で送信するように構成されたプロセッサを含む。このシステムは、多重化された符号化された触覚データ及びデジタル・コンテンツ・データを通信ネットワーク経由で受信するように構成されたユーザ装置を含む。このユーザ装置は、触覚データに基づいて触覚効果を出力するように構成された触覚出力装置を含む。
一実施形態において、このプロセッサは、触覚データを分析して触覚データの少なくとも1つの特性を決定し、決定された特性に基づいて、所定の基準を満たすように触覚データを符号化するようにさらに構成される。
一実施形態において、このプロセッサは、エンド・ユーザ装置のエンド・ポイント構成を当該ユーザ装置から受信するように構成され、前記所定の基準は、受信したエンド・ユーザ装置のエンド・ポイント構成に対応する触覚データの周波数の範囲を維持することを含む。
一実施形態において、このプロセッサは、決定された特性に基づいて所定のエンコーダのリストからエンコーダを選択し、選択したエンコーダを触覚データを変換するために適用するように構成される。
一実施形態において、このプロセッサは、所定のエンコーダのリストの各々を触覚データに適用して、符号化された触覚データの対応するリストを生成し、所定の基準を用いて、符号化された触覚データ・ストリームのリストから符号化された触覚データ・ストリームを選択するように構成される。
一実施形態において、このプロセッサは、密度係数の所定のリストに対応して触覚データを符号化して、各々が密度係数の所定のリストの1つの密度係数に対応する複数の符号化された触覚データ・ストリームを生成し、エンド・ユーザ装置から通信ネットワーク経由でネットワーク帯域幅情報を受信し、受信したデジタル・コンテンツ・データと多重化するための通信ネットワーク帯域幅の条件に合致する対応する密度係数に基づいて、符号化された触覚データ・ストリームの1つを選択するように構成される。
一実施形態において、このプロセッサは、ネットワーク帯域幅情報の変化を検出し、通信ネットワーク帯域幅の条件と合致する対応する密度係数に基づいて、複数の符号化された触覚データ・ストリームのうちの異なる触覚データ・ストリームを選択し、複数の符号化された触覚データ・ストリームのうちの前記選択された異なる触覚データ・ストリームをエンド・ユーザ装置に伝送するように構成される。
本技術の上記及び上記以外の特徴、及び性質、並びに、関連する構成要素の動作方法及び機能、そして製造における各部分の組み合わせと経済性については、添付図面を参照しつつ以下の詳細な説明と添付の特許請求の範囲を検討することによってさらに明らかになる。これらはいずれも本明細書の一部を構成する。本明細書において、同様の参照符号は種々の図における対応部分を表している。添付図面は例示及び説明のためのものであり、本発明の発明特定事項の定義として用いることは意図されていない。本明細書及び特許請求の範囲における用法によれば、単数形の「a」、「an」及び「the」には複数のものへの言及が含まれる。ただし、文脈によって別に解すべきことが明白な場合はこの限りでない。
他のマルチメディア・データとともにローカル又はリモートで再生される触覚データを生成及び符号化するための方法の一実施形態を示す図である。
他の符号化されたマルチメディア・データと同期して触覚データを復号及び表示するための方法の一実施形態を示す。
符号化された触覚データをマルチメディア・データとともに通信ネットワーク経由で伝送するためのシステムの一実施形態を示す図である。
触覚データの生成に用いられる異なるプロファイルを保存するデータ構造体の一実施形態を示す図である。
触覚データがエンド・ポイント及び使用事例に基づいて生成される、ユーザ選択可能方法の一実施形態を示す図である。
触覚データがエンド・ポイント及び使用事例に基づいて生成される、自動検出方法の一実施形態を示す図である。
ネットワーク経由で伝送するために触覚データ・ストリームを符号化する方法の一実施形態を示す図である。
異なる密度係数を有する触覚信号の一実施形態を示す図である。 異なる密度係数を有する触覚信号の一実施形態を示す図である。 異なる密度係数を有する触覚信号の一実施形態を示す図である。
適応触覚密度コード変換を行う方法の一実施形態を示す図である。
一定の期間にわたって使用可能なネットワーク帯域幅に関連して行われる適応密度コード変換の一実施形態を示す図である。
MP4形式のファイル内の音声データのためのハンドラ構造体の一実施形態を示す図である。
MP4形式のファイル内の動画データのためのハンドラ構造体の一実施形態を示す図である。
MP4形式のファイル内の触覚データのためのハンドラ構造体の一実施形態を示す図である。
MP4形式のファイル内の音声、動画、触覚データ・ヘッダの一実施形態を示す図である。
MP4形式のファイル内の触覚データのための有効な設定の一実施形態を示す図である。
MP4形式のファイル内の触覚データのための無効な設定の一実施形態を示す図である。
本発明の実施形態は、触覚データをデジタル・コンテンツの一部として生成、伝送、及び/又は保存することで、このデジタル・コンテンツを消費するユーザの体験を豊かにするためのシステム及び方法に関する。本明細書で用いられるように、「デジタル・コンテンツ」とは、伝送及び持続性の記憶媒体での保存が可能であり、例えば音声及び/又は動画データを含む情報のことである。よってデジタル・コンテンツは、伝送及び持続性の記憶媒体での保存が可能な、様々なファイル形式を用いて符号化された情報及び/又はその他の符号化されていないコンテンツを含む。
一実施形態において、マルチメディア・データの再生に触覚効果を加えることが望ましい。図1は、本発明の一実施形態に従い、最終的にローカル又はリモートで他のデジタル・コンテンツとともに再生される触覚データを生成及び符号化するための方法100を示す。図に示すように、方法100はソース・マルチメディア処理段階110と、音声触覚変換段階120と、触覚符号化段階130と、多重化段階140と、マルチメディア・インターリーブ段階150とを含む。
一実施形態において、触覚データはマルチメディア・データ・ストリームの音声データから生成される。音声データはソース・マルチメディア処理段階110で抽出され、以下に詳述するように、音声触覚変換段階120で未加工の触覚データ・ストリームに変換される。この未加工の触覚データは触覚符号化段階130でさらに符号化され、これにより触覚データの伝送又は保存に必要なネットワーク帯域幅又は記憶領域がより少なくなる。多重化段階140では、符号化された触覚データはソース・マルチメディア・データ・ストリームと結合され、符号化された触覚データ及びソース・マルチメディア・データはマ
ルチメディア・インターリーブ段階150でインターリーブされる。
一実施形態において、段階110でマルチメディア・データから抽出された音声データは、例えば、PCM形式のビット・ストリーム中の単なる未加工のデータである。一実施形態において、音声データは例えば高等音声符号化(AAC)エンコーダを用いてすでに符号化されている場合もある。後者の場合、符号化された音声データは、段階110の最後の工程として、又は段階120の最初の工程として、最初に復号される。一実施形態において、段階130で用いられる触覚データはマルチメディア・データに含まれる音声データから生成されるのではなく、異なるソース、例えば図1に示される未加工触覚データ記憶装置125から取得される。一実施形態において、上述の方法100では音声データの代わりに、又は音声データに加えて、動画データを用いて触覚データを生成してもよい。例えば、ある動画データの変化、例えば雷の場面を触覚効果をユーザに提供するトリガとして用いて、ユーザが雷の場面に関連する雷鳴の感覚を体験できるようにしてもよい。
図2は本発明の一実施形態に従い、触覚データを他の符号化されたマルチメディア・データと同期して復号及び表示する方法200を示す。一実施形態において、インターリーブされたマルチメディア・データ202が再生される端末装置では、最初にデマルチプレクサ204がインターリーブされたマルチメディア・データ・ストリーム202を音声データ・ストリーム206、動画データ・ストリーム208、及び触覚データ・ストリーム210を含む異なるデータ・ストリームに分離する。一実施形態において、デコーダ/シンクロナイザ212は一又は複数の音声デコーダ、一又は複数の動画デコーダ、及び一又は複数の触覚デコーダ(図示せず)を含む。復号された音声データ及び動画データは音声/動画再現装置214(例えば、スピーカ及び表示スクリーン)に送られて再生される。復号された触覚データ・ストリーム216は、一又は複数の触覚出力装置、例えば装置H1、H2、H3、H4、及び/又はH5に送られ、音声データ及び動画データと同期して表示される。
一実施形態において、触覚出力装置H1−H5は少なくとも1つのエンド・ポイント・プロセッサ218、振幅変調器220、振動再現装置224、及び少なくとも1つのアクチュエータ226からなる。加えて他の信号処理装置222を用いて、エンド・ポイント・プロセッサから出力される信号を改変してもよい。図示の実施形態は、いかなる限定をも意図するものではない。
本明細書で述べたように、触覚出力装置が含み得るアクチュエータは、例えば、偏心質量体がモータにより動かされる偏心回転質量体(「ERM」)などの電磁アクチュエータ、ばねに取り付けられた質量体が前後に駆動されるリニア共振アクチュエータ(「LRA」)、または圧電材料、電気活性ポリマー、もしくは形状記憶合金などの「スマートマテリアル」、マクロ複合繊維アクチュエータ、静電気アクチュエータ、電気触感アクチュエータ、および/または触覚(例えば、振動触知)フィードバックなどの物理的フィードバックを提供する他の種類のアクチュエータ、である。触覚出力装置は、非機械的または非振動装置、例えば、静電摩擦(「ESF」)や超音波表面摩擦(「USF」)を用いる装置、超音波触覚トランスデューサを用いて音響放射圧力を生じさせる装置、触覚基板および可撓性もしくは変形可能な表面を用いる装置、またはエアジェットを用いた空気の吹きかけなどの発射型の触覚出力を提供する装置などを含んでもよい。触覚出力装置のこのような実施形態は通常の技能を有する当業者に知られており、本明細書ではこれ以上議論しない。
図3は符号化された触覚データをマルチメディア・データとともに通信ネットワーク経由で伝送するためのシステム300の一実施形態を示す。図示するように、システム300は、プロセッサ310と、リモート記憶装置330と、エンド・ユーザ装置334、3
36、及び338と、一又は複数の通信ネットワーク332とを含み、この一又は複数の通信ネットワーク332は、プロセッサ310と、リモート記憶装置330と、エンド・ユーザ装置334、336、及び338とを接続する。一実施形態において、プロセッサ310は、リモート記憶装置330に加えて、又はリモート記憶装置330に代えて、自身の電子記憶装置328を含む。一実施形態において、リモート記憶装置330は、プロセッサ329及び持続性記憶媒体331をも含む。プロセッサ329はデジタル・コンテンツ・データベース及びエンド・ユーザ装置334、336、338のプロファイル情報を維持する。これらについては以下で図4に関連してさらに説明する。
プロセッサ310は、汎用または特殊用途プロセッサ、あるいはシステム300の動作および機能を管理または制御するマイクロ・コントローラである。一実施形態において、プロセッサ310は、例えばエンド・ユーザ装置334に組み込まれる特定用途向け集積回路(「ASIC」)として特別に設計されており、エンド・ユーザ装置334内の触覚出力装置を通して触覚効果を提供することで、エンド・ユーザ装置334で再生される映画におけるユーザの楽しみを増進するように構成される。一実施形態において、プロセッサ310はまた、他のリモートなエンド・ユーザ装置336から通信ネットワークを経由して受信したフィードバックに基づいてどのような触覚効果を生成するべきかを、所定の係数を基に決定し、その後例えばエンド・ユーザ装置336上の触覚出力装置を駆動するために用いられるストリーミング命令を提供するように構成される。ネットワーク332には、有線接続又は無線接続が含まれる。本発明の一部の態様において、当該ネットワークは、例えば、インターネット、イントラネット、PAN(Personal Area
Network)、LAN(Local Area Network)、WAN(Wide Area Network)、SAN(Storage Area Network)、MAN(Metropolitan Area Network)、無線ネットワーク、セルラー通信ネットワーク、公衆交換電話網、および/またはこれら以外のネットワークの一又は複数である。
例えば、通信ネットワーク332はコンテンツ配信ネットワーク(「CDN」)であってもよく、これは通常、コンテンツ(ウェブサイト、動画、音楽など)を配信してそのような資産又はコンテンツにグローバルにより早くアクセスできるようにするために用いられる。CDNは世界中のエッジ・サーバを利用して、頻繁にアクセスされるコンテンツを基本的にミラーリングし、また当該エッジ・サーバ上のコンテンツのライフサイクルを自動的に管理する。実際の資産又はコンテンツは通常、より永続的な配信元サーバ上で保存及び更新され、CDNは必要に応じて自動的に資産及びコンテンツにアクセスし、それらを適切なエッジ・サーバにミラーリングする。
一実施形態において、プロセッサ310は複数のプロセッサを含み、当該プロセッサの各々がシステム300の内部で特定の機能を果たすように構成されている。一実施形態において、プロセッサ310は、一又は複数のコンピュータ・プログラム・モジュールを実行するように構成されてもよい。当該一又は複数のコンピュータ・プログラム・モジュールは、少なくとも1つのマルチメディア・モジュール312と、一又は複数の触覚符号化モジュール314と、ユーザ・インターフェース・モジュール324と、通信モジュール326とを含む。一実施形態において、触覚符号化モジュール314は、音声触覚変換モジュール316と、触覚圧縮モジュール318と、触覚密度コード変換モジュール320と、マルチメディア・アセンブル・モジュール322とを含む。例えば、マルチメディア・アセンブル・モジュール322は、図3に示すとおり、MP4コンテナ形式に従って音声、動画、及び触覚データを含むマルチメディア・データ・ストリームを組み立てるように構成される。一実施形態において、ローカル記憶装置328及びリモート記憶装置330を用いて、触覚の異なる使用事例に用いる様々なプロファイル及び生成された触覚データ・ストリームを圧縮の前後に保存してもよい。これについては以下に詳述する。
図3においてモジュール312−326は単一のプロセッサ310内の同じ位置に配置されるものとして示されるが、プロセッサ310が複数のプロセッサを含む実施形態においては、モジュール312−326のうちの一または複数が他のモジュールから離れて配置されてもよい。以下で詳述される異なるモジュール312−326によって提供される機能の記載は説明のためのものであり、限定を意図したものではない。モジュール312−326はいずれも記述されるよりも多くの、または少ない機能を提供してもよい。例えば、モジュール312−326のうちの一または複数を取り除き、その機能の一部またはすべてを、モジュール312−326のうちの他のモジュールで提供してもよい。他の例として、以下でモジュール312−326のうちの1つに帰せられる機能の一部またはすべてを実行する1つまたは複数の追加的なモジュールを実行するように、プロセッサ310が構成されてもよい。モジュール312−326の機能及び動作は、以下で詳述する。適応音声触覚変換
上述のように、触覚データを表示又は再生するために使用できる触覚出力装置には様々な種類がある。音声触覚変換アルゴリズムは触覚出力装置の各々の種類に特化して設計されており、異なる種類の触覚出力装置及び異なる音声触覚変換アルゴリズムが存在することによって、異なる特性を有する触覚データ・ストリームがもたらされる。触覚出力装置の各々の種類及び特定のエンド・ユーザ装置に特化して設計された特定の音声触覚変換アルゴリズムを含む、触覚データ生成のための音声触覚変換アルゴリズムのリストを維持することは、音声触覚変換アルゴリズム及び触覚出力装置の数が増えるに従って困難になる。
一実施形態において、音声触覚変換アルゴリズムを含むエンド・ユーザ装置に含まれる各々の種類の触覚出力装置はエンド・ポイントとして扱われ、この触覚出力装置に用いられる各アルゴリズムは、特定の体験を与えることを目的とするプロファイルとして扱われる。本発明の実施形態は、触覚出力措置の種類、及び音声触覚変換プロファイルを変更するために用いられる任意の付加的な係数を、このシステムが自動的に検出することを可能にする。このシステムの一実施形態において、ユーザは所与の使用事例においてどのプロファイルをアクティブにしたいのかを選択することもできる。
本発明の実施形態は、開発者が各エンド・ポイント(すなわち、触覚出力装置)についてすべての使用可能なアルゴリズムを多くて1度コンパイルするだけで、コンパイル時間を短縮することができる。ユーザが異なる体験を欲する異なる状況が存在するため、装置に同時に存在するアルゴリズムが1つでは不十分な場合がある。音楽に用いる音声触覚自動変換アルゴリズムは、映画に用いるものとは異なる場合があり、さらにはゲーム等に用いるものとも異なる場合がある。エンド・ユーザ装置におけるエンド・ポイント(すなわち、触覚出力装置)は通常固定されているが、本明細書で説明する実施形態では、エンド・ユーザ装置が、アプリケーション・フォーカス、センサに基づくデータ、及び環境要素に基づいてその振る舞いを適応させることが可能である。
図4は触覚データの生成に用いられる異なるプロファイルのデータベース400の一実施形態を示す。一実施形態において、これらのプロファイルは電子記憶装置328に記憶される。一実施形態において、これらのプロファイルはその使用事例、例えば、映画使用事例410、音楽使用事例420、及びゲーム使用事例430に従って編成される。映画使用事例410においては、エンド・ユーザが映画又は他の動画、例えばテレビのショー又は宣伝を見ているときに、触覚効果を体験することを意図している。音楽使用事例420においては、エンド・ユーザが音楽を聴いているときに触覚効果を体験することを意図している。同様に、ゲーム使用事例430においては、エンド・ユーザがゲームをプレイしているときに触覚効果を体験することを意図している。
各々の異なる使用事例においては、ユーザは異なる触覚体験を欲するため、使用事例に基づいてプロファイルを編成することは有利である。理想的には音楽に用いる触覚効果は、映画に用いるものとは異なっており、さらにはゲーム等に用いるものとも異なっている。各使用事例の範囲内では、プロファイルは各エンド・ポイント(すなわち、一般に音声触覚変換アルゴリズムを有するエンド・ユーザ装置上の触覚出力装置)ごとに保存される。例えば、映画使用事例410の場合、プロファイル412は圧電アクチュエータ専用の音声触覚変換アルゴリズムを有するエンド・ユーザ装置334用に保存されており、プロファイル414はERMアクチュエータ及び対応する音声触覚変換アルゴリズムを有するエンド・ユーザ装置336用に保存されており、プロファイル416はLRA及び対応する音声触覚変換アルゴリズムを有するエンド・ユーザ装置338用に保存されている。音楽使用事例420の場合、プロファイル422は圧電アクチュエータを有するエンド・ユーザ装置334用に保存されており、プロファイル424はERMアクチュエータを有するエンド・ユーザ装置336用に保存されており、プロファイル426はLRAを有するエンド・ユーザ装置338用に保存されている。同様に、プロファイル432は、触覚出力装置が圧電アクチュエータであるゲーム使用事例430用に保存されており、プロファイル434はゲーム使用事例及びERMアクチュエータ用に保存されており、プロファイル436はゲーム使用事例及びLRA用に保存されている。一実施形態において、単一のエンド・ユーザ装置は複数のエンド・ポイントを含む。
本発明の実施形態は、各エンド・ポイントについてすべての使用可能なプロファイル・アルゴリズムが、オフラインであれリアルタイムであれ、多くても1回コンパイルされることで、コンパイル時間を短縮することができる。さらに、本発明の実施形態では、単一の装置内のエンド・ポイント(触覚出力装置)は変更できないものの、エンド・ポイントがアプリケーション・フォーカス、センサに基づくデータ、及び環境要素に基づいてその振る舞いを適応させることが可能である。
一実施形態において、システム300は自動的に触覚出力装置の種類及び付加的な要素を検出する。例えば、音声触覚変換モジュール316は、通信モジュール326を介して通信ネットワーク332経由でエンド・ユーザ装置334と通信し、エンド・ユーザ装置334が有する触覚出力装置の種類を決定し、これが音声触覚変換プロファイルを変更するために用いられる。一実施形態において、エンド・ユーザ装置336のユーザは、ユーザ・インターフェース・モジュール324を介して通信ネットワーク332経由で触覚符号化モジュール314と通信し、所与の使用事例において自身がどのプロファイルをアクティブにしたいかを選択することができる。
図5は触覚データがエンド・ポイント及び使用事例に基づいて生成される、音声触覚変換モジュール316のユーザによって選択可能な実施形態を示す。本実施形態において、工程502では、音声触覚変換モジュール316はすべての使用可能な音声触覚変換アルゴリズムを図4中のデータベース400に事前保存する。音声触覚変換アルゴリズムの各々は、ユーザに理解できる方法で識別される。これは、音声触覚設定アプリケーション/アクティビティ又は別個のアプリケーション/アクティビティによって行われる。
エンド・ユーザ装置で再生されるデジタル・コンテンツに触覚効果を付与することが望ましい場合は、工程504で音声触覚変換モジュール316が要求された情報又はユーザ入力に基づいて使用事例を決定する。一実施形態において、音声触覚変換モジュール316は使用事例決定工程504において、どのアプリケーションがフォアグラウンド又はバックグラウンドで実行中であるかを確認し、装置が音声触覚変換モジュール316を再構成してユーザにより選択された音声触覚変換アルゴリズムを実行する。
工程506では、音声触覚変換モジュール316は要求を行ったエンド・ユーザ装置のエンド・ポイント構成を決定する。一実施形態において、音声触覚変換モジュール316は単純にユーザ・インターフェース・モジュール324を介してユーザ入力を取得することによって上記の決定を行う。一実施形態において、音声触覚変換モジュール316は、電子記憶装置328に保存された登録エンド・ユーザ装置データベースを検索し、エンド・ポイント構成を取得する。一実施形態において、音声触覚変換モジュール316は、要求を行ったエンド・ユーザ装置と通信モジュール326を介して通信し、エンド・ポイント構成を取得する。一実施形態において、エンド・ユーザ装置は様々な種類の触覚効果を表示するために複数のエンド・ポイントを有する。例えば、エンド・ユーザ装置338は、LRA、圧電アクチュエータ、及びERMアクチュエータを有する。
使用事例及びエンド・ポイント構成に関する情報をともに取得した後、工程508において、音声触覚変換モジュール316はユーザによって選択されたプロファイルを識別する。一実施形態において、これは図4に示されるようにデータベース400内の検索テーブルを用いることによって実現できる。
エンド・ポイントの構成及びユーザによって選択されたプロファイルに基づき、工程512において、音声触覚変換モジュール316は適切なアルゴリズムを音声データ510に適用し未加工の触覚データ514を生成するように自らを構成する。例えば、ユーザがLRAを備える装置を有しており、音楽の再生用に「超低音の」プロファイルを選択する場合、音楽の再生中に、音声触覚変換モジュール316はこれが音楽の使用事例であることを理解し、LRA専用に生成されたプロファイル416から「超低音」処理アルゴリズム(例えば、低周波数のみ)を選択する。装置がLRAの代わりに圧電アクチュエータ又はERMアクチュエータをを有している場合、それらのエンド・ポイント用に対応するアルゴリズムがプロファイル410、414から選択される。
一実施形態において、プロセッサ310は、適切なアルゴリズムを適用して一のエンド・ポイント用の未加工の触覚データ514を他のエンド・ポイント用の未加工の触覚データに変換するように構成された触覚触覚モジュール(図示せず)を含む。例えば、この触覚触覚モジュールはLRA用に生成された未加工の触覚データ514を圧電アクチュエータ用の触覚データに変換することができ、またその逆もできる。このような触覚触覚信号変換は、触覚データが符号化されているときか又は触覚データがエンド・ユーザ装置で復号されているときに完了する。
図6は、ユーザが音声触覚変換アルゴリズムを特定せずに触覚データがエンド・ポイント及び使用事例に基づいて生成される、音声触覚変換モジュール316の自動検出実施形態600を示す。工程610において、音声触覚変換モジュール316は、デジタル・コンテンツ再生用のアプリケーションがエンド・ユーザ装置(又はシステム300)にインストールされている場合、当該アプリケーションの情報を登録する。このようなアプリケーションは例えば音声プレイヤ、動画プレイヤ、又はゲーム・プレイヤなどである。工程612において、音声触覚変換モジュール316は、例えばエンド・ユーザ装置又はシステム上のセンサによって計測される要因などの環境要因を登録する。例えば、エンド・ユーザ装置の周りの照明(例えば、明るいもの又は暗いもの)や装置の外側の温度などが感知され、所与の時間にどのプロファイルを使用するかを決定するための入力として用いられる。例えば、装置が低照明環境で用いられていると決定された場合、より顕著な又はより顕著でない触覚効果がユーザによって求められる。
エンド・ユーザ装置で再生されるデジタル・コンテンツに触覚効果を付与することが望ましい場合は、工程614で音声触覚変換モジュール316が要求情報又はユーザ入力に基づいて使用事例を決定する。工程616において、音声触覚変換モジュール316は、
マルチメディア・データとともに触覚効果が表示されるエンド・ユーザ装置のエンド・ポイント構成を決定する。
一実施形態において、音声触覚変換モジュール316はユーザ・インターフェース・モジュール324を介してユーザ入力を取得することによって上記の決定を行う。一実施形態において、音声触覚変換モジュール316は、要求を行ったエンド・ユーザ装置(例えば、エンド・ユーザ装置338)と通信モジュール326を介して通信し、エンド・ポイント構成を取得する。一実施形態において、エンド・ユーザ装置は様々な触覚効果を表示するために複数のエンド・ポイントを有する。例えば、エンド・ユーザ装置338は、LRA、圧電アクチュエータ、及び/又はERMアクチュエータを有する。
使用事例及びエンド・ポイント構成の情報をともに取得した後、工程618において音声触覚変換モジュール316は、ユーザによる選択によらず、工程610−616で収集及び決定されたすべての情報を考慮に入れた使用に適したプロファイル又は変換アルゴリズムを識別する。一実施形態において、これは図4に示されるようにデータベース400内の検索テーブルを用いることによって実現できる。工程620において、音声触覚変換モジュール316は決定された変換アルゴリズムを音声データ622に適用し未加工の触覚データ624を生成するように自らを構成する。
図6に示す自動検出実施形態600が図5に示すユーザ選択可能な実施形態500と異なる点は、音声触覚変換モジュール316を構成するためにユーザがシステム300又はエンド・ユーザ装置334、336、338と直接インタラクトする必要がないことである。自動検出実施形態600において、音声触覚変換モジュール316は、エンド・ユーザ装置内のセンサ情報、使用事例、並びにエンド・ポイント(触覚出力装置)構成を含む外部要因を用いて、デジタル・コンテンツが再生される特定のアプリケーションに最適な音声触覚変換アルゴリズムを順応的に選択する。
一実施形態において、エンコーダは各エンド・ポイントについて触覚データを符号化して触覚ストリームを多重化し、すべての触覚ストリームはエンド・ユーザ装置に伝達される。エンド・ユーザ装置は、その特定のエンド・ユーザ装置内のエンド・ポイント(触覚出力装置)にマッチする適切な触覚信号を識別及び抽出する。
触覚ストリームの様々な符号化
上述の生成された触覚データは、未加工の触覚データ・ストリームと称する。上述のように、未加工の触覚データ・ストリームを保存及び/又は伝送することは、様々な理由により、触覚データを伝達する最も効率的な方法ではない。例えば、ストリーム中には無音(触覚データがない)の期間が存在する。
図7はネットワーク経由で伝送するために未加工の触覚データ・ストリームを符号化する方法700の一実施形態を示す図である。一実施形態において、工程702では、音声触覚変換モジュール316(例えば、図5の工程514及び図6の工程624)及び/又は触覚触覚モジュールによって生成された未加工の触覚データを、触覚符号化モジュール314が受信する。工程704では、触覚データのコンテンツは未加工の触覚データ・ストリームの特性を決定するために分析される。この特性には、触覚データが再生される触覚出力装置の種類、未加工の触覚データの使用事例、未加工の触覚データの周波数、未加工の触覚データ・ストリーム中の無音部分の長さ、未加工の触覚データの大きさ、などが含まれる。工程706では、触覚符号化モジュール314は、未加工の触覚データの決定された特性に基づいて、所定の基準に合致するように未加工の触覚データを符号化する。
一実施形態において、工程708で触覚符号化モジュール314は最初に、その特定の
ストリーム用にエンコーダのリストからエンコーダを選択し、その後工程710で、選択したエンコーダをその未加工の触覚データ・ストリームに適用する。例えば、触覚ストリームを符号化して圧縮するために多くの音声エンコーダが用いられる。しかし、音声エンコーダにはメリットとデメリットがある。例えば、一般的な符号化のための空間及び品質の観点では上述のAACがよく、ストリームに多くの無音部分が含まれる場合にはフリー無損失音声コーデック(FLAC)がよい。その他の適切なエンコーダ、すなわち、AAC及びFLAC以外のデジタル信号コーダ/コンプレッサを用いてもよい。未加工の触覚データ・ストリームの決定された特性にマッチするように適切なエンコーダを選択し、符号化されたデータ・ストリームの有効性及び効率を確実にする必要がある。
一実施形態において、ユーザ装置での再生のために使用される触覚出力装置にマッチする未加工の触覚データの周波数範囲を維持するために、所定の基準を用いてもよい。これにより、触覚符号化モジュール314は、図4に関して上述した事前に保存した使用事例及びエンド・ポイント・プロファイルを含むデータベース400にアクセスしなければならなくなる。
一実施形態において、工程712において、触覚符号化モジュール314は、所定のエンコーダのリスト内の各エンコーダを用いて未加工の触覚データ・ストリームを符号化し、その後工程714において、符号化出力として最小のビット数を有する符号化された触覚データ・ストリームを選択する。一実施形態において、工程716では、触覚符号化モジュール314は使用されるエンコーダに関する情報及び符号化された触覚データ・ストリームを復号するために必要な他の情報を保存する。一実施形態において、符号化された触覚データ・ストリームについてのエンコーダ情報は、コンテナ形式のメタデータに埋め込まれる。エンド・ユーザ装置の側では、この情報は解析され、正しいデコーダを用いてストリームを復号する。例えば、エンコーダ情報はMPEG4形式でユーザ・プライベート又はカスタム・アトム(custom atom)に埋め込まれる。
一実施形態において、触覚符号化モジュール314はまた、未加工の触覚データを通信ネットワーク経由でストリーミングするとき、当該未加工の触覚データを符号化する際に帯域幅の可用性を考慮に入れる。これについては以下でより詳細に述べる。
適応密度コード変換
一実施形態において、触覚信号品質を維持する方法は、触覚データ・ストリーム内の触覚波形の特性を活用しつつより少ないビット数を送信することによって提供される。多重符号化方式の目的は、輻輳したネットワークのためによりデータ送信量を低減することであるため、本発明の実施形態は触覚データ・ストリームに適応密度ストリーミングを提供する。密度係数は、閾値に基づいて所定量のデータに触覚を適用することで、信号がどの程度密あるいは疎であるかを決定する。これがコード変換段階で異なる密度係数を用いて触覚データ・ストリームを符号化するために行われた場合、触覚は、ネットワーク帯域幅が自由に使用できない場合にはより少ないデータとともに送信され、使用可能なネットワーク帯域幅が豊富な場合にはより多くのデータとともに送信される。
一実施形態において、触覚データの適切かつ高品質な部分は保持され、一方で不要なデータは切り捨てられる。それにより、所与の時間において使用可能なネットワーク帯域幅のうち占有される部分がより少なくなる。デジタル・コンテンツを送信するとき、音声/動画/メタデータとともにストリーミングされる別個の種類のメディアを付加することは、当然音声/動画/メタデータの品質に影響する。本発明の実施形態は、音声/動画信号の品質が受ける影響の程度を最小化しつつ、より小さなオーバーヘッドで快適な触覚体験を提供するための役に立つ。
図8A−8Cは未加工の触覚信号を符号化してネットワーク経由でストリーミングするために用いられる密度係数が異なる実施形態を示す。図9Aは中間の密度係数を示し、図8Bは高い密度係数を示し、図8Cは低い密度係数を示す。図8A−8Cの網掛けの薄い領域(「使用データ」領域)は、信号のどの部分が使用及び符号化されるかを示し、図8A−8Cの網掛けの濃い領域(「無視データ」領域)は、信号のどの部分が無視されるかを示す。
例えば、図8Aは中間の密度係数を用いて符号化される未加工の触覚データ信号を示す。信号がトランスコーダに入力される未加工の触覚データを表す場合、トランスコーダは「使用データ」領域の範囲内の信号のみに対応する触覚データを出力し、この触覚データは高い密度係数を有する信号内に存在するデータよりも少なくなる。図8Bは高い密度係数を用いて符号化される未加工の触覚データを示す。ネットワーク帯域幅が使用可能な時のストリームの場合、コード変換においてこのような高い密度係数を用いると、より多くのデータがネットワークをストリーミングするため有用である。図8Cは低い密度係数を用いて符号化される未加工の触覚データを示す。大量のネットワーク輻輳が発生しているときのストリームの場合は、この種のコード変換が適している。それは、出力ストリームがより少数のビットのデータを伝送し、比較的重要度の高いイベントに関するデータのみを送信することになるからである。
図8A−8Cに示すように、出力信号に現れるデータの量は密度係数を変更することで調整が可能であり、これにより触覚符号化モジュール314は、必要に応じて信号内の重要度の低い所定の情報を処理しないことが可能になり(例えば、信号を再生する価値もない程度に重要度が低い信号や、帯域幅を維持するために無視される触覚信号内の取るに足りない詳細)、またネットワーク経由でより広い帯域幅が使用可能な場合により多くのデータを含むことも可能になる。一実施形態において、信号内のゼロ値を有するデータ(すなわち、図8A−8Cの中央線にある)は触覚信号から伝送する必要のあるものがないことを示す。
図9は適応触覚密度コード変換方法900の一実施形態を示す。本明細書で用いるように、コード変換とは未加工の触覚データの符号化と交換可能な用語であるが、この用語は符号化がソース(例えば、ストリーミング・サーバ)から異なる目的地(例えば、リモートなエンド・ユーザ装置)への変換のためのものであることを強調している。図示するように、入力は未加工の触覚データ902であり、これは例えば上述のように音声触覚変換モジュール316によって生成されたデータである。触覚トランスコーダ904は複数のビット・レートで未加工の触覚データ902を符号化し、各ビット・レートは図8A−8Cについて上述した特定の密度係数に対応している。触覚ウェブ・サーバ906は、異なる密度係数を用いて符号化された触覚ビット・ストリームを保存し、符号化された触覚データ・ストリームについて目録ファイル908を保持する。エンド・ユーザ装置912(例えば、図3のエンド・ユーザ装置334、336、338)がネットワーク910(又は図3の332)を介して触覚ウェブ・サーバ906と通信し、所与の未加工の触覚信号902のための符号化された触覚データ・ストリームの1つを受信する。
一実施形態において、触覚データ・ストリームの密度は、密度係数を1と15(15は最高密度であり、1は最低密度である)の間で修正することにより調整できる。この値は、符号化された触覚データ・ストリーム含まれるデータ量の閾値(上述)として機能する。結果として、この密度値が低いほど、符号化された触覚データ・ストリームに含まれる低重要度の(より重要でない)未加工の触覚データの量が少なくなる。トランスコーダ904が密度の閾値を高めるにつれて、より重要度が低く詳細なデータが、符号化された触覚データ・ストリームに累加的に追加される。よって、高い密度はよいネットワーク接続性に対応し、低い密度は乏しいネットワーク接続性に対応する。
図9に示すように、触覚ウェブ・サーバ906は5つの異なる密度係数で符号化された触覚ビット・ストリーム1−5を保存し、特定の未加工の触覚データ入力に対応する符号化された触覚データ・ストリームについての目録ファイル908を維持する。例えば、ウェブ・サーバ906のストリーム1は密度係数1で符号化され、ストリーム2は密度係数2で符号化され、という具合である。エンド・ユーザ装置912は、異なるビット・レートで使用可能な触覚データ・ストリーム及び符号化された触覚データ・ストリームのセグメントを認識するようになっている。開始時に、エンド・ユーザ装置912は、最低ビット・レートの触覚データ・ストリーム1からセグメントを要求する。エンド・ユーザ装置912が、ネットワークのダウンロード速度がダウンロードされたセグメントのビット・レートよりも大きいと判断した場合、図10に示されるように、エンド・ユーザ装置912は次のより高いビット・レートのセグメント、例えば、ストリーム2のセグメントすなわち中間密度ストリームとみなされるものを要求する。その後、エンド・ユーザ装置912が、あるセグメントのダウンロード速度がこのセグメントのビット・レートよりも低いと判断した場合、エンド・ユーザ装置912はネットワークのスループットが低下したと判断し、図10に示すように、より低いビット・レートのセグメントを要求する。使用可能な帯域幅が顕著に増加した場合、図10に示すように、エンド・ユーザ装置912はより高いビット・レートのセグメント、すなわち高密度ストリームとみなされるものを要求する、という具合である。セグメントのサイズは実施形態によって異なる。一実施形態においては、セグメントのサイズは2秒と小さい。一実施形態においては、セグメントのサイズは10秒と大きい。
一実施形態においては、触覚密度コード変換モジュール320は、ネットワーク伝送のために音声/動画をコード変換するアルゴリズムと同じアルゴリズムと一体化している(例えば、図3のマルチメディア・モジュール312)。生成される触覚ストリームの数は、生成される音声/動画ストリームの数と等しく、各触覚ストリームの密度係数は必ずしも各コード変換ごとに異なるものでなくてもよい。例えば、一実施形態において、10個の異なる音声/動画ストリームが生成された場合、未加工の触覚データは5つの異なる密度係数で5回コード変換される。
上述の触覚データの適応ビットレート・コード変換は、メディア・データをストリーミングする際に各種のネットワーク接続性に対応するために異なる品質で音声/動画を事前再現するために用いられる適応ビットレート・ストリーミングとは異なる。後者は通常、入力音声データ又は動画データのすべてに圧縮アルゴリズムを適用することにより送信するビット数を減らすことに主眼が置かれている。触覚データ・ストリームについては、本発明の実施形態に従う適応ビットレート・コード変換では、より少ない信号を送信しながらも、触覚信号の重要でない(すなわち、重要度の低い)特定の部分を放棄して触覚信号の優先度の高い部分に集中することにより、相対的な触覚効果を提供する。これは触覚波形の特性を利用して実際の触覚品質を維持しつつ、送信ビット数を減らすことによって必要な帯域幅を少なくすることになる。本発明の他の潜在的なメリットは、元の触覚信号と同じ形式が、異なる密度を有する符号化された触覚データにおいても維持されることである。従来のコード変換において、ソースの形式は維持されず、異なる形式に再符号化されてデータを圧縮しネットワーク伝送される。
埋め込まれた触覚を有するMP4
本発明の実施形態はまた、触覚ビット・ストリームをMP4互換ファイル・コンテナに埋め込み、触覚データが他のデジタル・コンテンツとともに当該他のデジタル・コンテンツの伝送に影響を与えることなくストリーミングされるようにする方法を提供する。同様の方法が他の同様のファイル・コンテナに適用される。
MP4はネットワーク経由でデジタル・コンテンツをストリーミングするためのコンテナ形式として以下で説明されるが、MP4は現在、対応する形式、並びに標準的な音声及び動画ストリームにインターリーブされた各種のデータを埋め込むための可変性の観点で、最高の柔軟性を持つと考えられているため、本発明の実施形態は他のコンテナ形式にも適用できることを理解されたい。各種のデータは付加的な音声ストリームや閉鎖的な字幕ストリームなどを含んでいるが、本発明の実施形態は、MP4コンテナ内に存在する音声及び/又は動画ストリームに触覚ストリームをインターリーブすることについて説明する。エンド・ユーザ装置の側では、埋め込まれた触覚信号は抽出され、標準的な音声及び動画の再生と同時に、触覚出力装置によって再生される。ここで提案される方式は音声及び動画以外のデジタル・コンテンツにも適用できることを理解されたい。
音声信号と触覚信号には多くの類似点がある。上記の図7についての説明の中で各種の触覚エンコーダを用いる際に、触覚信号は音声信号と同様に符号化される。現在の形式では、これは触覚信号がMP4に対応することを可能にしているが、触覚及び音声のボックス構造の間に十分な区別がされており、標準のMP4プレイヤによって触覚信号が音声信号と解釈されないようにすることも必要になる。逆に、既存の音声信号が触覚信号であると誤って判断されてはならない。
触覚信号は利便性のためにAACとして符号化されてもよい。この符号化処理は、上述の符号化された触覚信号(データ・ストリーム)を提供する各種の方法により変更が可能であるが、ボックス構造は類似のままでよい。触覚信号は標準の「moov」ボックス内で、音声及び動画用に存在する「trak」ボックスの他に、別途「trak」ボックスが必要になる。以下の表1は触覚ボックス構造を示す。MPEG4パート12標準(ISO/IEC14496−12 メディア・ファイル形式)(以下、「形式標準」とする)は、表1においてMP4のボックス階層に関する一般的な情報を提供する。
触覚データは音声又は動画として再現してはならない。ほとんどのプレイヤはそれぞれの「trak」ボックスで特定される動画ストリームの任意の組合せ又は数、又は音声ストリームの任意の組合せを再現しようとするため、触覚データは時限メタデータ・トラック(「meta」)として表す必要がある。これはhandler_typeフィールドに「hdr」ボックス内の「meta」を設定することによって行われる。
形式標準内の第8.4.3節で特定される時限メタデータ・トラックは時間ベースのメディア・コンテンツを保存するためのものである。この種のトラックに触覚信号を保存することで、ストリームが音声又は動画形式でないメディアとして見なされる。この場合、触覚データ用の時限メタデータ・ストリームは、元の符号化処理が音声形式であるにもかかわらず、再生中に触覚データが音声として再現されないようになっていなければならない。
図11−13は音声1100、動画1200、及び触覚1300用のハンドラ参照ボックスを示しており、音声、動画、及び触覚ハンドラ・タイプがMP4ファイル内に埋め込まれた場合、それぞれどのように異なるかを表している。「trak」1102、1202、1302の各々のhandler_typeは、図11−13に示すように、「hdr」ボックス1104、1204、1304内で特定される。形式標準の第8.4.3節で特定されているように、音声、動画、及び時限メタデータ・トラック用のハンドラ・タイプはそれぞれ、「soun」(図11の1106)、「vide」(図12の1206)、及び「meta」(図13の1306)である。
さらに、形式標準の第8.4.5.5節で特定されているように、触覚ストリームは時
限メタデータ・トラックとして標示されているので、ヌル・メディア・ヘッダ・ボックス(「nmhd」参照)(図14の1408)は「minf」コンテナ・ボックス(図14の1406)の下にある。これはストリームが音声(「smhd」 音声メディア・ヘッダ)(図14の1402)又は動画(「vmhd」 動画メディア・ヘッダ)(図14の1404)ではないことを示しているが、やはりメディア・ストリームであると解釈できる。図14は音声、動画、触覚の各々の全体ボックス構造を示すことで、これをより詳細に示している。
ボックス構造のさらに内部には、「stbl」(サンプル・テーブル・ボックス)の下に「stsd」ボックスがあり、これは上記表1にあるように、サンプル説明ボックスである。このボックス内では、「trak」の形式が特定される。例えば、「stsd」内の最初の子ボックスは、通常AAC音声トラック用の「mp4a」である。触覚に関して、4文字のコード(「FOURCC」)値「hapt」を有する新しい汎用ボックスが生成される。これは、この時限メタデータ・トラックが触覚信号を説明する情報を含んでいることを示している。形式標準の第8.5.2.2節によれば、「meta」ハンドラ・タイプにはメタデータ・サンプル・エントリ(「MetaDataSampleEnttry」)クラスが実装される必要があるが、新しいサブクラスによって拡張される中身のないクラスとして定義されている。一実施形態において、この中身のないクラスは付加的な情報では拡張されない。表1及び以下の記載にあるように、触覚特有のあらゆる情報は「esds」ボックス内に保存される。
トラック継続時間及び時間尺度などのタイミング情報はすべて「mdhd」ボックス内にあり、触覚トラック全体の継続時間及び時間尺度を記述している。MPEG4パート1標準(ISO/IEC14496−1 システム)(以下、「システム標準」とする)によれば、時間尺度は1秒間で経過する時間単位の数が格納される32ビットの符号なし整数である。例えば、触覚トラックが1秒間に50サンプルの更新レートを有している場合、この時間尺度は50に設定される。継続時間フィールドは、時間尺度のスケールでこの触覚トラックの長さを示す64ビットの符号なし整数である。例えば、時間尺度が50に設定されると、各サンプルの長さは20msになる。触覚トラックの長さが5秒であれば、継続時間フィールドの値は250(5*1000/20)になる。
上記の表1に記載したように、「hapt」コンテナ・ボックスの下にある唯一の子ボックスは「esds」ボックス(Elementary Stream Description)であり、ES_Descriptorとも呼ばれる。音声に適用されると、このボックスにはそれが入っている「trak」に関連付けられたストリームを復号するために用いられる情報が格納される。このボックスは触覚と同様に用いられる。「esds」ボックスに関する構文の詳細は、システム標準の第8.3.3.1節に記載されている。
図15はMP4ファイル中の触覚データについてのオブジェクト・プロファイル表示(「objectProfileIndication」)値の有効な設定の一実施形態を示す。システム標準の第8.3.3節によれば、ES_Descriptorボックスにはデコーダ構成記述子(「DecoderConfigDescritor」)構造体が格納されており、これにはエレメンタリ・ストリームを解析及び読解するためのパラメータ及び要求事項が格納されている。DecoderConfigDescriptor内には、objectProfileIndication値及びデコーダ特有情報(「DecoderSpecificInfo」)構造体のためのフィールドがある。
objectProfileIndication値はストリームに対するオブジェクト・プロファイル・タイプを提供する。このフィールドは0xC0とOxFEの間の値に
設定され、これはユーザ・プライベートのオブジェクト・プロファイル・タイプの範囲であり、「hapt」ボックス構造内で使用される場合は、触覚タイプとして知られる(システム標準の表8−5を参照)。
DecoderSpecificInfo構造体は、objectProfileIndication値に基づいて他のクラスによって拡張された抽象クラスである(システム標準の表8−5参照)。1つの触覚実施形態について、この構造体は触覚特有構成(「HapticSpecificConfig」)クラスによって拡張され、このクラスは符号タイプや、符号化された信号が生成された対象であるアクチュエータなどの触覚特有情報を含む。
明確にするために、図15に見られるとおり、オブジェクト・プロファイル・タイプとして0xC0とOxFEの間の値を用いて「hapt」ボックスが格納される「trak」ボックス構造のみを触覚ストリームと見なす。図16に見られるとおり、オブジェクト・プロファイル・タイプが他の任意の値であれば、それは無効と見なされる。ここで、objectProfileIndication値はAACメイン・プロファイルに設定されている。
MPEG4システムは一般に、エレメンタリ記述子内に構成情報を期待するが、この情報は復号処理に必要である。システム標準の第8.3.3節に記載されるように、DecoderConfigDescriptorはDecoderSpecificInfo抽象クラスのサブクラスでなければならない。音声ストリームについては、DecoderSpecificInfoは音声特有構成(「AudioSpecificConfig」)クラスによって拡張される。これは、MPEG4パート3標準(ISO/IEC14496−3 音声)(以下、「音声標準」とする)の第1.6.2.1節に記載されている。触覚ストリームについて、DecoderSpecificInfoはHapticSpecificConfigクラスによって、本明細書に記載するとおり拡張される。
システム標準に定義されるように、HapticSpecificConfigは抽象クラスであるDecoderSpecificInfoを拡張するが、このときobjectTypeIndicationの値とstreamTypeの値が0xC0とOx20であり、これらの値はこのストリームが触覚情報を含んでいることを示している。以下の表2から表8は、HapticSpecificConfigの構文、触覚ストリーム・タイプ、サンプリング周波数、アクチュエータ構成、チャネル構成、エンド・ポイント構成、及び触覚デコーダ・タイプに用いることができる付加的な情報を提供する。




上記の記載は実際のストリームそのものよりもむしろ符号化された触覚ストリームを特定している。通常は、音声、動画、又は時限メタデータのタイプを有する各「trak」オブジェクトに関連付けられたストリームが存在する。これらのストリームは「mdat」ボックス内でインターリーブされるが、このボックスはMP4のボックス構造内の「moov」と同じレベルにある。「mdat」ボックスにはプレイヤがエンド・プラットフォームで解析、復号、及び再現を行う実際のデータが格納される。各ストリームのセグメント・サイズを決定し、動画、音声、及びメタデータ(触覚)のサンプルの符号化されたセグメントのすべてをインターリーブするのは、フォーマッティング・ソフトウェアの役割である。この場合、サンプル表のセグメントに対する相殺を参照することにより、インターリーブされたデータ・ボックスから触覚信号が抽出される。これは音声信号及び動画信号が抽出される場合と同様である。
様々な入力、出力、設定、および/または本明細書で記憶され(stored)又は記憶可能(storable)として説明される前記以外の情報は、一又は複数のデータベースに記憶することができる。かかるデータベースは、例えば、オラクルコーポレーションによって市販されているオラクル(商標)リレーショナル・データベースであり、当該リレーショナル・データベースを含み、または当該リレーショナル・データベースと接続することができる。これ以外のデータベース、たとえば、Informix(商標)、D
B2(Database 2)、又はこれら以外のデータストレージを使用し、組み込み、又はこれらにアクセスすることができる。このデータストレージには、ファイルベースのもの、クエリフォーマット、またはOLAP(On Line Analytical
Processing)、SQL(On Line Analytical Processing)、SAN(Storage Area Network)、Microsoft Access(商標)又は前記以外のリソースが含まれる。このデータベースは、一又は複数の物理的な装置および一又は複数の物理的な場所に配置されるようなデータベースを含む。このデータベースは、複数の種類のデータおよび/もしくはファイル、並びに/または、関連するデータ記述もしくはファイル記述、管理情報、または前記以外の任意の情報を記憶することができる。
本発明の一態様によれば、ユーザのデジタル・コンテンツ体験を触覚データによってより豊かにするための、コンピュータにより実装される方法が提供される。この方法は、コンピュータ・プログラム・モジュールを書き込まれたプロセッサを有する計算装置上で実装される。この方法は、音声データ及び/又は動画データを含むデジタル・コンテンツ・データを受信する工程と、受信したデジタル・コンテンツ・データの少なくとも一部を用いて触覚データを生成する工程と、通信ネットワーク経由で効率的に伝送するために生成された触覚データを符号化する工程と、符号化した触覚データを受信したデジタル・コンテンツ・データと多重化する工程と、多重化したデータ・ストリームのメタ・データ内に、符号化した触覚データを復号するための情報を埋め込む工程と、多重化したデータを通信ネットワーク経由で送信する工程と、を含む。
本発明の一態様によれば、提供されるコンピュータ実装型の方法は、触覚データを他のデジタル・コンテンツ・データとともにネットワーク経由でエンド・ユーザに向けて伝送し、このエンド・ユーザがエンド・ユーザ装置上で生成された触覚効果を体験する。このエンド・ユーザ装置はネットワークに接続されている。この方法は、コンピュータ・プログラム・モジュールを書き込まれたプロセッサを有する計算装置上で実装される。この方法は、触覚データを分析して触覚データの少なくとも1つの特性を決定する工程と、決定された特性に基づいて、所定の基準を満たすように触覚データを符号化する工程とを含む。
本発明の一態様によれば、ユーザのデジタル・コンテンツ体験を触覚データによってより豊かにするための、コンピュータにより実装される方法が提供される。この方法は、コンピュータ・プログラム・モジュールを書き込まれたプロセッサを有する計算装置上で実装される。この方法は、未加工の触覚データを受信する工程と、密度係数の所定のリストに対応して受信した未加工の触覚データを符号化して、各々が密度係数の所定のリストの1つの密度係数に対応する符号化された触覚データ・ストリームのリストを生成する工程と、エンド・ユーザ装置から通信ネットワーク経由でネットワーク帯域幅情報を受信する工程と、通信ネットワーク帯域幅の条件に合致する対応する密度係数に基づいて、符号化された触覚データ・ストリームの1つを選択する工程と、選択された符号化された触覚データ・ストリームをエンド・ユーザ装置に送信する工程と、を含む。
本発明の他の態様、使用、および有利な効果は、明細書を考慮し、本明細書に記載された発明の実施を通じて、当業者に明らかなものとなる。本明細書は例示的なものに過ぎず、本発明の趣旨は以下の特許請求の範囲に基づいてのみ限定されることが意図されている。

Claims (16)

  1. 音声データ及び動画データの少なくとも一方を含むデジタル・コンテンツ・データを受
    信する工程と、
    前記デジタル・コンテンツ・データの少なくとも一部を用いて触覚データを生成する工
    程と、
    通信ネットワーク経由の伝送のために前記触覚データを符号化して、符号化された複数
    の触覚データ・ストリームを生成する工程であって、当該複数の触覚データ・ストリーム
    の各々は対応する密度係数を有し、当該対応する密度係数にしたがって異なるビットレー
    トで符号化される、工程と、
    前記複数の触覚データ・ストリームのうちの1つを選択触覚データ・ストリームとして
    選択する工程と、
    前記選択触覚データ・ストリームをマルチプレクサによって前記デジタル・コンテンツ
    ・データと多重化して多重化データ・ストリームを生成する工程と、
    前記多重化データ・ストリームを前記通信ネットワーク経由で送信する工程と、
    を備える方法。
  2. 前記符号化された触覚データを復号するための情報を、前記多重化データ・ストリーム
    のファイルコンテナのメタデータ内に埋め込む工程をさらに備える、請求項1に記載の方
    法。
  3. 前記ファイルコンテナは、前記触覚データのボックス構造と前記デジタル・コンテンツ
    ・データのボックス構造とを区別するように構成されたMP4対応ファイルコンテナであ
    る、請求項2に記載の方法。
  4. エンド・ユーザ装置から通信ネットワーク経由でネットワーク帯域幅情報を受信する工
    程と、
    前記ネットワーク帯域幅情報と前記選択触覚データ・ストリームの前記対応する密度係
    数とにしたがって前記選択触覚データ・ストリームを決定する工程と、
    をさらに備える、請求項1に記載の方法。
  5. 前記ネットワーク帯域幅情報の変化を検出する工程と、
    新しい選択触覚データ・ストリームを、前記ネットワーク帯域幅情報の変化と、前記新
    しい選択触覚データ・ストリームの前記対応する密度係数とにしたがって決定する工程と

    をさらに備える、請求項4に記載の方法。
  6. エンド・ユーザ装置から通信ネットワーク経由で前記ネットワーク帯域幅情報の変化を
    受信する工程と、
    新しい選択触覚データ・ストリームを、前記ネットワーク帯域幅情報の変化と、前記新
    しい選択触覚データ・ストリームの前記対応する密度係数とにしたがって決定する工程と

    をさらに備える、請求項4に記載の方法。
  7. 前記対応する密度係数にしたがって前記複数の触覚データ・ストリームの各々を符号化
    する工程は、前記触覚データの一部を取り除く工程を含む、請求項1に記載の方法。
  8. 前記触覚データの一部を取り除く工程は、前記触覚データの重要度の低い信号を取り除
    く工程を含む、請求項7に記載の方法。
  9. 音声データ及び動画データの少なくとも一方を含むデジタル・コンテンツ・データを受
    信し、
    前記デジタル・コンテンツ・データの少なくとも一部を用いて触覚データを生成し、
    通信ネットワーク経由の伝送のために前記触覚データを符号化して、符号化された複数
    の触覚データ・ストリームを生成し、当該複数の触覚データ・ストリームの各々は対応す
    る密度係数を有し、当該対応する密度係数にしたがって異なるビットレートで符号化され

    前記複数の触覚データ・ストリームのうちの1つを選択触覚データ・ストリームとして
    選択し、
    前記選択触覚データ・ストリームをマルチプレクサによって前記デジタル・コンテンツ
    ・データと多重化して多重化データ・ストリームを生成し、
    前記多重化データ・ストリームを前記通信ネットワーク経由で送信するように構成され
    たプロセッサを備える、
    システム。
  10. 前記プロセッサはさらに、
    前記符号化された触覚データを復号するための情報を、前記多重化データ・ストリーム
    のファイルコンテナのメタデータ内に埋め込むように構成された、請求項9に記載のシス
    テム。
  11. 前記ファイルコンテナは、前記触覚データのボックス構造と前記デジタル・コンテンツ
    ・データのボックス構造とを区別するように構成されたMP4対応ファイルコンテナであ
    る、請求項10に記載のシステム。
  12. 前記プロセッサはさらに、
    エンド・ユーザ装置から通信ネットワーク経由でネットワーク帯域幅情報を受信し、
    前記ネットワーク帯域幅情報と前記選択触覚データ・ストリームの前記対応する密度係
    数とにしたがって前記選択触覚データ・ストリームを決定するように構成された、
    請求項9に記載のシステム。
  13. 前記プロセッサはさらに、
    前記ネットワーク帯域幅情報の変化を検出し、
    新しい選択触覚データ・ストリームを、前記ネットワーク帯域幅情報の変化と、前記新
    しい選択触覚データ・ストリームの前記対応する密度係数とにしたがって決定するように
    構成された、
    請求項12に記載のシステム。
  14. 前記プロセッサはさらに、
    エンド・ユーザ装置から通信ネットワーク経由で前記ネットワーク帯域幅情報の変化を
    受信し、
    新しい選択触覚データ・ストリームを、前記ネットワーク帯域幅情報の変化と、前記新
    しい選択触覚データ・ストリームの前記対応する密度係数とにしたがって決定するように
    構成された、
    請求項12に記載のシステム。
  15. 前記プロセッサは、前記対応する密度係数にしたがって前記複数の触覚データ・ストリ
    ームの各々を符号化する際に、前記触覚データの一部を取り除くように構成された、請求
    項9に記載のシステム。
  16. 前記プロセッサは、前記触覚データの一部を取り除く際に、前記触覚データの重要度の
    低い信号を取り除くように構成された、請求項15に記載のシステム。
JP2018181077A 2013-05-24 2018-09-26 触覚データを符号化及びストリーミングする方法及びシステム Active JP6630798B2 (ja)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US201361827341P 2013-05-24 2013-05-24
US61/827,341 2013-05-24
US201361874920P 2013-09-06 2013-09-06
US61/874,920 2013-09-06
US201361907318P 2013-11-21 2013-11-21
US61/907,318 2013-11-21

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2014106684A Division JP6411069B2 (ja) 2013-05-24 2014-05-23 触覚データを符号化及びストリーミングする方法及びシステム

Publications (3)

Publication Number Publication Date
JP2019024228A JP2019024228A (ja) 2019-02-14
JP2019024228A5 JP2019024228A5 (ja) 2019-07-25
JP6630798B2 true JP6630798B2 (ja) 2020-01-15

Family

ID=50943052

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2014106684A Active JP6411069B2 (ja) 2013-05-24 2014-05-23 触覚データを符号化及びストリーミングする方法及びシステム
JP2018181077A Active JP6630798B2 (ja) 2013-05-24 2018-09-26 触覚データを符号化及びストリーミングする方法及びシステム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2014106684A Active JP6411069B2 (ja) 2013-05-24 2014-05-23 触覚データを符号化及びストリーミングする方法及びシステム

Country Status (5)

Country Link
US (3) US9437087B2 (ja)
EP (2) EP3399763A1 (ja)
JP (2) JP6411069B2 (ja)
KR (1) KR102176391B1 (ja)
CN (2) CN109876431A (ja)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3399763A1 (en) * 2013-05-24 2018-11-07 Immersion Corporation Method and system for haptic data encoding
US9619980B2 (en) 2013-09-06 2017-04-11 Immersion Corporation Systems and methods for generating haptic effects associated with audio signals
US9652945B2 (en) * 2013-09-06 2017-05-16 Immersion Corporation Method and system for providing haptic effects based on information complementary to multimedia content
US9576445B2 (en) 2013-09-06 2017-02-21 Immersion Corp. Systems and methods for generating haptic effects associated with an envelope in audio signals
US9711014B2 (en) 2013-09-06 2017-07-18 Immersion Corporation Systems and methods for generating haptic effects associated with transitions in audio signals
US9349378B2 (en) * 2013-11-19 2016-05-24 Dolby Laboratories Licensing Corporation Haptic signal synthesis and transport in a bit stream
JP2017531930A (ja) * 2014-07-07 2017-10-26 イマージョン コーポレーションImmersion Corporation セカンドスクリーン触覚
US10268286B2 (en) * 2014-12-23 2019-04-23 Immersion Corporation Controlling power distribution to haptic output devices
KR101790892B1 (ko) * 2016-05-17 2017-10-26 주식회사 씨케이머티리얼즈랩 음향 신호를 촉각 신호로 변환하기 방법 및 이를 이용하는 햅틱 장치
EP3267288A1 (en) * 2016-07-08 2018-01-10 Thomson Licensing Method, apparatus and system for rendering haptic effects
JP2018060313A (ja) * 2016-10-04 2018-04-12 ソニー株式会社 受信装置および方法、送信装置および方法、並びにプログラム
CN106454365B (zh) * 2016-11-22 2018-07-10 包磊 多媒体数据的编码、解码方法及编码、解码装置
US11290755B2 (en) * 2017-01-10 2022-03-29 Qualcomm Incorporated Signaling data for prefetching support for streaming media data
US10075251B2 (en) 2017-02-08 2018-09-11 Immersion Corporation Haptic broadcast with select haptic metadata based on haptic playback capability
CN106803982A (zh) * 2017-03-01 2017-06-06 深圳市集贤科技有限公司 一种带按摩功能的vr遥控器
US20190041987A1 (en) * 2017-08-03 2019-02-07 Immersion Corporation Haptic effect encoding and rendering system
CN107566847B (zh) * 2017-09-18 2020-02-14 浙江大学 一种将触感数据编码为视频流进行保存和传输的方法
JP7272360B2 (ja) 2018-06-28 2023-05-12 ソニーグループ株式会社 符号化装置、符号化方法、復号装置、復号方法、プログラム
WO2020008716A1 (ja) 2018-07-03 2020-01-09 ソニー株式会社 符号化装置、符号化方法、復号装置、復号方法、伝送システム、受信装置、プログラム
WO2020121662A1 (ja) * 2018-12-13 2020-06-18 ソニー株式会社 情報処理装置、情報処理システム、情報処理方法、及びプログラム
US11947723B2 (en) * 2019-02-01 2024-04-02 Sony Group Corporation Decoding device, decoding method, and program
US10921893B2 (en) * 2019-02-04 2021-02-16 Subpac, Inc. Personalized tactile output
US20220113801A1 (en) * 2019-04-26 2022-04-14 Hewlett-Packard Development Company, L.P. Spatial audio and haptics
US10951951B2 (en) * 2019-07-30 2021-03-16 Sony Interactive Entertainment Inc. Haptics metadata in a spectating stream
WO2021035189A1 (en) * 2019-08-21 2021-02-25 Subpac, Inc. Tactile audio enhancement
WO2021044901A1 (ja) * 2019-09-03 2021-03-11 ソニー株式会社 制御装置、スピーカ装置および音声出力方法
US10984638B1 (en) * 2019-10-17 2021-04-20 Immersion Corporation Systems, devices, and methods for encoding haptic tracks
US11282281B2 (en) * 2019-11-13 2022-03-22 At&T Intellectual Property I, L.P. Activation of extended reality actuators based on content analysis
JPWO2021176904A1 (ja) * 2020-03-05 2021-09-10
CN115516770A (zh) * 2020-04-29 2022-12-23 索尼集团公司 解码装置、解码方法、程序、编码装置以及编码方法
JP2022097227A (ja) * 2020-12-18 2022-06-30 株式会社Jvcケンウッド 情報提供装置、情報提供方法、およびプログラム
CN114115538A (zh) * 2021-11-23 2022-03-01 瑞声开泰声学科技(上海)有限公司 一种触觉反馈数据处理方法、装置及计算机可读存储介质
GB2615361B (en) * 2022-02-08 2024-05-29 Sony Interactive Entertainment Europe Ltd Method for generating feedback in a multimedia entertainment system
WO2023176928A1 (ja) * 2022-03-18 2023-09-21 ソニーグループ株式会社 情報処理装置および方法
US20240129047A1 (en) * 2022-10-17 2024-04-18 Tencent America LLC Method for creating sparse isobmff haptics tracks
US20240129579A1 (en) * 2022-10-17 2024-04-18 Tencent America LLC Isobmff haptic tracks with sample anchoring of haptic effects
US20240129578A1 (en) * 2022-10-17 2024-04-18 Tencent America LLC Method and apparatus for defining frames and timed referenced network abstraction layer (nals) structure in haptics signals
WO2024096812A1 (en) * 2022-10-31 2024-05-10 Razer (Asia-Pacific) Pte. Ltd. Method and system for generating haptic effects

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002025925A2 (en) * 2000-09-22 2002-03-28 Koninklijke Philips Electronics Nv Hybrid temporal-snr fine granular scalability video coding
US7016409B2 (en) * 2003-11-12 2006-03-21 Sony Corporation Apparatus and method for use in providing dynamic bit rate encoding
JP2006163579A (ja) * 2004-12-03 2006-06-22 Sony Corp 情報処理システム、情報処理装置及び情報処理方法
EP2002323A2 (en) * 2006-04-06 2008-12-17 Immersion Corporation Systems and methods for enhanced haptic effects
US8378964B2 (en) * 2006-04-13 2013-02-19 Immersion Corporation System and method for automatically producing haptic events from a digital audio signal
KR20090057268A (ko) * 2006-08-24 2009-06-04 코닌클리케 필립스 일렉트로닉스 엔.브이. 햅틱 여기를 발생하기 위해 오디오 신호 및/또는 비디오 신호를 처리하기 위한 디바이스 및 방법
US20090079690A1 (en) * 2007-09-21 2009-03-26 Sony Computer Entertainment America Inc. Method and apparatus for enhancing entertainment software through haptic insertion
US9019087B2 (en) * 2007-10-16 2015-04-28 Immersion Corporation Synchronization of haptic effect data in a media stream
US7911328B2 (en) * 2007-11-21 2011-03-22 The Guitammer Company Capture and remote reproduction of haptic events in synchronous association with the video and audio capture and reproduction of those events
US20110149156A1 (en) * 2008-07-15 2011-06-23 Sharp Kabushiki Kaisha Data transmitting apparatus, data receiving apparatus, data transmitting method, data receiving method, and audio-visual environment controlling method
CA2742620C (en) * 2008-10-10 2014-04-22 Internet Services, Llc Haptic output device for use with haptic encoded media
US20110280398A1 (en) * 2010-05-17 2011-11-17 Anatoly Fradis Secured content distribution system
US8717152B2 (en) * 2011-02-11 2014-05-06 Immersion Corporation Sound to haptic effect conversion system using waveform
US9083821B2 (en) 2011-06-03 2015-07-14 Apple Inc. Converting audio to haptic feedback in an electronic device
CN102208188B (zh) * 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
WO2013008869A1 (ja) * 2011-07-14 2013-01-17 株式会社ニコン 電子機器及びデータ生成方法
EP2754282A1 (en) * 2011-09-06 2014-07-16 Telefonaktiebolaget LM Ericsson (PUBL) Device and method for progressive media download with multiple layers or streams
EP3399763A1 (en) * 2013-05-24 2018-11-07 Immersion Corporation Method and system for haptic data encoding
CN104980247B (zh) * 2014-04-04 2019-11-22 北京三星通信技术研究有限公司 自适应调整调制编码方式和参考信号图样的方法、基站、终端和系统

Also Published As

Publication number Publication date
JP2014239430A (ja) 2014-12-18
US20140347177A1 (en) 2014-11-27
CN104184721B (zh) 2019-03-12
US9437087B2 (en) 2016-09-06
KR20140138087A (ko) 2014-12-03
KR102176391B1 (ko) 2020-11-09
CN104184721A (zh) 2014-12-03
JP2019024228A (ja) 2019-02-14
US20190098368A1 (en) 2019-03-28
EP2806353A1 (en) 2014-11-26
EP2806353B1 (en) 2018-07-18
CN109876431A (zh) 2019-06-14
US20160345073A1 (en) 2016-11-24
JP6411069B2 (ja) 2018-10-24
US10542325B2 (en) 2020-01-21
EP3399763A1 (en) 2018-11-07
US10085069B2 (en) 2018-09-25

Similar Documents

Publication Publication Date Title
JP6630798B2 (ja) 触覚データを符号化及びストリーミングする方法及びシステム
JP6845223B2 (ja) コーディングされたオーディオデータのトランスポート
CN109479158B (zh) 检索及存取用于媒体流式处理的段区块
US9769230B2 (en) Media streaming apparatus
WO2016002738A1 (ja) 情報処理装置および情報処理方法
CN110870282B (zh) 使用网络内容的文件轨处理媒体数据
US10375439B2 (en) Information processing apparatus and information processing method
CN113748659B (zh) 接收会话的媒体数据的方法、装置和非易失性计算机可读介质
JP7238948B2 (ja) 情報処理装置および情報処理方法
CN113767639A (zh) 基于http的动态自适应流传输的方法和装置
CN115943631A (zh) 流式传输包括具有切换集的可寻址资源索引轨道的媒体数据
GB2599170A (en) Method, device, and computer program for optimizing indexing of portions of encapsulated media content data
CN115398924A (zh) 用于媒体流传输的方法和设备
CN112771876B (zh) 检索媒体数据的方法和设备以及发送媒体数据的方法和设备
JP7241874B2 (ja) カプセル化されたメディアコンテンツの利用可能な部分をシグナリングするための方法、装置、及びコンピュータプログラム
CN112188256B (zh) 信息处理方法、信息提供方法、装置、电子设备及存储介质
CN115244943A (zh) 确定数据组块的可用性以用于网络流式传输媒体数据
CN114208107A (zh) 用于基于会话的dash操作的模式寻址
CN113364728B (zh) 媒体内容接收方法、装置、存储介质和计算机设备
KR20230101907A (ko) 미디어 플레이백 동안 프리롤 및 미드롤 콘텐츠를 지원하기 위한 mpeg dash를 위한 방법 및 장치
JP2005159878A (ja) データ処理装置及びデータ処理方法、並びにプログラム、記憶媒体
KR20110085797A (ko) 컨텐츠 파일 생성/제공 장치 및 방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181002

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190621

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190626

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190709

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191004

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191209

R150 Certificate of patent or registration of utility model

Ref document number: 6630798

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250