JP5242826B1 - 情報処理装置及び情報処理方法 - Google Patents

情報処理装置及び情報処理方法 Download PDF

Info

Publication number
JP5242826B1
JP5242826B1 JP2012066374A JP2012066374A JP5242826B1 JP 5242826 B1 JP5242826 B1 JP 5242826B1 JP 2012066374 A JP2012066374 A JP 2012066374A JP 2012066374 A JP2012066374 A JP 2012066374A JP 5242826 B1 JP5242826 B1 JP 5242826B1
Authority
JP
Japan
Prior art keywords
search
unit
information
section
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012066374A
Other languages
English (en)
Other versions
JP2013195977A (ja
Inventor
剛 舘野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2012066374A priority Critical patent/JP5242826B1/ja
Priority to EP12188597.4A priority patent/EP2642408A1/en
Application granted granted Critical
Publication of JP5242826B1 publication Critical patent/JP5242826B1/ja
Publication of JP2013195977A publication Critical patent/JP2013195977A/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Abstract

【課題】 より処理負荷を小さくしながら曲名などの情報をユーザーに通知する装置や方法を提供する。
【解決手段】 音声信号を出力する出力手段と、外部からの操作に基づいてこの音声信号に関する曲名情報の検索を指示する指示手段と、この検索の指示のタイミング前後の区間で前記音声信号の切り出しを行う切り出し手段と、この切り出しの区間における無音関連部分の除去を行う除去手段と、この除去が行われた結果である音声信号区間の情報をサーバーに送信する送信手段と、このサーバーから前記音声信号区間に関する前記曲名情報の検索結果を受信する受信手段とを備える情報処理装置。
【選択図】 図3

Description

本発明の実施形態は、情報処理装置及び情報処理方法に関する。
情報処理装置の一つとして楽曲抽出を行うものがある(例えば、特許文献1参照。)。これは、放送情報の中からの楽曲の抽出精度を向上し得るようにするというものであるが、この先行技術はAudioデータをずっと解析しつづけて、曲の区間を検出するものであり、装置の処理負荷が大きいものである。
ユーザーが指定したタイミングで解析を行い、曲名などの情報をユーザーに通知するといった技術への要望があるが、かかる要望を実現するための手段は知られていない。
特開2007−219178号公報
本発明の実施の形態は、より処理負荷を小さくしながら曲名などの情報をユーザーに通知する装置や方法を提供することを目的とする。
上記課題を解決するために、実施形態によれば情報処理装置は、部からの操作に基づいて音声信号に関する曲名情報の検索を指示する指示手段と、前記検索の指示があったタイミングの前後で前記音声信号が無音となる無音区間を検出する無音区間検出手段と、前記無音区間検出手段により検出された無音区間に基づいて検索対象の区間を決定する検索対象区間決定手段と、前記検索対象区間決定手段により決定された検索対象の区間の情報をサーバーに送信する送信手段と、前記サーバーから前記検索対象の区間に関する前記曲名情報の検索結果を受信する受信手段とを備える。
この発明の一実施形態を示すシステム概要図。 同実施形態の音声処理装置の構成を示す図。 同実施形態の機能モジュール構成図。 同実施形態の曲名検索処理フロー図。 同実施形態に用いられる表示装置の表示画面の一例の説明図。 同実施形態のRing Buffer制御を示すフロー図。 同実施形態に用いられる曲名検索用Ring Bufferの説明図。 同実施形態に用いられるAudioデータ切り出しフロー及び無音検出時の対象区間再設定フロー図。
以下、本発明の一実施形態を図1乃至図8を参照して説明する。まず図1は、この発明の一実施形態を示すシステム概要図である。
図1(a)は、TV(次に詳述するデジタルテレビ録画再生装置10)を中心として、このリモコン1と外部サーバー3とから構成されるシステムを表している。リモコン1を用いてTVのユーザーが聴いている曲の曲名等について検索開始指示を出し、TV経由で曲の特徴量を外部サーバー3に送信し、外部サーバー3がこの特徴量に基づいて検索した結果である曲名等をTVが受信して表示する構成となっている。
図1(b)は、図1(a)の変形であり、リモコン1に代わってタブレットPC2が検索開始指示を出すことができる構成である。この場合は、サーバー3がこの特徴量に基づいて検索した結果である曲名等をTVが受信してタブレットPC2に転送し、タブレットPC2がこの曲名等を表示する構成となっている。
次に、図2を参照して、情報処理装置の実施形態である音声処理装置のシステム構成を説明する。この音声処理装置は、例えばデジタルテレビ録画再生装置10として実現されている。本デジタルテレビ録画再生装置10は、テレビ放送の番組内に存在する例えば数百ミリ秒の無音区間を検出することができる。
本デジタルテレビ録画再生装置10は、受信部101、TS分離部102、CAS制御部103、B−CASカード104、デスクランブラ部105、録画再生制御部106、映像記録部107、音声/画像分離部108、音声デコード部109、音声出力部110、リサンプリング部111、無音区間判定部112、特徴量検出部113、情報制御部114、特徴量登録部115、区間登録部116、ユーザー入力処理部120(リモコン1とのデータ信号の送受を行う)や図示せぬモニター等の表示部を備えている。
受信部101は、テレビ放送波受信アンテナ(非図示)と接続され、テレビ放送を受信する。アンテナで受信されたテレビ放送波の信号が受信部101に入力されると、受信部101は入力されたテレビ放送信号を復調し、TS分離部102へ出力する。
TS分離部102は、受信部101から入力された放送信号のTS(Transport Stream)を、符号化された音声データや画像データであるES(Elementary Stream)や、暗号化情報であるECM(Entitilement Control Message)等に分離する。そしてTS分離部102は、ESをデスクランブラ部105に、ECMをCAS制御部103に出力する。
CAS制御部103は、TS分離部102から出力された暗号化情報ECMを入力する。そしてCAS制御部103は、CASカード104に記憶されている放送事業者毎に設定されるワーク鍵(Kw)を用いてECMの暗号を復号し、ECM内のその番組に関する属性情報とB−CASカード104に記憶されている契約情報とを比較して、視聴可否の判定を行う。そしてCAS制御部103は、視聴可能である場合にスクランブル鍵(Ks)を復号してデスクランブラ部105に出力する。
デスクランブラ部105は、TS分離部102から入力された、音声データや画像データであるESのスクランブル処理を解除する。デスクランブラ部105は、CAS制御部103から入力した前記スクランブル鍵(Ks)を用いて音声データや画像データのスクランブル処理を解除し、スクランブル解除した音声データや画像データを録画再生制御部106に出力する。
録画再生制御部106は、録画処理および再生処理を制御する。録画処理において録画再生制御部106は、音声データや画像データをコンテンツごとの一つのTSに纏めて記録媒体部107に記録するとともに、音声/画像分離部108にコンテンツのTSを出力する。また録画処理において録画再生制御部106は、後述する区間登録部116から入力された区切り情報と動画コンテンツ等とを対応付けて記録部107に記録することができる。あるいは、該区切り情報に基づいて、動画コンテンツ等の特定時間区間をカットして記録することも可能である。
また、録画再生制御部106は、映像記録部107に記録されたコンテンツの再生処理を制御する。そのとき録画再生制御部106は、映像記録部107からコンテンツのTSをロードして、該TSを音声/画像分離部108に出力する。
音声/画像分離部108は、録画再生制御部から出力されたTSから、音声信号と画像信号を分離する。そして音声/画像分離部108は、分離した音声信号を音声デコード部109に、画像信号を画像デコード部(非図示)に出力する。
音声デコード部109は、音声/画像分離部108から出力された音声信号をデコードする。ここで音声信号は、例えばPCM等のフォーマットにデコードされる。そしてデコード部109は、録画処理においては、デコードした音声信号をリサンプリング部111に出力し、再生処理においては、デコードした音声信号を音声出力部110に出力する。
リサンプリング部111は、デコード部109から入力された音声信号のサンプリング周波数を変換する再サンプリング処理を行う。例えば、デジタル放送における音声信号のサンプリング周波数は48KHzであるが、リサンプリング部111はこの音声信号を更に低い周波数にて再サンプリングして、例えばサンプリング周波数が12KHzの音声信号に変換する。
ここで、再サンプリングの際には、リサンプリング部111は、再サンプリング前の音声サンプルから一定の周波数以上の音声成分を削る処理を行ったのち、再サンプリング処理を行う。このとき、再サンプリング処理の方法については、公知の技術を利用できる。そしてリサンプリング部111は、再サンプリングされた音声信号を無音区間判定部112および特徴量算出部113に出力する。
無音区間判定部112は、入力した音声信号の音声サンプルのうち、一定間隔の音声サンプルに対して音量レベルが所定の範囲内か否かを判別し、音量レベルが所定の範囲内であると一定回数連続して判別された区間を無音区間として検出する。そして無音区間判定部112は、無音区間を検出すると、特徴量算出部113および情報制御部114に無音区間検出を通知する。この情報制御部は、無音区間や特徴量の伝達、外部サーバー3、端末2とのLAN I/Fや無線を介した送受信データのやり取りの機能を含めたものとしてある。
特徴量算出部113は、無音区間判定部112から無音区間検出通知を受け取った後、音声信号の音声サンプルのうち、連続する所定数の音声サンプルに対して特徴量を算出する。ここで、特徴量算出部113は、無音区間判定部112から無音区間検出通知を受け取った所定時間後、例えば該通知の1秒後に特徴量を算出する。特徴量算出部113は、一般には外部サーバー3で楽曲情報検索を行えるような特徴量を、音声サンプルから抽出することができるアプリケーションプログラムである。
尚、特徴量算出部113は、音の区間における音楽信号サンプルの特徴量を算出することを目的としている。そして特徴量算出部113は、算出した特徴量のデータを情報制御部114に出力し特徴量登録部115に外部サーバー3との送信まで登録させる。これによりデータ通信部として機能する情報制御部114は、Ethernet(登録商標)規格の有線ネットワークで接続された外部のルーター、モデムを介し通信ネットワークを介して楽曲情報検索を行う外部サーバー3に、必要な特徴量を送ることができる。
情報制御部114は、無音区間判定部112から出力された無音区間検出通知に基づいて、音声信号中における対象区間を区間登録部116に登録させる。

さて本実施形態は、例えばTV番組やCM中で流れている音楽の曲名を検索する機能をTV上に適用し、付加機能の提供を目的とする。TVで流れている音楽をユーザーが調べたいと思ったタイミングで検索指示を出すと、TV内で検索対象のAudioデータ(PCM)を切り出して検索の為に必要な特徴量生成を行う。この特徴量を外部サーバー3に送信し上記検索が完了すると結果がTVへ通知される。
通常のTV番組で流れている音楽を検索する場合、人のしゃべり声等の音楽以外の音が多く含まれており、所定の長さのAudioデータを指定しても検索結果が得られない場合が多い。さらに、検索対象データの取得を完了する前にターゲットの音楽部分が終了してしまうと、検索に必要なデータが不足してしまい、検索に失敗してしまう。
本実施形態では、検索対象データの不足による検索エラーを解決するためのオーディオデータ取得方法について述べる。
<モジュール構成および処理フロー>
TVで曲名検索処理を行う場合の例を表す機能モジュール構成を図3に、処理フローを図4に示す。
このモジュール構成は、Audioストリーム取得部31、Audio Decoder32、音声再生部33とPCM蓄積部34からなる音声再生部30と、リモコン1(赤外線または無線を用いる)またはユーザー端末2(ex. タブレットPC)(無線を用いる)である指示手段35を備えている。
更にまた、曲名検索指示部36、Audio切り出し処理部37、特徴量生成部38、結果取得部40、結果判定部41、TVまたはユーザー端末2の画面である結果表示部42(表示装置)を備えている。
このAudioストリーム取得部31は、主に受信部101から音声/画像分離部108までに対応している。またAudio Decoder32は、音声デコード部109に相当している。音声再生部33は音声出力部110に相当している。PCM蓄積部34はリサンプリング部111に相当している。
更にまた、曲名検索指示部36はユーザー入力処理部120に、Audio切り出し処理部37、特徴量生成部38は、無音区間判定部112、特徴量算出部113に相当している。結果取得部40、結果判定部41は、情報制御部114に相当している。
Audioストリーム取得部31では再生対象のAudioストリームを取得し、Audio Decoder32に送る。Audio Decoder32はAudioストリームをデコードし、PCMデータを出力する。出力PCMデータは音声再生部33とPCM蓄積部34に同じデータが渡される。音声再生部33に渡ったPCMデータはスピーカー出力後に破棄される。PCM蓄積部34に渡ったデータは、処理の軽減等で必要なら再サンプリングしPCM蓄積部34内の図示せぬRing Bufferに格納され、曲名検索処理実行時に参照される。
図4については次のような処理となる。
曲名検索の開始指示はユーザーによって指示手段35であるリモコン1またはユーザー端末2で行われる(ステップS41)。TV側では曲名検索指示部36にユーザーからの検索開始指示が送られる。リモコン1はこの指示のための専用ボタンを備えていてもよいし、TV画面に表示されるメニューを見ながら対話的にあるボタンを用いて指示できるように構成してもよい。
曲名検索開始指示が曲名検索指示部36に送られると曲名検索に必要な処理を行い、Audio切り出し部37でAudio切り出し処理が開始される(ステップS42)。なおこの必要な処理とは、例えば外部サーバー3に特徴量を送信する為のアプリケーションソフトの起動であり、関連して各種の初期化処理やライセンス認証処理が行われることが多い。そしてAudio切り出し処理部37では、曲名検索に必要な所定の長さのPCMデータをPCM蓄積部34から取得する。
所定の長さのPCMデータ取得が完了すると特徴量生成部38で曲名検索に必要な情報(外部サーバー3に曲名情報の検索を行わせるための特徴量、例えばPCMデータの周波数毎の大小判定情報)を生成する(ステップS43)。特徴量生成部38で必要な情報の生成が完了すると、外部サーバー3へ必要データ(必要な情報)を送信する(ステップS44)。
曲名検索は外部サーバー39で行われ(ステップS45)、検索が完了するとTV側へ検索結果が通知される。この検索結果は結果取得部40で受信され(ステップS46)、文字列等で表現された曲名情報(この曲名情報としては、曲名の他に、アーティスト名、作曲者名、作詞者名、アルバムタイトル、レーベルなどの付随情報を含むのが好適である)が結果判定部41へ渡される。曲名情報が得られなかった場合には、“no query”といった内容の文字列が得られるように構成されている。
曲名情報が取得できた場合は(ステップS47の再検索不要)結果判定部41でユーザー通知用の結果文字列を生成し、結果表示部42へ渡す。
曲名情報が得られなかった場合は必要に応じて(例えばユーザーによる設定があれば、ステップS47の再検索実施)結果判定部41から曲名検索指示部36に再検索要求を出す。
結果表示部42では検索要求を出したソースに応じてTVで表示するか、ユーザー端末2で表示を行なわせ(ステップS48)、処理を終了する(ステップS49)。
図5は、この表示の例である。図5に示すように、表示部31の表示画面の一部(図5の例では、表示画面の上部)に、曲名、アーティスト名、作曲者名等を表示する。

<Audioデータ切り出し方法>
Audioデータ切り出し時に無音状態が検出されているかどうかを判定することによって、一般例よりも適切な区間のAudioデータ切り出しを目的とした。
通常CMの切れ目に無音が挿入されているが、本実施形態ではCM以外の場面でも無音を音楽の切れ目と推定する。切り出した曲名検索区間に無音が挿入されている場合、ターゲットの音楽と異なるデータが挿入されていると見なし、この区間を除いたデータを検索対象とする。無音かどうかの判定は既存の技術を用いればよい。例えば、本願と同一発明者の出願である特開P2011−75935号やその引例に記載の技術を援用して構成することができる。
Ring Buffer 制御については、Ring Bufferを用いてTV視聴時のPCMデータを逐次蓄積していく。このRing BufferへのPCMデータ格納方法を図6に示す。図6ではRing Bufferの配列数を N とし、現在処理中のバッファを buf_No で表している。
TV上でAudioデータの再生が開始されると、本Ring BufferへのPCMデータ蓄積も開始される(ステップS61)。
Ring Bufferの初期値は buf_No = 0とする(ステップS62)。この場合、最大値は buf_No = N−1 となる。
バッファ1つ分のPCMデータを取得に完了すると次の処理へ移行する(ステップS63)。バッファ内のPCMデータを解析し、無音部分が含まれていないかどうかを規定(既存)の無音検出方法で検出する(ステップS64)。バッファ1つのサイズは例えば1秒分のPCMデータを収容できるもので、N=20などとしておけばよい。
ここで無音ありの場合(ステップS64のYes)、無音検出フラグを立て(ステップS65)、次のステップS66処理へ進む。無音なしの場合(ステップS64のNo)は無音検出フラグを立てずに、次のステップS66処理へ進む。
そして次のバッファへ処理を移すため、バッファ番号 buf_No を更新する(ステップS66)。
対象バッファがバッファ列の終端に達した場合(buf_No ≧ N の場合)、先頭バッファに戻す(ステップS67のYes)。そうでなく buf_No < N の場合は(ステップS67のNo)、次のバッファへ更新する。
Ring Buffer 内のデータ選択方法については、検索開始指示を受けるとRing Bufferを参照し、現在処理中の buf_No を基点として切り出し範囲(計Det 個)を決定する。図7は、この様子を模式的に表したものであり、以下図8でローを説明する。なお、P=0の場合はbuf_No=0である。
まず、既に蓄積済みのバッファの中から予め定めた個数のバッファをPre-Loadデータ分(P 個)として利用する(ステップS81)。次に残りの必要データについて、検索開始位置buf_Noを含めた(Det − P)個のバッファを追加取得対象とする(ステップS82)。
取得した(ステップS83)データ中に無音区間が含まれているかどうかを前記フラグで確認する。追加取得データ中に無音区間が検出された場合(ステップS84のYes)は、これはユーザーが検索指示を出した後の無音なので、ターゲットの音楽が終了してしまった状態と見なす。無音を含んだバッファを検索対象区間から外し、直前のバッファが終端となるように開始位置を決定する。ここでは開始位置決定のために選出されたバッファについては無音のチェックは行わない(音声区間があまりに短くなり検出に失敗することを防ぐため)。
無音が検出されたバッファの一つ前のバッファ buf_En を切り出し終了位置に再設定する(ステップS84a)。設定した終端バッファまでのバッファ数が Det になるように開始位置を(buf_En−Det+1)に再設定する(ステップS84b)。検索対象バッファは [ buf_En−Det+1,buf_En ] となり、切り出し処理を完了する。
追加取得したデータ中に無音区間が含まれていない場合(ステップS84のNo)、追加対象区間のPCMデータ取得が完了したか判定し完了してなければ(ステップS85のNo)ステップS83に戻る。
完了していれば(ステップS85のYes)、Pre-Read区間に無音区間が含まれているかどうかを確認する(ステップS86)。Pre-Readデータ中に無音区間が検出された場合(ステップS86のYes)、無音が検出されたバッファの一つ後ろバッファ buf_St を切り出し開始位置に再設定する(ステップS86a)。
次に設定した開始バッファからのバッファ数が Det になるように終了位置を(Det−buf_St−1)に再設定する(ステップS86b)。ここで追加読み込みされたバッファ内のデータについては無音検出状態に関係なく検出対象と定める(ステップS86c)。検索対象バッファは [ buf_St,Det−buf_St−1 ] となり、切り出し処理を完了する。
検索対象Audioデータの切り出しを完了する。

<実施形態の変形>
(1) Pre-Readデータ中に無音区間が検出されたケースについて
ステップS86a,bでは終了バッファ位置を拡張する対応を行っているが、拡張したバッファ内にも無音データが含まれている場合の対応として、Pre-Read区間の無音検出バッファの一つ前を検出区間の終了位置とした検索を実行する。
(2) Audioストリームのリアルタイム解析結果を利用する
他のモジュールの、例えば録画処理時に実施されるChapter設定向けの解析処理結果を利用し、無音検出時と同じように利用する(例えば、歓声,拍手などが検索対象区間に入らないようにしたり、音楽検出機能を利用して検索開始時に既再生時間分のPre-Readデータを利用して高速化を図る、など)。これらの機能は、例えば本願と同一出願人の出願である特開P2012−32447号に記載の技術を援用して構成することができる。

以上次のような実施形態の特徴により、ユーザーが検索指示を行う際のタイミングによる検出エラーを軽減できる。この結果の効果として、データ解析回数が少ないため、処理負荷が小さい装置、方法を実現できる。
(1)曲名検索を行うためのターゲットAudioデータの取得時に、無音区間を考慮する。
(2)ユーザーが検索指示を出した位置を中心に、開始位置と終了位置を決定する。
なお、この発明は上記実施形態に限定されるものではなく、この外その要旨を逸脱しない範囲で種々変形して実施することができる。例えば、音声信号のソースとしてはラジオ放送でもよい。また、放送以外の配信システムや、装置に装着または装置とネットワークで接続される形態の媒体などでもよい。
また、上記した実施の形態に開示されている複数の構成要素を適宜に組み合わせることにより、種々の発明を形成することができる。例えば、実施の形態に示される全構成要素から幾つかの構成要素を削除しても良いものである。さらに、異なる実施の形態に係わる構成要素を適宜組み合わせても良いものである。
10:デジタルテレビ録画再生装置
101:受信部
102:TS分離部
103:CAS制御部
104:B−CASカード
105:デスクランブラ部
106:録画再生制御部
107:映像記録部
108:音声/画像分離部
109:音声デコード部
110:音声出力部
111:リサンプリング部
112:無音区間判定部
113:特徴量算出部
114:情報制御部
115:特徴量登録部
116:区間登録部
120:ユーザー入力処理部

Claims (5)

  1. 部からの操作に基づいて音声信号に関する曲名情報の検索を指示する指示手段と、
    前記検索の指示があったタイミングの前後で前記音声信号が無音となる無音区間を検出する無音区間検出手段と、
    前記無音区間検出手段により検出された無音区間に基づいて検索対象の区間を決定する検索対象区間決定手段と、
    前記検索対象区間決定手段により決定された検索対象の区間の情報をサーバーに送信する送信手段と、
    前記サーバーから前記検索対象の区間に関する前記曲名情報の検索結果を受信する受信手段と
    を備える情報処理装置。
  2. 前記検索結果を出力する出力手段をさらに備える請求項1に記載の情報処理装置。
  3. 前記検索対象の区間の情報は、前記サーバーに前記曲名情報の検索を行わせる特徴量である請求項1に記載の情報処理装置。
  4. 前記出力手段は、前記検索結果を表示する結果表示部である請求項2に記載の情報処理装置。
  5. 部からの操作に基づいて音声信号に関する曲名情報の検索を指示する指示工程と、
    前記検索の指示があったタイミングの前後で前記音声信号が無音となる無音区間を検出する工程と、
    検出した前記無音区間に基づいて検索対象の区間を決定する工程と、
    決定した前記検索対象の区間の情報をサーバーに送信する送信工程と、
    前記サーバーから前記検索対象の区間に関する前記曲名情報の検索結果を受信する受信工程と
    を含む情報処理方法。
JP2012066374A 2012-03-22 2012-03-22 情報処理装置及び情報処理方法 Expired - Fee Related JP5242826B1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012066374A JP5242826B1 (ja) 2012-03-22 2012-03-22 情報処理装置及び情報処理方法
EP12188597.4A EP2642408A1 (en) 2012-03-22 2012-10-15 Information processing apparatus and information processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012066374A JP5242826B1 (ja) 2012-03-22 2012-03-22 情報処理装置及び情報処理方法

Publications (2)

Publication Number Publication Date
JP5242826B1 true JP5242826B1 (ja) 2013-07-24
JP2013195977A JP2013195977A (ja) 2013-09-30

Family

ID=47357891

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012066374A Expired - Fee Related JP5242826B1 (ja) 2012-03-22 2012-03-22 情報処理装置及び情報処理方法

Country Status (2)

Country Link
EP (1) EP2642408A1 (ja)
JP (1) JP5242826B1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109285563B (zh) * 2018-10-15 2022-05-06 华为技术有限公司 在线翻译过程中的语音数据处理方法及装置
CN110246500A (zh) * 2019-07-12 2019-09-17 携程旅游信息技术(上海)有限公司 基于录音文件的语音识别方法及系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6185527B1 (en) * 1999-01-19 2001-02-06 International Business Machines Corporation System and method for automatic audio content analysis for word spotting, indexing, classification and retrieval
KR20040024870A (ko) * 2001-07-20 2004-03-22 그레이스노트 아이엔씨 음성 기록의 자동 확인
US20050215239A1 (en) * 2004-03-26 2005-09-29 Nokia Corporation Feature extraction in a networked portable device
JP4405418B2 (ja) * 2005-03-30 2010-01-27 株式会社東芝 情報処理装置及びその方法
US8869186B2 (en) * 2005-07-29 2014-10-21 Dell Products L.P. Automated acquisition of discovered content
JP2011075935A (ja) 2009-09-30 2011-04-14 Toshiba Corp 音声処理装置、プログラム、音声処理方法および録画装置
JP4837123B1 (ja) 2010-07-28 2011-12-14 株式会社東芝 音質制御装置及び音質制御方法
JP5464103B2 (ja) * 2010-09-03 2014-04-09 ブラザー工業株式会社 カラオケシステム、携帯情報端末、プログラム

Also Published As

Publication number Publication date
JP2013195977A (ja) 2013-09-30
EP2642408A1 (en) 2013-09-25

Similar Documents

Publication Publication Date Title
US8307403B2 (en) Triggerless interactive television
JP5022025B2 (ja) コンテンツのデータ・ストリームとメタデータを同期するための方法および装置。
JP5135024B2 (ja) コンテンツのシーン出現を通知する装置、方法およびプログラム
JP4692775B2 (ja) 映像コンテンツ再生支援方法、映像コンテンツ再生支援システム、及び情報配信プログラム
JP2007528144A (ja) マルチメディア信号おいてトリガーマーカとして機能するフィンガープリントを生成及び検出する方法及び装置
JP2006301448A (ja) 記録再生装置、これらの装置の処理方法およびその方法をコンピュータに実行させるプログラム
JP5242826B1 (ja) 情報処理装置及び情報処理方法
JP2008252322A (ja) 要約提示装置及び要約提示方法
US20100070644A1 (en) Apparatus and method for time-shift service based on multimedia information, apparatus for reproducing multimedia using the same
JP2006020102A (ja) 放送記録再生装置および放送記録再生処理プログラム
US11551722B2 (en) Method and apparatus for interactive reassignment of character names in a video device
JP2002262225A (ja) コンテンツ仲介装置およびコンテンツ仲介処理方法
JP2006054517A (ja) 情報提示装置、方法及びプログラム
JP2008134825A (ja) 情報処理装置および情報処理方法、並びにプログラム
JP2014067292A (ja) 情報処理装置及び情報処理方法
JP2006190027A (ja) 情報処理装置
JP7302559B2 (ja) 端末装置、端末装置の動作方法、および、プログラム
JP2006050013A (ja) テレビ放送受信装置、記録再生装置
JP2005136582A (ja) 受信装置
JP2007013320A (ja) 映像記録装置、コンテンツ記録装置、コンテンツ検索制御方法、および、コンテンツ検索プログラム
CN117440120A (zh) 通过视频数据传输结构化音频的方法、装置及存储介质
JP2012028920A (ja) 映像表示機能付き記録再生装置
KR100700783B1 (ko) 오디오 파일 재생 방법 및 장치
EP1990996A1 (en) Information reproducing device, information reproducing method, information reproducing program and recording medium
JP5350037B2 (ja) 表示制御装置、その制御方法及びプログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130312

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160412

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160412

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees