JP2001282291A - 音声データ処理装置 - Google Patents

音声データ処理装置

Info

Publication number
JP2001282291A
JP2001282291A JP2000096252A JP2000096252A JP2001282291A JP 2001282291 A JP2001282291 A JP 2001282291A JP 2000096252 A JP2000096252 A JP 2000096252A JP 2000096252 A JP2000096252 A JP 2000096252A JP 2001282291 A JP2001282291 A JP 2001282291A
Authority
JP
Japan
Prior art keywords
data
audio data
block
text
block number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000096252A
Other languages
English (en)
Inventor
Yoshizo Sato
義三 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2000096252A priority Critical patent/JP2001282291A/ja
Publication of JP2001282291A publication Critical patent/JP2001282291A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

(57)【要約】 【構成】 携帯電話機のディスプレイに表示されている
テキストデータ(英文テキストや歌詞)の始点と終点を
カーソル16bおよび16cを用いて指定すると、指定
したテキストデータの範囲に対応する音声データ(英語
会話や音楽)が再生される。 【効果】 再生する音声データの範囲を容易かつ正確に
決定することができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声データ処理装置
に関し、特にたとえば、音声データの所定の範囲部分に
対してデータ処理を行う音声データ処理装置に関する。
【0002】
【従来の技術】従来の音声データ処理装置では、データ
処理を行うデータの範囲を決定するときには、音声デー
タを再生しながら、再生される音にたよって範囲の開始
位置を設定していた。また、設定した開始位置が正しい
かどうかは、設定した開始位置以降の音声データを実際
に再生して聞かなければ判断することができなかった。
【0003】
【発明が解決しようとする課題】再生される音声に頼っ
て、データ処理を行う音声データの範囲を決定するので
は、範囲を正確に決定するためには、範囲の設定を何度
も繰り返し行う必要があり、設定した範囲が正しいかど
うかは実際にその範囲の音声データを再生しなければ判
断できないので、範囲の設定作業が非常に煩雑であると
いう問題があった。
【0004】それゆえに、この発明の主たる目的は、記
憶手段から読み出して処理する音声データの範囲を容易
かつ正確に設定できる、音声データ処理装置を提供する
ことである。
【0005】
【課題を解決するための手段】この発明は、テキストデ
ータをブロック単位で記憶するテキスト記憶手段、テキ
ストデータに対応する音声データをフレーム単位で記憶
する音声記憶手段、ブロックのブロック番号と、ブロッ
クに含まれるテキストデータと対応する音楽データを含
むフレームのフレーム番号とが関連付けられたリンクテ
ーブルを記憶するリンクテーブル記憶手段、オペレータ
の操作に応答して、テキスト記憶手段に記憶された複数
のブロックのうち少なくとも1つのブロックのブロック
番号を選択する選択手段、リンクテーブルを参照して、
選択手段によって選択されたブロック番号をフレーム番
号に変換する変換手段、および変換手段によって変換さ
れたフレーム番号に従って、音声データを音声記憶手段
から読み出す第1読み出し手段を備えることを特徴とす
る、音声データ処理装置である。
【0006】
【作用】この発明においては、オペレータがテキストデ
ータを操作することによって、そのテキストデータに対
応する音声データを音声記憶手段から読み出すことがで
きる。音声データは、音声記憶手段にフレームごとに記
憶されており、この音声データに対応するテキストデー
タは、テキスト記憶手段にブロックごとに記憶されてい
る。また、リンクテーブル記憶手段には、テキストデー
タのブロック番号がテキストデータに対応する音声デー
タのフレーム番号に関連付けられたリンクテーブルが記
憶されている。オペレータの操作に応答して、選択手段
がテキスト記憶手段に記憶されているブロックのうち少
なくとも1つのブロックのブロック番号を選択すると、
変換手段は、リンクテーブルを参照して選択手段が選択
したブロック番号をフレーム番号に変換する。こうして
得られたフレーム番号に基づいて、第1読み出し手段
は、フレーム番号に相当するフレームを音声記憶手段か
ら読み出す。したがって、オペレータは、テキストデー
タの範囲をブロック単位で指定することによって、指定
した範囲のテキストデータに対応する音声データを音声
記憶手段から読み出すことができる。
【0007】さらに、第1読み出し手段によって読み出
された音声データを音声再生手段によって再生する。ま
た、音声再生手段は、オペレータの操作に応答して回数
設定手段が設定した回数だけ音声データを繰り返し再生
する。なお、音声データ処理装置にディスプレイを設
け、音声データを再生するときに、音声データに対応す
るテキストデータをディスプレイに表示するようにして
もよい。
【0008】この発明の或る実施例では、表示手段が、
オペレータの操作に応答してテキストデータをディスプ
レイに表示し、さらに特定手段は、オペレータがディス
プレイの表示を参照しながら行う操作に応答して、ディ
スプレイに表示されているテキストデータに対応するブ
ロックのうち少なくとも1つのブロックのブロック番号
を特定する。こうして特定されたブロック番号に対応す
るフレームの音声データが第1読み出し手段によって読
み出される。
【0009】この発明の他の実施例では、ブロック番号
記憶手段にテキストデータのブロック番号が記憶され、
第2選択手段はブロック番号記憶手段に記憶されている
ブロック番号のうち少なくとも1つのブロック番号を選
択する。こうして選択されたブロック番号に対応するフ
レームが第1読み出し手段によって読み出される。
【0010】また、この発明の別の局面では、音声デー
タ処理装置は、受信手段を備えており、この受信手段に
よって受信したテキストデータ、音声データ、リンクテ
ーブルおよびブロック番号を、テキスト記憶手段、音声
記憶手段、リンクテーブル記憶手段そしてブロック番号
記憶手段にそれぞれ記憶する。なお、テキスト記憶手
段,音声記憶手段、リンクテーブル記憶手段およびブロ
ック番号記憶手段は、同一の記憶手段によって構成され
るようにしてもよい。
【0011】なお、音声データは、ボーカルを含む音楽
データで、テキストデータは、音楽データの歌詞データ
であってもよい。この場合に、ブロック記憶手段には、
歌詞データのさびに相当するブロックのブロック番号を
記憶させるとよい。また、ボーカルが複数のパート存在
するのであれば、所定のパートに対応するブロックのブ
ロック番号をブロック記憶手段に記憶させてもよい。
【0012】また、音声データおよびテキストデータ
は、外国語会話データおよび外国語テキストデータであ
ってもよい。外国語テキストデータの代わりに、外国語
会話データに対応する母国語もしくはその他の言語のテ
キストデータであってもよいことはいうまでもない。こ
れらの場合に、ブロック記憶手段には、所定の発話者に
対応するブロックのブロック番号を記憶させるとよい。
もちろん、外国語会話データは、複数の発話者による実
際の会話形式でなくともよく、会話分を読み上げただけ
の音声データであってもよい。
【0013】この発明の好ましい実施例では、書き込み
手段は、第1読み出し手段によって読み出された音声デ
ータを音声記憶手段または別の記憶手段に書き込む。
【0014】また、第1読み出し手段によって読み出さ
れたこの音声データのフレームに対応するブロック(テ
キストデータ)を第2読み出し手段がテキスト記憶手段
から読み出し、このブロックを書き込み手段はテキスト
記憶手段または別の記憶手段に書き込む。
【0015】さらに、テーブル生成手段が、第2読み出
し手段によって読み出されたブロックのブロック番号と
第1読み出し手段によって読み出されたフレームのフレ
ーム番号とを関連付けたリンクテーブルを生成し、この
リンクテーブルも書き込み手段によってテーブル記憶手
段または別の記憶手段に書き込まれる。
【0016】したがって、第1読み出し手段によって読
み出された音声データを音声データ単独の新たな音声デ
ータとしたり、リンクテーブルによってテキストデータ
とリンクされた音声データにすることができる。また、
第1読み出し手段によって読み出された音声データと、
この音声データに対応するテキストデータおよびリンク
テーブルを、既存の音声データ,テキストデータおよび
リンクテーブルにそれぞれ追加・挿入することもでき
る。なお、第1読み出し手段による読み出し前の音声デ
ータ,テキストデータおよびリンクテーブルが記憶され
ていた音声記憶手段,テキスト記憶手段およびテーブル
記憶手段とは別の記憶手段に記憶するようにすれば、音
声データを好みに応じてアレンジした記憶手段を作成す
ることができる。
【0017】
【発明の効果】この発明によれば、音声記憶手段から読
み出す音声データの範囲を、音声データに対応するテキ
ストデータの範囲をブロック単位で選択することによっ
て極めて簡単かつ容易に設定できる。
【0018】この発明の上述の目的,その他の目的,特
徴および利点は、図面を参照して行う以下の実施例の詳
細な説明から一層明らかとなろう。
【0019】
【実施例】図1を参照して、この実施例では音声データ
処理装置として携帯電話機10が用いられ、この携帯電
話機10は、操作パネル26を含む。携帯電話機10の
オペレータが、操作パネル26を操作すると、オペレー
タの操作に応答した操作信号がCPU12に与えられ、
CPU12は、与えられた操作信号に応じて携帯電話機
10をコントロールする。携帯電話機10に音楽デー
タ,朗読データ,教材(英会話,ラジオ講座など)デー
タなどの音声データが含まれるコンテンツが送信される
と、CPU12は、操作パネル26からの操作信号に応
答して送受信回路24を制御する。CPU12による制
御によって送受信回路24は、アンテナ22を通してコ
ンテンツを受信する。送受信回路24によって受信され
たコンテンツは、さらにメモリインタフェース18に装
着されたメモリカード20に記憶される。
【0020】コンテンツに含まれる音声データを再生す
るときに、CPU12は、メモリインタフェース18を
通してメモリカード20から音声データを読み出して、
音声再生回路28に与える。音声再生回路28は、音声
データに所定の処理を施してスピーカ30に出力し、ス
ピーカ30から音声データが出力される。また、CPU
12は携帯電話機10の制御中に、ドライバ14を駆動
して、オペレータに操作を促すための視覚情報をディス
プレイ16に表示する。
【0021】コンテンツは音声データの他に、音声デー
タに対応したテキストデータおよび音声データとテキス
トデータとを結びつけるリンクテーブルを含んでいる。
携帯電話機10によって受信されたコンテンツに含まれ
るテキストデータ,音声データおよびリンクテーブル
は、メモリカード20のテキストデータ領域41、音声
データ領域42およびリンクテーブル領域43にそれぞ
れ記憶される。ここで、音声データがボーカル(vocal)
を含む音楽データであるとすると、音声データに対応し
たテキストデータは歌詞データである。以後、「歌詞デ
ータ」を単に「歌詞」とも呼ぶ。以下では、主に音楽デ
ータを例にとって説明する。
【0022】図2(A)に示すように、音声データは複
数のフレーム(frame)によって構成され、各ブロックに
は連続するブロック番号が割り当てられている。同様
に、テキストデータは、図2(B)に示すように、連続
するブロック番号が割り当てられた複数のブロックによ
って構成されている。また、1ブロックには複数のフレ
ームが対応しており、1ブロックは音楽データを記録す
るために用いられる符号化方式、たとえばMP3(MPEG-1 A
udio Laye3),TwiuVQ(Transform domain Weighedinterl
eave vector quantization),ACC(MPEG2/Advanced Audi
o Coding),AC3(Dolby Digital)などの符号化単位に対
応する。
【0023】ブロックとフレームとの対応関係は、ブロ
ック番号とフレーム番号を用いて図4に示すようなリン
クテーブルに設定されている。たとえば、図4を参照し
てブロック番号1であらわされるブロックの歌詞に対応
する音楽データは、フレーム1〜フレーム56である。
【0024】また、コンテンツは、さらに付加情報とし
てブロック番号情報を含んでおり、このブロック番号情
報はメモリカード20のブロック番号領域44に記憶さ
れるが、詳細については後述する。
【0025】この実施例の携帯電話機10では、ディス
プレイ16に表示されたテキストデータをオペレータが
操作することによって、音声データを間接的に操作する
ことができる。具体的には、ディスプレイ16に表示さ
れているテキストデータの範囲を指定することによっ
て、指定された範囲のテキストデータに対応する音声デ
ータを繰り返し再生することや、指定された範囲のテキ
ストデータに対応する音声データを抽出して別個の音声
データにすることができる。
【0026】携帯電話機10で、テキストデータの操作
によって音楽データを操作するときに、CPU12によ
って行われる処理の手順を図5から図7のフロー図を用
いて説明する。なお、図4に示すように、テキストデー
タはブロック番号1から127の128個のブロックを
有し、音声データはフレーム番号「1」から「645
1」の6452個のフレームを有することとする。
【0027】まず、ステップS1において、CPU12
は、オペレータにモード選択を促すために図8(A)の
モード選択メニューをディスプレイ16に表示する。オ
ペレータは、操作パネル26からカーソル16aを操作
し、実行するモードを選択する。CPU12は、ステッ
プS3において操作パネル26から操作信号が送られた
と判断すると、ステップS5、ステップS17、ステッ
プS31、ステップS39およびステップS45で実行
モードを判断する。CPU12は、ステップS5におい
て、「通常再生モード」が選択されたと判断すると、音
声データの全範囲の再生を行う。つまり、ステップS7
において、テキストデータの最初のブロック番号「1」
をスタートブロック番号としてメモリ32のワークエリ
アBs(以後単に、エリアBsと呼ぶ)に設定し、テキ
ストデータの最後のブロック番号「127」をメモリ3
2のエリアBeに設定する。つぎに、ステップS9にお
いて、CPU12はリンクテーブル(図4)を参照し
て、エリアBsおよびエリアBeに設定されているブロ
ック番号をフレーム番号に変換する。エリアBsに設定
されているブロック番号「1」は、スタートフレーム番
号「1」に変換され、フレーム番号「1」はエリアFs
に設定される。一方、エリアBeに設定されているブロ
ック番号「127」は、エンドフレーム番号「645
1」に変換されてエリアFeに設定される。
【0028】つぎに、ステップS13においてCPU1
2は、操作パネル26からオペレータの操作信号を受け
取って、再生回数を設定する。
【0029】そして、CPU12は、ステップS15に
おいて、エリアFsに設定されているスタートフレーム
番号「1」からエリアFeに設定されているエンドフレ
ーム番号「6451」のフレームまでの音声データを設
定された回数、メモリカード20から繰り返して読み出
し音声再生回路28に与える。音声再生回路28は、入
力された音声データを順次再生し、スピーカ30より出
力し処理が終了する。つまり、「通常再生モード」で
は、音声データの全体が設定された回数だけ再生され
る。なお、この実施例において音声データを再生すると
きには、図8(F)に示すように、音声データの再生と
同時に音声データに対応するテキストデータをディスプ
レイ16にスクロール表示するようにすることが好まし
い。
【0030】一方、オペレータによって「範囲を選択し
て再生モード」が選択されたとき、CPU12は、ステ
ップS17において「範囲を選択して再生モード」が選
択されたと判断し、ステップS19で図8(B)に示す
ようにテキストデータをディスプレイ16に表示する。
なお、このときの音声データは音楽データであり、テキ
ストデータは歌詞であるとする。ディスプレイ16上で
は、オペレータの上キー26aおよび下キー26bの操
作に応じてカーソル16bがフレーズの先頭部分を移動
し、カーソル16bの移動にともなって表示されるテキ
ストデータの部分も移動する。なお、ここではフレーズ
は、テキストデータに割り当てられたブロックに相当す
る。
【0031】カーソル16bが所定のフレーズを指し示
しているときに、オペレータが決定ボタン26cを操作
すると、当該フレームが再生範囲の開始位置に決定され
る。つまり、CPU12はステップS21において、当
該フレーズのブロック番号をエリアBsに設定する。開
始位置が決定すると、図8(C)に示すように当該フレ
ーズが反転表示されるとともにカーソル16cが当該フ
レームの末尾に現れる。
【0032】カーソル16bと同様に、オペレータが操
作する上キー26aおよび下キー26bの操作信号に応
じてカーソル16cがフレーズの末尾部分を移動し、そ
れにともなって表示されるテキストデータの部分が移動
する。
【0033】カーソル16cで再生範囲の終了位置とす
るフレーズを指し示し、決定ボタン26cを操作する
と、当該フレーズの末尾が再生範囲の終了位置に決定さ
れ、図8(D)に示すように再生範囲のフレーズが反転
表示される。このとき、CPU12はステップS23に
おいて、当該フレーズのブロック番号をエリアBeに設
定する。
【0034】ステップS25では、オペレータによる再
生範囲の開始位置のブロック番号と終了位置のブロック
番号を記録する指示があるかどうかを判断し、指示があ
ると判断するときはステップS27において、エリアB
sおよびエリアBeに設定されているブロック番号をメ
モリカード20のブロック番号領域44に記憶する。こ
のとき、オペレータからデータ名の入力を受けて、図1
0(C)に示すようなユーザデータファイルとして、デ
ータ名とともにスタートブロック番号とエンドブロック
番号とを記憶するとよい。
【0035】さらに、ステップS9に進み、上述したよ
うにCPU12は、リンクテーブルを用いて、エリアB
sおよびエリアBeに設定されているブロック番号から
再生範囲のスタートフレーム番号およびエンドフレーム
番号を決定し、それぞれエリアFs,エリアFcに設定
する。以降は、「通常再生モード」における再生と同様
である。このようにして、テキストで指定した再生範囲
に応じた音楽データを繰り返し再生することができる。
また、必要に応じて再生範囲を指定したテキストのスタ
ートブロック番号およびエンドブロック番号をメモリ3
2に記憶することができる。メモリ32に記憶したスタ
ートブロック番号およびエンドブロック番号の利用方法
については後述する。
【0036】ところで、携帯電話機10で再生する音声
データは、音楽データに限らず英語会話データであって
もよい。このとき、テキストデータは、図9(A)に示
すように、英語会話に対応した英文テキストである。音
声データが英語会話データであるときにも、図9(A)
から(C)に示すような音楽データの場合と同様のテキ
スト操作によって、テキストで指定した範囲の英語会話
データを再生することができる。
【0037】オペレータが、図8(A)のモード選択メ
ニューに従って、「パート再生」を選択した場合、CP
U12は、ステップS31において「パート再生」であ
ると判断する。「パート再生」では、コンテンツに予め
含まれている付加情報としてパート再生情報が添付され
ている場合、パート再生情報内のブロック番号情報にも
とづいて、再生する音声データの範囲を決定する。パー
ト再生情報は、図10(A)(B)に示す構成のデータ
となっている。図10(A)のパート再生情報は、音楽
データに添付されたさび部分の再生のための情報を示し
たパート再生情報,データ名とともにスタートブロック
番号とエンドブロック番号とが記憶されている。つま
り、音楽データの「さび」に対応するテキストデータ
は、「さび1」のブロック番号24から33までのブロ
ックと、「さび2」のブロック番号76から83までの
ブロックである。図10(A)に示すようなパート再生
情報がブロック番号領域44に記憶されている。
【0038】ステップS31において「パート再生」で
あると判断すると、ステップS32においてCPU12
は、ブロック番号領域44に記憶されているパート再生
情報の有無の判断を行う。「パート再生情報」がない場
合はステップS2に戻る。パート再生情報がある場合は
ステップS33に進み、ステップS33においてパート
再生情報に基づいて、図8(E)に示すような、パート
選択メニューをディスプレイ16に表示する。オペレー
タは、操作パネル26の上キー26aおよび下キー26
bを操作してカーソル16aの位置を移動させて「さび
1」もしくは「さび2」を選択し、さらに決定ボタン2
6cを操作して決定する(ステップS35)。CPU1
2はステップS37において、操作パネル26から送ら
れる操作信号に基づいて、たとえば「さび1」のブロッ
ク番号情報を参照してスタートブロック番号24および
エンドブロック番号33を取得して、それぞれのブロッ
ク番号をエリアBsおよびエリアBeに設定する。エリ
アBsおよびエリアBeにブロック番号を設定すると、
ステップS9においてリンクテーブルを用いてエリアB
sおよびエリアBeに設定されているブロック番号を音
楽データのスタートフレーム番号およびエンドフレーム
番号に変換する。さらに、ステップS13以降で上述の
処理を行い、音楽データの「さび1」などで指定される
さび部分を再生する。
【0039】ところで、音声データが前述の英語会話デ
ータである場合には、ブロック番号領域44に図10
(B)に示すようなパート再生情報が記憶されている。
このパート再生情報には、図10(A)のパート再生情
報に加えて英語会話の発話者を区別するための属性が付
加されている。したがって、「パート再生」のときに
は、図10(A)のパート再生情報を用いたときのデー
タ名ごと(「さび1」,「さび2」など)の選択のほか
に、オペレータは図9(D)に示す属性に従った選択メ
ニューを用いて選択することが可能となる。つまり、た
とえば属性「太郎」を選択すると、ステップS37にお
いて属性が「太郎」であるデータ名(「太郎1」,「太
郎2」,…)のみの選択メニューをさらにディスプレイ
16に表示して選択することができる。
【0040】上述の「範囲を選択して再生モード」で
は、ステップS27においてオペレータが決定した選択
範囲、つまりスタートブロック番号およびエンドブロッ
ク番号をメモリカード20のブロック領域44に記憶で
きるものとした。ユーザによる設定を記憶したこの情報
も同様にブロック再生情報を構成する。このユーザ設定
によるブロック再生情報は図10(C)に示すように属
性が「user」とされているのみで、予め添付されたブロ
ック再生情報と同一の構成であるから、「パート再生モ
ード」において、添付ブロック再生情報と同様に扱われ
る。なお、図10に示したパート再生情報おいて、図1
0(A)に示すパート再生情報は、図10(B)および
(C)のパート再生情報と構成が異なるが、データ構成
から明らかなように、同一構成とすることも可能であ
る。
【0041】以上のモードの他に、携帯電話機10は
「編集モード」を備えている。「編集モード」では、ま
ずテキストデータの範囲を指定することによって、指定
されたテキストデータに対応する音声データ部分を音声
データから複写する。そして複写した音声データを新た
な音声データとしたり、複写した音声データを既に存在
する音声データに追加/挿入したりすることができる。
【0042】ステップS45において、CPU12が
「編集モード」がオペレータによって選択されたと判断
すると、ステップS47で「編集モード処理」を実行す
る。「編集モード処理」では、CPU12は図7のフロ
ー図に示す手順に従って処理を実行する。まず、ステッ
プS61において、CPU12は複写元の音声データに
対応するテキストデータをディスプレイ16に表示す
る。オペレータは、ディスプレイ16に表示されたテキ
ストデータに対して、図8(B)から(C)に示した手
順で、複写したい音声データの範囲を決定する。オペレ
ータの操作に応答して、CPU12は、ステップS63
において、複写元のテキストデータのスタートブロック
番号を決定してメモリ32のエリアBsに設定し、ステ
ップS65においては、エンドブロック番号を決定して
エリアBeに設定する。さらに、ステップS67におい
ては、リンクテーブルを参照して、スタートブロック番
号およびエンドブロック番号から複写元の音声データの
スタートフレーム番号およびエンドフレーム番号を特定
し、これらのフレーム番号をメモリ32のエリアFsお
よびFeにそれぞれ設定する。つぎに、CPU12はス
テップS69において、エリアBs,Be,Fsおよび
Feに設定されているブロック番号およびフレーム番号
に基づいて、複写範囲のテキストデータ,音声データお
よびリンクテーブル(以下、複写データと呼ぶ。)をメ
モリカード20に記憶されている複写元のテキストデー
タ、音声データおよびリンクテーブルから取得して、メ
モリ32に記憶する。
【0043】メモリ32に記憶されている複写データ
は、たとえば図11(A)(B)(C)のそれぞれに示
すようなデータである。
【0044】ステップS71において、CPU12は、
複写データを独立した新たなデータとする指示があるか
どうかを判断し、独立データにする指示があると判断し
たときには、ステップS75において、メモリ32に記
憶されているテキストデータ、音声データおよびリンク
テーブルを新規な独立データとしてメモリカード20の
テキストデータ領域41、音声データ領域42およびリ
ンクテーブル領域43にそれぞれ記憶する。なお、テキ
ストデータ、音声データおよびリンクテーブルをメモリ
32からメモリカード20とは別のメモリカード20な
どに記憶するようにしてもよい。このように新規な独立
データとしてメモリカード20に記憶された複写データ
は、ブロック番号およびフレーム番号が図11(D)
(E)(F)のそれぞれに示すように割り振り直され
る。
【0045】一方、ステップS71において、複写デー
タを独立データにする指示がないと判断したときには、
CPU12は、オペレータの操作に応じて複写データを
複写する複写先データをステップS77において決定
し、複写先データとしての音声データ、テキストデータ
およびリンクテーブルをメモリカード20から取得して
メモリ32に記憶する。つぎに、ステップS79におい
て、複写先のテキストデータをディスプレイ16に表示
する。なお、この複写先のテキストデータなどは、複写
元のテキストデータなどが記憶されていたメモリカード
20とは別のメモリカード20などに記憶されているも
のとしてもよい。オペレータは、図8(B)に示すカー
ソル16bを操作して複写データの挿入位置を決定す
る。このオペレータの操作信号に応答してCPU12
は、ステップS83において挿入位置前後のテキストデ
ータのブロック番号を決定して、各ブロック番号をメモ
リ32のエリアBsおよびBeに設定する。さらに、C
PU12は、複写先のリンクテーブルを参照して、エリ
アBsおよびBeに設定されているブロック番号から挿
入位置前後の音声データのフレーム番号を決定する。
【0046】ここで、複写データは、上述のとおり図1
1(A)(B)(C)のそれぞれに示すデータである。
複写先データを図12(A)(B)(C)にそれぞれ示
すデータとし、複写先データのテキストデータにおける
複写データの挿入位置をブロック9とブロック10との
間であるとすると、音声データにおける複写データの挿
入位置は図12(C)のリンクテーブルからフレーム2
3とフレーム24の間となる。
【0047】CPU12は、ステップS85において複
写データを複写先データの挿入位置に挿入し、複写デー
タが挿入された複写先データをメモリ32から読み出し
てメモリカード20に記憶して「編集処理」終了する。
【0048】複写データが挿入された複写先データのテ
キストデータ、音声データおよびリンクテーブルのそれ
ぞれは、図13(A)(B)(C)のそれぞれに示す状
態で、メモリカード20のテキストデータ領域41、音
声データ領域42およびリンクテーブル領域43にそれ
ぞれ記憶される。
【0049】以上説明したように、この実施例の携帯型
電話機10によれば、再生もしくは編集する音声データ
の範囲を、ディスプレイ16に表示されているテキスト
の範囲を指定することで決定できる。したがって、決定
した音声データの範囲を即時確認することもでき、オペ
レータは、操作する音声データの範囲を非常に容易かつ
正確に設定することができる。
【0050】なお、この実施例は上述の例に限らず、種
々変更して実施することができる。たとえば、音声デー
タの全体を再生する「通常再生モード」で再生している
ときにも、オペレータが所定の操作を操作パネル26か
ら行うと、再生を中断してモード選択を行えるようにし
てもよい。
【0051】さらに、図8(C)に示す段階で、つまり
開始位置のみを決定した状態で、オペレータが再度決定
ボタン26cを操作すると、選択範囲が開始位置以降の
全体となるようにしてもよい。
【0052】また、音声データおよびテキストデータ
は、音楽データ、英語会話データおよびこれらに対応す
るテキストデータに限らず、音声データと音声データに
対応するテキストデータで表現されるものであれば、ど
のようなものであってもよい。
【0053】そして、音声データ処理装置としては、実
施例の携帯電話機以外に、光ディスク,半導体メモリな
どに記憶された音声データを再生する装置が考えられる
が、どのような記憶メディアを用いる装置であってもよ
い。
【0054】また、上述の実施例では音声データ,テキ
ストデータおよびリンクテーブルを1つの記憶媒体に記
憶することとしたが、これらのデータを必ずしも1つの
記憶媒体に記憶する必要はなく、既存の音声データが記
憶された或る記憶媒体と、既存の音声データに対応させ
たテキストデータおよびリンクテーブルを記憶した別の
記憶媒体とを使用するようにしてもよい。
【図面の簡単な説明】
【図1】この発明の一実施例を示すブロック図である。
【図2】図1の実施例での音声データおよびテキストデ
ータの構成の一例を示す図解図である。
【図3】図1の実施例におけるメモリカードの内部構成
の一例を示す図解図である。
【図4】図1の実施例におけるリンクテーブルの一例を
示す図解図である。
【図5】図1の実施例のCPUが行う処理の手順を示す
フロー図である。
【図6】図1の実施例のCPUが行う処理の手順を示す
フロー図である。
【図7】図1の実施例のCPUが行う処理の手順を示す
フロー図である。
【図8】図1の実施例のCPUが行う処理の手順を示す
フロー図である。
【図9】図1の実施例におけるディスプレイの表示例を
示す図解図である。
【図10】図1の実施例で取り扱うデータの構成の一例
を示す図解図である。
【図11】図1の実施例で行われるデータ操作を説明す
る図解図である。
【図12】図1の実施例で行われるデータ操作を説明す
る図解図である。
【図13】図1の実施例で行われるデータ操作を説明す
る図解図である。
【符号の説明】
10 …携帯電話機 12 …CPU 16 …ディスプレイ 20 …メモリカード 22 …アンテナ 24 …送受信回路 26 …操作パネル 28 …音声再生回路 30 …スピーカ

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】テキストデータをブロック単位で記憶する
    テキスト記憶手段、 前記テキストデータに対応する音声データをフレーム単
    位で記憶する音声記憶手段、 前記ブロックのブロック番号と、前記ブロックに含まれ
    るテキストデータと対応する前記音声データを含む前記
    フレームのフレーム番号とが関連付けられたリンクテー
    ブルを記憶するリンクテーブル記憶手段、 前記テキスト記憶手段に記憶された複数の前記ブロック
    のうち少なくとも1つの前記ブロックのブロック番号を
    選択する第1選択手段、 前記リンクテーブルを参照して、前記第1選択手段によ
    って選択された前記ブロック番号を前記フレーム番号に
    変換する変換手段、および前記変換手段によって変換さ
    れた前記フレーム番号に従って、前記音声データを前記
    音声記憶手段から読み出す第1読み出し手段を備える、
    音声データ処理装置。
  2. 【請求項2】前記第1読み出し手段によって読み出され
    た前記音声データを再生する再生手段をさらに備える、
    請求項1記載の音声データ処理装置。
  3. 【請求項3】再生回数を設定する回数設定手段をさらに
    備え、 前記再生手段は、前記再生回数だけ前記音声データを再
    生する、請求項2記載の音声データ処理装置。
  4. 【請求項4】前記テキストデータをディスプレイに表示
    する表示手段をさらに備え前記第1選択手段は、前記デ
    ィスプレイに表示された前記テキストデータに対応する
    ブロックのうち少なくとも1つの前記ブロックのブロッ
    ク番号を特定する特定手段を含む、請求項1または3記
    載の音声データ処理装置。
  5. 【請求項5】前記ブロック番号を記憶するブロック番号
    記憶手段をさらに備え、 前記第1選択手段は、前記ブロック番号記憶手段に記憶
    された前記ブロック番号のうち少なくとも1つの前記ブ
    ロック番号を選択する第2選択手段を含む、請求項1な
    いし4記載の音声データ処理装置。
  6. 【請求項6】受信手段をさらに備え、 前記テキスト記憶手段,前記音声記憶手段,前記リンク
    テーブル記憶手段および前記ブロック番号記憶手段は、
    前記受信手段によって受信された前記テキストデータ,
    前記音声データ,前記リンクテーブルおよび前記ブロッ
    ク番号を記憶する請求項5記載の音声データ処理装置。
  7. 【請求項7】前記音声データはボーカルを含む音楽デー
    タであり、前記テキストデータは前記音楽データの歌詞
    データである、請求項1ないし6記載の音声データ処理
    装置。
  8. 【請求項8】前記ブロック番号記憶手段には、前記音楽
    データのさびに相当する前記歌詞データ部分のブロック
    番号が記憶されている、請求項7記載の音声データ処理
    装置。
  9. 【請求項9】前記ブロック番号記憶手段には、前記歌詞
    データの所定のパートに相当する部分のブロック番号が
    記憶されている、請求項7記載の音声データ処理装置。
  10. 【請求項10】前記音声データは外国語会話データであ
    り、前記テキストデータは前記外国語会話データの外国
    語テキストデータである、請求項1ないし6記載の音声
    データ処理装置。
  11. 【請求項11】前記ブロック番号記憶手段には、前記外
    国語テキストデータの所定の発話者による発話個所に相
    当する部分のブロック番号が記憶されている、請求項1
    0記載の音声データ処理装置。
  12. 【請求項12】前記第1読み出し手段によって読み出さ
    れた前記音声データを前記音楽記憶手段または別の記憶
    手段に書き込む書き込み手段をさらに備える、請求項1
    記載の音声データ処理装置。
  13. 【請求項13】前記書き込み手段は、前記第1読み出し
    手段によって読み出された前記音声データの前記フレー
    ムに対応する前記ブロックを前記テキスト記憶手段から
    読み出す第2読み出し手段、前記第2読み出し手段によ
    って読み出された前記ブロックのブロック番号と前記第
    1読み出し手段によって読み出された前記フレームのフ
    レーム番号とを関連付けた前記リンクテーブルを生成す
    るテーブル生成手段を含み、前記第2読み出し手段によ
    って読み出された前記ブロックをも前記テキスト記憶手
    段または別の記憶手段に書き込むとともに、テーブル生
    成手段によって生成された前記リンクテーブルも前記テ
    ーブル記憶手段または別の記憶手段に書き込む、請求項
    12に記載の音声データ処理装置。
  14. 【請求項14】前記各記憶手段は、着脱自在なメモリで
    構成される、請求項1ないし13記載の音声データ処理
    装置。
JP2000096252A 2000-03-31 2000-03-31 音声データ処理装置 Withdrawn JP2001282291A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000096252A JP2001282291A (ja) 2000-03-31 2000-03-31 音声データ処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000096252A JP2001282291A (ja) 2000-03-31 2000-03-31 音声データ処理装置

Publications (1)

Publication Number Publication Date
JP2001282291A true JP2001282291A (ja) 2001-10-12

Family

ID=18611041

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000096252A Withdrawn JP2001282291A (ja) 2000-03-31 2000-03-31 音声データ処理装置

Country Status (1)

Country Link
JP (1) JP2001282291A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007174321A (ja) * 2005-12-22 2007-07-05 Nec Corp 携帯通信端末、その駆動方法及びその駆動プログラム
JP2018180519A (ja) * 2017-04-18 2018-11-15 日本放送協会 音声認識誤り修正支援装置およびそのプログラム
JP2021067845A (ja) * 2019-10-24 2021-04-30 東京瓦斯株式会社 音声再生システムおよびプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007174321A (ja) * 2005-12-22 2007-07-05 Nec Corp 携帯通信端末、その駆動方法及びその駆動プログラム
JP2018180519A (ja) * 2017-04-18 2018-11-15 日本放送協会 音声認識誤り修正支援装置およびそのプログラム
JP2021067845A (ja) * 2019-10-24 2021-04-30 東京瓦斯株式会社 音声再生システムおよびプログラム
JP7353130B2 (ja) 2019-10-24 2023-09-29 東京瓦斯株式会社 音声再生システムおよびプログラム

Similar Documents

Publication Publication Date Title
JP2010250023A (ja) テキスト表示機能付情報処理装置、データ取得方法およびデータ取得プログラム
JP2016157225A (ja) 音声検索装置、音声検索方法及びプログラム
JP2007295218A (ja) ノンリニア編集装置およびそのプログラム
JP2004007407A (ja) テンプレートファイル編集装置及び編集プログラム
JP2007164852A (ja) 転送装置、転送方法及び転送プログラム
JP2001282291A (ja) 音声データ処理装置
JP3036430B2 (ja) 文章読み上げ装置
KR100357241B1 (ko) 디지털 오디오 플레이어에서의 반복재생구간 설정제어방법 및 이것을 이용한 파일재생장치 및 저장매체
JPH08255466A (ja) オーディオデータ記録および/または再生方法およびその装置
JP2000276192A (ja) 編集装置
CN1604180B (zh) 音乐再现系统
KR100383194B1 (ko) 미디어 파일 재생 방법
KR20070030134A (ko) 재생장치, 재생방법 및 재생 프로그램
JP2006337702A (ja) カラオケサービス方法およびカラオケシステム
JPS60218155A (ja) 電子出版物
JPH0527787A (ja) 音楽再生装置
JP2002245033A (ja) 携帯型電子機器および同装置の文字列表示方法
JP2005107617A5 (ja)
JP2005107617A (ja) 音声データ検索装置。
JP2001228897A (ja) 音声入力装置及びその制御方法並びにプログラムコードを格納した記憶媒体
KR20040062317A (ko) 오디오 데이터 파일의 부가 정보 음성 안내방법
JP2007013469A (ja) 音声操作支援装置、電子機器、画像形成装置およびプログラム
KR100563320B1 (ko) 단일 메모리를 갖는 어학학습장치 및 그 제어방법
JP2007257709A (ja) 記録装置、記録装置の制御方法および制御プログラム
JP3000568U (ja) カラオケ装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070605