JPH0990973A - 音声処理装置 - Google Patents

音声処理装置

Info

Publication number
JPH0990973A
JPH0990973A JP7244222A JP24422295A JPH0990973A JP H0990973 A JPH0990973 A JP H0990973A JP 7244222 A JP7244222 A JP 7244222A JP 24422295 A JP24422295 A JP 24422295A JP H0990973 A JPH0990973 A JP H0990973A
Authority
JP
Japan
Prior art keywords
information
voice
audio information
audio
recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7244222A
Other languages
English (en)
Inventor
Satoshi Ejima
聡 江島
Toshio Uchikawa
敏男 内川
Makoto Yamazaki
真 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nikon Corp
Original Assignee
Nikon Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nikon Corp filed Critical Nikon Corp
Priority to JP7244222A priority Critical patent/JPH0990973A/ja
Priority to US08/715,382 priority patent/US5974386A/en
Priority to TW085111206A priority patent/TW439384B/zh
Priority to KR1019960041017A priority patent/KR970019552A/ko
Publication of JPH0990973A publication Critical patent/JPH0990973A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C7/00Arrangements for writing information into, or reading information out from, a digital store
    • G11C7/16Storage of analogue signals in digital stores using an arrangement comprising analogue/digital [A/D] converters, digital memories and digital/analogue [D/A] converters 
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C2207/00Indexing scheme relating to arrangements for writing information into, or reading information out from, a digital store
    • G11C2207/16Solid state audio
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S715/00Data processing: presentation processing of document, operator interface processing, and screen saver display processing
    • Y10S715/978Audio interaction as part of an operator interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Complex Calculations (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】 【課題】音声処理装置では、音声を再生する場合に、カ
ウンターによる表示を目安に、希望する音声の箇所を探
さねばならなかった。そして希望する音声が見つからな
い場合には、さらにテープを早送りまたは巻き戻し、カ
ウンターとカンを頼りに音声を探す必要があり、非常に
操作がしにくいものであった。 【解決するための手段】 マイクと、画像情報と音声情
報とを記録するメモリと、画像情報を表示する液晶ディ
スプレイと、音声情報を画像情報に変換する変換回路と
を設け、前記液晶ディスプレイは、前記液晶ディスプレ
イの縦および横方向を時間軸とし、どちらか一方の時間
軸の単位を他の一方の時間軸の単位より長くした。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声処理装置に関する
ものである。
【0002】
【従来の技術】従来より音声を記録再生するテープレコ
ーダーや音声と画像の両方を記録再生できる音声記録電
子カメラ等が知られている。このような装置にはいわゆ
るカウンターが設けられており、時刻またはテープ走行
の経過に伴ってカウンターの表示が変化するように構成
されていた。
【0003】
【本発明が解決しようとする課題】この様な音声処理装
置では、音声を再生する場合に、カウンターによる表示
を目安に、希望する音声の箇所を探さねばならなかっ
た。そして希望する音声が見つからない場合には、さら
にテープを早送りまたは巻き戻し、カウンターとカンを
頼りに音声を探す必要があり、非常に操作がしにくいも
のであった。
【0004】また、パーソナルコンピュータなどで音声
情報を表示するソフトウェアは有ったが、一部のソフト
ウェアは上記の音声処理装置をソフトウェアでシュミレ
ートしただけのもので、特に操作性が改善されることは
なかった。また別のソフトウェアではオシロスコープを
ソフトウェア的にシュミレートしており、音声を波形と
して表示するものもあった。そして音声の再生を希望す
る箇所を選択手段によってモニター上で選択する事が可
能であった。
【0005】しかしながら例えば話し手が変わるなど、
記録の対象となる音声の種類が変化しても、同じ様な波
形が表示されており、多少の波形の違いを肉眼で認識
し、音声の発生源を推測することは不可能であった。し
たがってやはり音声を再生させ、その状況からさらに手
前または先を再生するなど試行錯誤を要し、使用勝手の
悪いものであった。
【0006】またこの種のものでは一般にモニターにグ
ラフとして音声が表され、上下方向が波形の強さを表す
音圧軸に、左右方向が時刻を表す時間軸となっていた。
このために長い時間記録された音声を一度に表示しよう
とすると、グラフの横軸を例えば1cmあたり5秒から
1分に変えるなどして全体を縮小しなければならなかっ
た。このようにするとその一部に短時間発せられた音声
があった場合、この短時間の音声を表すグラフが小さく
なり認識ができなくなってしまうという問題があった。
【0007】
【課題を解決するための手段】上記目的を解決するため
に本発明における請求項1では、音声情報の入力手段
と、前記音声情報を記録する記録手段と、表示手段と、
前記音声情報を画像情報に変換する変換手段とを設け、
前記画像情報を前記表示手段に表示するとともに、前記
表示手段の縦および横方向を時間軸とし、どちらか一方
の時間軸の単位を他の一方の時間軸の単位より長くなる
ように構成した。
【0008】
【発明の実施の形態】以下、本発明を図面に示す実施の
形態に基づいて詳細に説明する。図1は本発明に係わる
電子カメラ装置の概略図である。電子カメラ装置1には
電源スイッチ10、静止画像の再生および各種データを
表示する液晶ディスプレイ(以下LCDと記す;LCD
の大きさは6cm*4cm)2を備えている。ストロボ
5、ファインダー6、撮影レンズ7、レリーズ釦8は画
像の記録に関するもので、マイク3、イヤホンジャック
4、録音釦9、スピーカー12は音声の記録および再生
に関するものである。スイッチ釦11は使用者が様々な
設定を行うためのスイッチである。またLCD2の表面
には、ペン状の指示部材で接触すると、指示された位置
が入力可能ないわゆるタッチタブレット13が設けられ
ている。このタッチタブレット13は透明な樹脂で構成
されており、内側のLCD2がタッチタブレット13を
通して観察可能となっている。
【0009】図2は回路ブロック図である。音声はマイ
ク3から入力され、A/D変換回路21でディジタルデ
ータに変換され、ディジタルシグナルプロセッサ26
(図中にはDSPと記す)に入力される。ディジタルシ
グナルプロセッサ26ではディジタル化された音声信号
は圧縮され、CPU29およびインターフェース30を
経由してメモリ31に記録される。
【0010】なおこの音声の圧縮は離散的コサイン変換
を行ってから、量子化し、ハフマン符号化して行われ
る。これは後述するように離散的コサイン変換の結果を
用いて周波数の分析を行うことを可能としている。なお
音声の圧縮にこのような圧縮方法を用いずにいわゆるP
CM録音を行い、画像情報の圧縮に離散的コサイン変換
を用いる圧縮方式(例えばJPEG圧縮方式)を用いる
ようにして、音声情報の周波数の分析に、この離散的コ
サイン変換手段を用いてもよい。
【0011】次に画像について説明する。被写体像は撮
影レンズ7で集光された光束が撮像素子であるCCD2
3に結像する。そして光電変換された画像情報は相関2
重サンプリング回路(図中にはCDSと記す)24を経
てA/Dコンバータ25でディジタルデータに変換され
る。そしてディジタルシグナルプロセッサ26で圧縮さ
れ、CPU29、インターフェース30を経てメモリ3
1に蓄積される。ここで圧縮は離散的コサイン変換と量
子化とハフマン符号化を組み合わせたJPEG圧縮方式
が行われている。
【0012】メモリ31に圧縮して蓄積された情報は装
置1の背面に設けられたLCD2に表示可能である。こ
れはメモリ31の情報がインターフェース30をへてC
PU29に読み込まれ、ディジタルシグナルプロセッサ
26で伸張され、再度CPU29を経由し、フレームメ
モリ27に一旦蓄えられてからLCD2に表示される。
ここで画像情報の場合には、伸張された画像データがビ
ットマップとしてフレームメモリに蓄えられ表示され
る。さらに必要に応じてビットマップデータが間引かれ
縮小したいわゆるサムネイル画像としてフレームメモリ
27に送られ、LCD2で表示される。
【0013】一方音声情報の再生の場合にはディジタル
シグナルプロセッサ26で伸張された後、後述するよう
に棒グラフとして表示するべく、フレームメモリ27に
は音声を視覚したビットマップデータが送られ、表示さ
れる。またCPU29の内部には日付および時刻を知る
ための時計回路が内蔵されており、音声情報や画像情報
が記録されたときの日付と時刻が、音声情報や画像情報
とともに記録可能となっている。
【0014】図3はLCD2の表示内容を示す図であ
る。この表示は、すでに画像撮影および録音が終了し
て、それらの情報を再生する画面である。この表示画面
では、音声情報は視覚化され棒グラフ53aとして表示
されている。ここで録音された音声が短かった場合のは
棒グラフは短く表示される。また、所定の音量より小さ
い無音状態と見なせる時間が所定時間あった場合又は音
声の周波数帯域(例えば、男性の声と助成の声、川のせ
せらぎなどの背景の音声と人間の肉声)が変化した場合
には、棒グラフの表示を一段さげて棒グラフ53bとし
て表示する。さらに後述する方法により、音声の周波数
に対応した色で棒グラフ53a、53bの表示をおこな
う。
【0015】このことにより、使用者は棒グラフ53
a、53bを見て、ここで録音された会話の内容が変化
した、あるいは話し手が変わったことが分かり、後に音
声を再生させるときの目安となる。なお上記無音状態は
以後無音部と記す。そして、同一の連続した音声が長時
間(例えば2分30秒)記録された場合には、一定時間
(例えば1分間)録音された情報が棒グラフ53b(1
分間分)として表示され、さらに改行されて棒グラフ5
3c(1分間分)として表示され、さらにこの場合は棒
グラフ53d(30秒間分)として表示される。
【0016】以上のように表示の横軸は、最も長い棒グ
ラフを1分とする時間軸とし、縦軸を1行1分とする時
間軸とすることで、長い音声情報すなわち棒グラフ53
b,53c,53dと短い音声情報53aとが同時に認
識可能である。なおこの音声情報の表示は棒グラフだけ
に限定されるものでなく、例えば「*」印を録音時間に
応じて複数個並べても良い。また音声の周波数に対応し
て使用するマークを変えても、また棒グラフのパターン
を変えてもよい。
【0017】棒グラフの左横には音声記録時の時刻51
が表示してある。この音声記録時間の表示は音声記録開
始時または終了時、あるいは開始時と終了時の平均値で
あってもよい。さらに横または下に音声の録音時間を表
示しても良い。なお録音された日付が変わった場合に
は、日付情報58が表示されるように構成されている。
このことにより、後日録音された情報を再生する場合
に、迅速に希望する再生箇所を探すことが可能となって
いる。
【0018】52aは撮影された画像情報を小さく表示
したいわゆるサムネイル画像であり、音声と同時に記録
された場合には、音声情報の横に表示される。なお画像
情報のみが記録され、音性情報が記録されなかったとき
には52cのように画像情報のみが表示される。また画
像情報を縮小して表示することがCPU29の処理能力
上難しい場合には、例えば52d、53eのように
「*」マークで代用しても良い。
【0019】次に図4を用いて無音部の検出について説
明する。音声の波形40は有音部41と無音部42およ
び無音部43に大別することができる。ここで所定の振
幅以下の波形を無音部として定義しており、この無音部
と認識する振幅の大きさPは使用者により選択可能とな
っている。また図中の△tで表されるように一般に人の
話し声の中には、子音が発生されたときなどきわめて短
い無音部がある。そこでこの様な無音部は検出しないよ
うに、ある一定時間以上の無音部のみを認識するように
構成されている。この無音部の長さは0.3秒から1秒
くらいの間で使用者によって選択可能となっている。そ
して前述のように所定の振幅より小さく、所定の時間よ
り長い無音部42のみが認識され棒グラフが改行して表
示される。また不図示のモード設定手段により図6に示
すように無音部を53e、53fのように点線または色
を変えて表示することが可能となっている。このことに
より、無音部があることおよびその無音部の長さが視覚
的に認識可能である。
【0020】この他に、無音部に無音であることを表す
特殊な印、たとえば音符の休符号などを表示を行っても
よい。さらに一度無音部が発見された音声データは、無
音部に特殊なコードをいれて再度メモリに記録してもよ
い。この場合、再度音声の棒グラフを表示するときに無
音部を探す処理が簡単になり、棒グラフの表示速度が向
上するという利点がある。また無音部で棒グラフを一段
下げて表示する以外に、無音部も棒グラフとして表示す
るモードと、無音部を表示しないモードを設けてもよ
い。
【0021】つぎに音声の周波数の検出について説明を
行う。本装置ではディジタルシグナルプロセッサ内部に
画像情報、および音声情報を圧縮するためのハードウェ
アが組み込まれている。さて一般に圧縮は離散的コサイ
ン変換(DCT)と量子化と2次元ハフマン符号化が行
われる。なおDCTはハードウェアに限定するものでな
く、ソフトウェアで実施してもよい。
【0022】ここで入力されるデータxが8個の場合D
CTは数式1の変換で表される。
【0023】
【数1】
【0024】ここでx0〜x7に音声データをいれるこ
とにより、y0〜y7に異なった周波数に対応した値を
得ることができる。なおここではデータを8個とした
が、16個にしてもよい。さてサンプリングデータが8
個でサンプリング周波数が1kHzとすると、1秒間に
125組のy0〜y7の値が得られる。これらの値を各
y0〜y7ごとに平均すると音声の各音、すなわち
「あ」や「い」の発声による周波数の変動は平均化さ
れ、発声者の有する声の周波数に応じた値が得られる。
そしてこの各1秒ごのとyの値の変化が所定値より大き
くなった場合には、発声者が変化した、または発声者が
発声をやめ、背後の雑音だけが記録されたと判断し、棒
グラフを改行する。
【0025】さらに棒グラフをR、G、Bの各色の混合
で表示する場合には、y0とy1とy2の値の関数とし
てRの大きさを決め、y3とy4とy5からGの大きさ
を決め、y6とy7の大きさからBのレベルを決定す
る。具体的にはyの各値が0〜255までの値を取るの
で、 R=(y0×65536+y1×256+y2)÷65
536 G=(y3×65536+y4×256+y5)÷65
536 B=(y6×256+y7)/256 として計算する。ここでBだけ2個のyより算出した
が、Bに限定するものではなく、RまたはGにしてもよ
い。
【0026】このことにより音声は圧縮において使用す
るDCTを利用して周波数を分析し、改行および色分け
が可能なので、使用者の音声の検索が迅速に行えるとと
もに、新たに周波数分析のためのソフトウェアやハード
ウェアを用意しなくてもすむので、コストダウンが可能
となる。なお、周波数を平均化する所定時間は1秒に限
るものではないが、時間が長くなるほど相槌などの短い
発声があった場合に、それを検出できなくなる可能性が
ある。また短すぎると発音の中の各音にとらわれる可能
性があるので、実験的に0.3秒以上とするのが望まし
い。また例えば1秒間の間に平均化された周波数と、次
の1秒間に平均化された周波数との差が所定値以下であ
れば、同一人物の発音による誤差として、同じ色で表示
をおこなう。
【0027】上記のように色分けされた棒グラフのなか
で、特定の色の棒グラフの一つを2回、指示部材でタッ
チタブレット13の上から触ると、該特定の色の棒グラ
フのみが表示され、他の色の棒グラフは表示画面上から
一時的に消える。このことにより特定の話者または発音
体の発声のみを選択することが可能となっている。そし
てスイッチ釦11を押すと選択された特定の色の棒グラ
フに対応する、特定の周波数の音声のみが再生される。
このことにより、特定の話者の音声のみを再生すること
が可能となっている。
【0028】さらに周波数が周期的に多様にわたって変
化する場合には、音楽が録音された可能性が高いので、
棒グラフの左端に音符のマークなどを表示するととも
に、他とは異なる色で棒グラフを表示することも可能で
ある。次に音声および画像情報の再生方法について述べ
る。不図示のペン状の指示部材で図3の表示の上から棒
グラフ53a上のみを接触し、スイッチ釦11を押すと
棒グラフ53aに相当する音声のみが再生される。
【0029】また指示部材で棒グラフ53aと53bの
上を連続的に接触し、スイッチ釦11を押すと同様に5
3aと53bに相当する音声が再生される。またスイッ
チ56を押すと表示は下にスクロールし、スイッチ57
を押すと表示は最後までスクロールする。同様にスイッ
チ54、55を押すと表示は上方向および始めまでスク
ロールする。このことにより任意の範囲の棒グラフを選
択することが可能となっている。
【0030】一方画像サムネイル52aを指示部材で選
択し、スイッチ釦11を押すと、画像が拡大され、LC
D2に大きく表示される。ここでスイッチ55を押すと
一つ前の画像が、スイッチ56を押すと一つ後に撮影さ
れた画像が再生され、スイッチ54が押されたときには
最初に撮影された画像が、スイッチ57が押されたとき
には最後に撮影された画像が表示される。
【0031】また画像サムネイル52a、52b,52
c、52dが連続的に選択されたときには、LCD2に
は4つの画像が一度に表示できる大きさに拡大されて表
示される。そして先ほどと同様にスイッチ54〜57の
操作に応じてスクロールする。そして4つに分割された
画像の一つを指示部材で接触すると、その画像が拡大さ
れて表示される。
【0032】つぎに指示部材が斜めに移動し、その横方
向の移動範囲が画像と音声を含む範囲を移動した場合、
指示部材の縦方向の移動範囲に含まれる画像と音声が表
示、再生される。このとき音声の時間経過に伴って画像
も逐次表示される。すなわちサムネイル52aに対応す
る画像は音声の棒グラフ53aで表される音声が再生さ
れる時間だけ表示される。次にサムネイル52bに対応
する画像は音声の棒グラフ53b,53c,53dで表
される音声が再生される時間だけ表示される。またサム
ネイル52cのように対応する音声が無いものは、所定
時間、すなわち3秒程度再生されるように構成されてい
る。
【0033】図5は本発明をパーソナルコンピュータで
実施した場合の実施例である。図5においてパーソナル
コンピュータ101にはCCDカメラ102がコードで
接続されており、またマイクロフォン103が接続され
ている。またCCDカメラ102およびマイクロフォン
103の代わりにカメラ機能およびマイクを備えた図1
に示した装置1をパーソナルコンピュータ101に接続
してもよいし、また装置1でメモリ31に記録された情
報をコードまたは記録媒体を介してパーソナルコンピュ
ータ101に伝達しても良い。
【0034】パーソナルコンピュータの画面101aに
は図3と同様の画面が表示され、マウスなどの指示部材
を使用して前述と同様の操作が可能となっている。ただ
しスイッチ釦11に相当するものはパーソナルコンピュ
ータのキーボードから操作可能なので省略されている。
また棒グラフ153の上にはワープロ機能を利用して、
再生させた音声を使用者が聞き取り、文字情報154と
して入力可能となっている。
【0035】そして複数の画像サムネイル152と複数
の文字情報154とを一度にワープロソフトなど他のア
プリケーションソフトにコピー可能となっている。 ま
た棒グラフを再生し、その中に「yesterday」
という発音があった場合には、その範囲の棒グラフを範
囲指定し、不図示の検索ボタンを押すことにより、録音
されている全音声情報の中から「yesterday」
という発音を検索することが可能となっている。そして
その棒グラフの上に”yesterday”という文字
情報が使用者によって記入されていた場合には、検索に
よって発見された「yesterday」という発音の
上に”yesterday”の文字を自動的に配置する
事が可能となっている。
【0036】この音声の検索は図4に示すように、使用
者の希望する音声波形46と前後の音声波形の類似した
ものを探し、音声波形48のように多少振幅が異なって
も、信号の波形に近似したものを探し出すようになって
いる。この相関を求めるに当たっては、 1 音声波形46を周波数分析し、その分析された音声
スペクトルと、その他の範囲を周波数分析した音声スペ
クトルとが90%以上近似していればよしとする方法。 2 音声波形46と音声波形47、音声波形48との相
関関数を計算し、相関の高いものを表示する方法。
【0037】などがある。これらの方法により、例えば
早口に「yesterday」と発音された等は検索で
きない可能性があるが、あくまで使用者が音声を再生す
るときの目安となればよいので、問題はない。
【0038】
【発明の効果】このことにより請求項1では、記録時間
の経過とともに、たとえば左から右へ横方向に音声情報
が画像情報に変換されて表示され、所定の時間がたつと
一段下の位置に先ほどの画像情報と同じ様に表示位置が
移動し、表示される。このことにより、時間軸が横軸の
みであった従来例対して、モニターの面積を有効に使用
することが可能となった。この結果、長い時間録音され
た情報と短い時間録音された情報を同時に表示しても、
全体を縮小することなく観察することが可能となった。
【0039】また、請求項2による発明では、前記周波
数検出手段によって検出された無音部より以前に記録さ
れた前記音声情報より作られた第1の画像情報と、無音
部より以後に記録された前記音声情報より作られた画像
情報とを分離して、前記表示手段に表示するように構成
した。このことにより、人間の会話を記録した場合に
は、話し手が変わったり、また話し手の会話の内容が変
わったところの無音部で表示位置が変化するので、表示
手段をみながら録音内容を想像することが可能となり、
迅速に希望する再生箇所を探すことが可能となった。
【0040】請求項3による発明では、前記無音部と非
前記無音部で前記画像情報が異なることにより、使用者
が音声のあるところを視覚的に認識可能とした他、音声
の無いところの箇所と長さも視覚的に認識可能としたの
で、迅速に希望する再生箇所を探すことが可能となっ
た。請求項4による発明では、周波数が変化した場合に
周波数に対応して画像情報の色や形を変えることによ
り、話し手の会話が録音されてる箇所と、話し手が話さ
ずに雑音が録音されている箇所の識別が視覚的に可能と
なった。さらに話し手が代わり、話し手の声の周波数が
変わったことが認識可能となり、迅速に希望する再生箇
所を探すことが可能となった。
【0041】請求項5による発明では、周波数が変化し
た場合に表示位置を変えることにより、話し手の会話の
変化や、話し手の変化が視覚的に認識可能となり、迅速
に希望する再生箇所を探すことが可能となった。請求項
6による発明では、周波数が変化した場合に表示位置を
変え、また周波数に対応して音声を表す画像情報の色や
形を変えることにより、さらに話し手の会話の変化や、
話し手の変化が視覚的に認識可能となり、迅速に希望す
る再生箇所を探すことが可能となった。
【0042】請求項7による発明では、無音部および周
波数の変化を検出した場合には、表示位置を変えること
により、話し手の会話の変化や、話し手の変化が視覚的
に認識可能となり、迅速に希望する再生箇所を探すこと
が可能となった。請求項8による発明では、複数の音声
情報の中から、所定の周波数成分を含む音声情報を出力
する出力手段を有するように構成したことにより、たと
えば特定の話し手が発声している間の音声を再生するこ
とが可能となった。
【0043】請求項9による発明では、複数の音声情報
の中から、所定の周波数成分を含む音声情報を出力する
出力手段を有するように構成したことにより、たとえば
特定の話し手より発せられた音声だけを表示手段に表示
する事が可能となった。請求項10による発明では、選
択手段を設け、前記表示手段に表示された画像情報を選
択することにより、音声情報を選択可能に構成した。
【0044】このことにより必要な記録情報を迅速に識
別し、選択することが可能となった。請求項11による
発明では、周波数成分を検出するための所定時間を少な
くとも0.3秒以上となるように構成した。このことに
より最低でも音声として人間が認識できる音の長さと周
波数を検出することにより、複数の人の声や、人の声と
雑音などを識別可能とした。
【0045】請求項12による発明では、データの圧縮
で使用する離散的コサイン変換を使用して、音声情報の
圧縮を行い、且つ周波数の検出まで行うことにより、新
たに周波数分析を行う必要がなくなり、処理の効率が向
上した。請求項13による発明では、画像の圧縮で使用
する離散的コサイン変換を利用して音声の周波数成分を
検出することにより、音声の周波数を検出するために新
たなソフトウェアやハードウェアを追加しなくてもよ
い。
【0046】請求項14による発明では、時刻を併せて
表示することにより、さらに迅速に目的とする音声情報
の検索が可能となった。請求項15による発明では、画
像情報に対応した音声情報を再生するのに必要な時間だ
け、前記画像情報を表示するので、自然な音声と映像の
再生が可能となった。
【図面の簡単な説明】
【図1】本発明に係わる音声処理装置の概略図である。
【図2】本発明に係わる音声処理装置の回路ブロック図
である。
【図3】本発明の音声処理装置の表示部の概略図であ
る。
【図4】音声生波形と生波形をボーグラフにした図であ
る。
【図5】パーソナルコンピュータの表示をあらわした図
である。
【図6】本発明の音声処理装置の表示部において、無音
部を53e、53fのように点線または色を変えた表示
をあらわした図である。
【符号の説明】
1…音声処理装置本体 2…LCD 3…マイク 4…イヤホン端子 5…ストロボ 6…ファインダー 7…撮影レンズ 8…レリーズ釦 9…録音釦 10…電源スイッチ 11…スイッチ釦 12…スピーカー 40…音声波形

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 音声情報の入力手段と、前記音声情報を
    記録する記録手段と、前記画像情報を表示する表示手段
    と、前記音声情報を画像情報に変換する変換手段とを設
    け、 前記表示手段は、前記表示手段の縦および横方向を時間
    軸とし、どちらか一方の時間軸の単位を他の一方の時間
    軸の単位より長くしたことを特長とする音声処理装置。
  2. 【請求項2】 音声情報の入力手段と、前記音声情報を
    記録する記録手段と、前記音声情報を画像情報に変換す
    る変換手段と、前記画像情報を表示する表示手段と、所
    定時間以上、所定レベル以上の音声が無い無音部を検出
    する周波数検出手段を設け、 前記周波数検出手段によって検出された無音部より以前
    に記録された前記音声情報より作られた第1の画像情報
    と、無音部より以後に記録された前記音声情報より作ら
    れた画像情報とを分離して、前記表示手段に表示するこ
    とを特長とする音声処理装置。
  3. 【請求項3】 音声情報の入力手段と、前記音声情報を
    記録する記録手段と、前記音声情報を画像情報に変換す
    る変換手段と、前記画像情報を表示する表示手段と、所
    定時間以上、所定レベル以上の音声が無い無音部を検出
    する無音部検出手段とを設け、 前記無音部と非前記無音部で前記画像情報が異なること
    を特長とする音声処理装置。
  4. 【請求項4】 音声情報の入力手段と、前記音声情報を
    記録する記録手段と、表示手段と、前記音声情報の所定
    時間内での周波数成分を検出する周波数検出手段と、前
    記音声情報を前記周波数成分に対応した画像情報に変換
    する変換手段とを設け、 前記画像情報を前記表示手段に表示することを特長とす
    る音声処理装置。
  5. 【請求項5】 音声情報の入力手段と、前記音声情報を
    記録する記録手段と、表示手段と、前記音声情報の所定
    時間内での周波数成分を検出する周波数検出手段と、前
    記音声情報を画像情報に変換する変換手段とを設け、 時間の経過に伴って記録された第1の音声情報の周波数
    成分と、その後に記録された第2の音声情報の周波数成
    分の差が所定値以上であった場合に、前記第1の音声情
    報より作られた画像情報と、前記第2の音声情報より作
    られた画像情報を分離して表示することを特長とする音
    声処理装置。
  6. 【請求項6】 音声情報の入力手段と、前記音声情報を
    記録する記録手段と、前記画像情報を表示する表示手段
    と、前記音声情報の所定時間内での周波数成分を検出す
    る周波数検出手段と、前記音声情報を前記周波数成分に
    対応した画像情報に変換する変換手段とを設け、 時間の経過に伴って記録された第1の音声情報の周波数
    成分と、その後に記録された第2の音声情報の周波数成
    分の差が所定値以上であった場合に、前記第1の音声情
    報より作られた画像情報と、前記第2の音声情報より作
    られた画像情報を分離して表示することを特長とする音
    声処理装置。
  7. 【請求項7】 音声情報の入力手段と、前記音声情報を
    記録する記録手段と、表示手段と、前記音声情報の所定
    時間内での周波数成分を検出する周波数検出手段と、所
    定時間以上、所定レベル以上の音声が無い無音部を検出
    する無音部検出手段と、前記音声情報を画像情報に変換
    する変換手段とを設け、 時間の経過に伴って記録された第1の音声情報の周波数
    成分と、その後に記録された第2の音声情報の周波数成
    分の差が所定値以上であった場合、および前記第1の音
    声情報と前記第2の音声情報との間に前記無音部が前記
    周波数検出手段により検出された場合には、 前記第1の音声情報より作られた画像情報と、前記第2
    の音声情報より作られた画像情報を分離して表示するこ
    とを特長とする音声処理装置。
  8. 【請求項8】 音声情報の入力手段と、前記音声情報を
    記録する記録手段と、前記音声情報の所定時間内での周
    波数成分を検出する周波数検出手段と、複数の音声情報
    の中から、所定の周波数成分を含む音声情報を出力する
    出力手段とを有することを特長とする音声処理装置。
  9. 【請求項9】 音声情報の入力手段と、前記音声情報を
    記録する記録手段と、表示手段と、音声情報を画像情報
    に変換する変換手段と、前記音声情報の所定時間内での
    周波数成分を検出する周波数検出手段とを有し、 複数の音声情報の中から、前記周波数成分が所定値以内
    のものより作られた画像情報だけを表示することを特長
    とする音声処理装置。
  10. 【請求項10】 請求項1乃至7に記載の音声処理装置
    において、 さらに選択手段を設け、 前記表示手段に表示された画像情報を選択することによ
    り、音声情報を選択可能にしたことを特長とする音声処
    理装置。
  11. 【請求項11】 請求項4乃至9に記載の音声処理装置
    において、 周波数成分を検出するための所定時間を少なくとも0.
    3秒以上としたことを特長とする音声処理装置。
  12. 【請求項12】 請求項4乃至9に記載の音声処理装置
    において、 音声情報を圧縮するための離散的コサイン変換手段を用
    いた圧縮手段を設け、 前記周波数検出手段には離散的コサイン変換手段を使用
    することを特長とする音声処理装置。
  13. 【請求項13】音声情報の入力手段と、前記音声情報を
    記録する音声記録手段と、表示手段と、前記音声情報の
    所定時間内での周波数成分を検出する周波数検出手段
    と、前記音声情報を前記周波数成分に対応した第1の画
    像情報に変換する変換手段と、被写体像を第2の画像情
    報に変換する撮像手段と、前記第2の画像情報を離散的
    コサイン変換を用いて圧縮手段と、前記圧縮情報を記録
    する映像記録手段とを有し、 前記周波数検出手段は離散的コサイン変換を使用するこ
    とを特長とする音声処理装置。
  14. 【請求項14】 請求項1乃至7に記載の音声処理装置
    において、 時刻計測手段(時計)を設け、 前記記録手段に前記時刻を記録するとともに、前記表示
    手段には前記画像情報と、前記時刻を表示することを特
    長とする音声処理装置。
  15. 【請求項15】 画像情報を再生する画像再生手段と、
    前記画像情報に対応した音声情報を再生する音声再生手
    段とを有する音声処理装置に置いて、 前記画像情報に対応した音声情報を再生するのに必要な
    時間だけ、前記画像情報を表示することを特長とする音
    声処理装置。
JP7244222A 1995-09-22 1995-09-22 音声処理装置 Pending JPH0990973A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP7244222A JPH0990973A (ja) 1995-09-22 1995-09-22 音声処理装置
US08/715,382 US5974386A (en) 1995-09-22 1996-09-12 Timeline display of sound characteristics with thumbnail video
TW085111206A TW439384B (en) 1995-09-22 1996-09-13 Sound processing apparatus
KR1019960041017A KR970019552A (ko) 1995-09-22 1996-09-20 음성 처리 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7244222A JPH0990973A (ja) 1995-09-22 1995-09-22 音声処理装置

Publications (1)

Publication Number Publication Date
JPH0990973A true JPH0990973A (ja) 1997-04-04

Family

ID=17115569

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7244222A Pending JPH0990973A (ja) 1995-09-22 1995-09-22 音声処理装置

Country Status (4)

Country Link
US (1) US5974386A (ja)
JP (1) JPH0990973A (ja)
KR (1) KR970019552A (ja)
TW (1) TW439384B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8145039B2 (en) 1997-02-10 2012-03-27 Nikon Corporation Information processing apparatus and method

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0990973A (ja) * 1995-09-22 1997-04-04 Nikon Corp 音声処理装置
JPH1056609A (ja) * 1996-04-15 1998-02-24 Canon Inc 画像記録方法、通信方法、画像記録装置、通信装置及び媒体
JP4456675B2 (ja) * 1996-04-17 2010-04-28 株式会社日立製作所 映像記録再生装置及び映像記録再生方法
JP3832089B2 (ja) * 1997-05-26 2006-10-11 セイコーエプソン株式会社 デジタルカメラおよび印刷システム
JP3894376B2 (ja) 1996-05-24 2007-03-22 株式会社ニコン 情報処理装置
JP4397054B2 (ja) * 1996-06-13 2010-01-13 株式会社ニコン 情報入力装置
US20050158015A1 (en) * 1996-10-03 2005-07-21 Nikon Corporation Information processing apparatus, information processing method and recording medium for electronic equipment including an electronic camera
US20010038719A1 (en) * 1996-10-14 2001-11-08 Nikon Corporation Information processing apparatus
US6567120B1 (en) * 1996-10-14 2003-05-20 Nikon Corporation Information processing apparatus having a photographic mode and a memo input mode
JP4408456B2 (ja) * 1997-02-14 2010-02-03 株式会社ニコン 情報処理装置
JP4429394B2 (ja) * 1997-06-17 2010-03-10 株式会社ニコン 情報処理装置および記録媒体
US5973734A (en) 1997-07-09 1999-10-26 Flashpoint Technology, Inc. Method and apparatus for correcting aspect ratio in a camera graphical user interface
US6313877B1 (en) * 1997-08-29 2001-11-06 Flashpoint Technology, Inc. Method and system for automatically managing display formats for a peripheral display coupled to a digital imaging device
US7239405B2 (en) * 1998-03-02 2007-07-03 Minolta Co., Ltd. Image processing system for outputting scanned images in the specified sequences
US6317141B1 (en) 1998-12-31 2001-11-13 Flashpoint Technology, Inc. Method and apparatus for editing heterogeneous media objects in a digital imaging device
US6462778B1 (en) * 1999-02-26 2002-10-08 Sony Corporation Methods and apparatus for associating descriptive data with digital image files
EP1077433A1 (en) 1999-08-19 2001-02-21 Sarnoff Corporation Data aquisition and transfer
USD430169S (en) * 1999-12-15 2000-08-29 Advanced Communication Design, Inc. Interactive multimedia control panel with speakers
JP2002157112A (ja) * 2000-11-20 2002-05-31 Teac Corp 音声情報変換装置
JP4297073B2 (ja) * 2005-04-01 2009-07-15 ソニー株式会社 画像生成装置、これらの装置の処理方法およびその方法をコンピュータに実行させるプログラム
JP4437548B2 (ja) * 2005-12-09 2010-03-24 ソニー株式会社 音楽コンテンツ表示装置、音楽コンテンツ表示方法及び音楽コンテンツ表示プログラム
JP4894252B2 (ja) * 2005-12-09 2012-03-14 ソニー株式会社 データ表示装置、データ表示方法及びデータ表示プログラム
US8375283B2 (en) * 2006-06-20 2013-02-12 Nokia Corporation System, device, method, and computer program product for annotating media files
US9224145B1 (en) 2006-08-30 2015-12-29 Qurio Holdings, Inc. Venue based digital rights using capture device with digital watermarking capability
CN106486147A (zh) * 2015-08-26 2017-03-08 华为终端(东莞)有限公司 指向性录音方法、装置及录音设备
US10564924B1 (en) * 2015-09-30 2020-02-18 Amazon Technologies, Inc. Navigating metadata in long form content
CN110381365A (zh) * 2019-07-02 2019-10-25 北京字节跳动网络技术有限公司 视频抽帧方法、装置及电子设备

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3439598A (en) * 1966-05-25 1969-04-22 Weitzner D Camera and sound recording device
US3639691A (en) * 1969-05-09 1972-02-01 Perception Technology Corp Characterizing audio signals
US5566134A (en) * 1972-05-04 1996-10-15 Lockheed Martin Corporation Digital computer algorithm for processing sonar signals
US4015087A (en) * 1975-11-18 1977-03-29 Center For Communications Research, Inc. Spectrograph apparatus for analyzing and displaying speech signals
DE2843180C3 (de) * 1978-10-04 1981-11-05 Robert Bosch Gmbh, 7000 Stuttgart Verfahren und Vorrichtung zur akustisch-optischen Umwandlung von Signalen
CA1322595C (en) * 1988-01-22 1993-09-28 Andrew Staffer Synchronization of recordings
US5297289A (en) * 1989-10-31 1994-03-22 Rockwell International Corporation System which cooperatively uses a systolic array processor and auxiliary processor for pixel signal enhancement
DE69124360T2 (de) * 1991-01-16 1997-05-15 Ricos Kk Vorrichtung zur Anzeige von Gesangseigenschaften
US5303327A (en) * 1991-07-02 1994-04-12 Duke University Communication test system
US5287789A (en) * 1991-12-06 1994-02-22 Zimmerman Thomas G Music training apparatus
JP3091291B2 (ja) * 1991-12-20 2000-09-25 株式会社シーエスケイ 動画編集処理方法
JPH05173554A (ja) * 1991-12-25 1993-07-13 Casio Comput Co Ltd 表示装置付自動演奏装置
US5583652A (en) * 1994-04-28 1996-12-10 International Business Machines Corporation Synchronized, variable-speed playback of digitally recorded audio and video
JPH0830430A (ja) * 1994-07-19 1996-02-02 Matsushita Electric Ind Co Ltd 表示装置
KR960018988A (ko) * 1994-11-07 1996-06-17 엠, 케이. 영 음향 보조 영상 처리 방법 및 장치
JPH0990973A (ja) * 1995-09-22 1997-04-04 Nikon Corp 音声処理装置
US5878292A (en) * 1996-08-29 1999-03-02 Eastman Kodak Company Image-audio print, method of making and player for using

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8145039B2 (en) 1997-02-10 2012-03-27 Nikon Corporation Information processing apparatus and method

Also Published As

Publication number Publication date
US5974386A (en) 1999-10-26
KR970019552A (ko) 1997-04-30
TW439384B (en) 2001-06-07

Similar Documents

Publication Publication Date Title
JPH0990973A (ja) 音声処理装置
JP5069687B2 (ja) コンテンツ情報の提供を受けたユーザの感情状態を分析するための方法及び装置
CN102906818B (zh) 存储视频摘要的方法和显示相应于视频摘要的视频帧的系统
TW583877B (en) Synchronization of music and images in a camera with audio capabilities
KR20140114238A (ko) 오디오와 결합된 이미지 표시 방법
JP2013106298A (ja) 撮像制御装置、撮像制御方法、撮像制御方法のプログラムおよび撮像装置
KR20130134195A (ko) 오디오 스트림을 고속 시각화시키는 전자 장치 및 방법
JP4491700B2 (ja) 音響検索処理方法、音響情報検索装置、音響情報蓄積方法、音響情報蓄積装置および音響映像検索処理方法、音響映像情報検索装置、音響映像情報蓄積方法、音響映像情報蓄積装置
EP1347455A2 (en) Contents recording/playback apparatus and contents edit method
KR20100002090A (ko) 전자 기기, 영상 콘텐츠 편집 방법 및 프로그램
JP2010237761A (ja) 電子機器
JP2019068300A (ja) ダイジェストデータ生成装置、ダイジェストデータ再生装置、ダイジェストデータ生成システム、ダイジェストデータ生成方法及びプログラム
US8391544B2 (en) Image processing apparatus and method for processing image
JP4812733B2 (ja) 情報編集装置、情報編集方法、情報編集プログラムおよびそのプログラムを記録した記録媒体
JP4407198B2 (ja) 記録再生装置、再生装置、記録再生方法および再生方法
JP5039020B2 (ja) 電子機器および映像コンテンツ情報表示方法
JP2010200079A (ja) 撮影制御装置
JP2000222417A (ja) 画像ファイリング装置
JP2008140527A (ja) 音楽再生装置、およびこれを備えたカメラ
JP6635093B2 (ja) 画像記録装置、画像記録方法及びプログラム
JP2020034823A (ja) ファシリテーション支援プログラム、ファシリテーション支援装置およびファシリテーション支援方法
JP6674236B2 (ja) 記録再生装置及び記録再生方法
KR100575635B1 (ko) 유에스비카메라를이용한영상처리장치및방법
JP2004215123A (ja) 画像再生装置、画像再生方法及び画像再生プログラム
JP2002247489A (ja) 記録装置、記録方法、記録プログラム、記録再生装置、記録再生プログラム、記録媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040518

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040622

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041109