JP2005107617A5 - - Google Patents

Download PDF

Info

Publication number
JP2005107617A5
JP2005107617A5 JP2003336789A JP2003336789A JP2005107617A5 JP 2005107617 A5 JP2005107617 A5 JP 2005107617A5 JP 2003336789 A JP2003336789 A JP 2003336789A JP 2003336789 A JP2003336789 A JP 2003336789A JP 2005107617 A5 JP2005107617 A5 JP 2005107617A5
Authority
JP
Japan
Prior art keywords
search
data
recording
audio
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003336789A
Other languages
English (en)
Other versions
JP2005107617A (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2003336789A priority Critical patent/JP2005107617A/ja
Priority claimed from JP2003336789A external-priority patent/JP2005107617A/ja
Publication of JP2005107617A publication Critical patent/JP2005107617A/ja
Publication of JP2005107617A5 publication Critical patent/JP2005107617A5/ja
Pending legal-status Critical Current

Links

Description

記録再生装置
この発明は、録音済みの音声ファイルの検索を音声入力により行なうことで、短時間で目的の場所見つけ出し、そこから自動的再生することができる記録再生装置に関する。
従来、記録再生装置には、音声入力により音声キーワードを規定する音声キーワード規定手段と、この音声キーワード規定手段により規定された音声キーワードと実質的に一致する音声信号を記録媒体から検索する検索部と、一致した音声信号を含む所定範囲から、音声信号を再生する再生手段とを備え、音声信号を記録した記録媒体から所望の部分を、所定のキーワードに基づいて検索できるようにしたものがある(例えば、特許文献1参照)。
特開平5−334861号公報(第1−3頁、図1、2)
長時間の会議などを録音した場合、記録されたデータから聞きたい場所を探すにはデータを再生し聞かなければならないので大変手間がかかる。録音中に「検索を容易にするための目印」をデータに埋め込むことは可能ではあるが、この操作を行なうユーザは少ない。行ったとしても、目印を埋め込む操作は注目すべき発言を聞いたときに行われるので、目印は注目の発言の後ろに記録される。そのため、ユーザが注目の発言を聞くには、再生位置を目印のところに移動させたあと、少し前に戻す操作をしなければならない。希望の場所の先に進み過ぎたり、戻り過ぎたりして、この操作を繰り返さなければならないのは、ユーザにとってとても面倒でありストレスのたまる作業である。
この発明は、このような課題に鑑みてなされたものであり、録音済みの音声ファイルの検索を音声入力により行なうことで、短時間で目的の場所見つけ出して自動的にそこから再生を開始し、その見つけた場所が必要な場合、その見つけた目的の場所に呼出し可能なマークを付け、少し前に戻す操作をすることなく再生することができる記録再生装置を提供することを目的とする。
この発明の記録再生装置は、マイクから入力された音声をデータとして録音する録音部と、上記録音部で録音した音声データを再生する音声再生部と、上記録音部で録音したデータの特定部分をマイクから入力された音声を検索鍵として探し出す検索機能を持つ検索部と、上記検索により見つかった場所にマークを付加するマーク付加手段と、上記マークが付加された場所を呼び出すことができるマーク付加位置呼出し手段とを有し、上記マークが付加された場所を呼び出すことにより、少し前に戻す操作をすることなく検索により見つかった場所から自動再生するようにしたものである。
この発明によれば、(1)検索鍵を音声で入力することで、録音済みの音声ファイルの検索を行い、該当する位置を見つけ出し、自動的にそこから再生を開始することが可能になる。
(2)録音中に「検索を容易にするための目印」を付ける操作が不要であるばかりか、目印を付け忘れた場合でも手軽に検索が可能になる。
(3)録音中に目印を付ける操作を行うと、その操作音も雑音として録音されてしまう恐れがあるが、これも防ぐことができる。
(4)さらに、検索により見つけた場所に簡単操作でマークを付加することを可能にしたので、次回以降はマークの位置にジャンプする機能により簡単にその位置を呼び出すことができる。
(5)録音済みの音声ファイルに対してだけでなく、録音前にあらかじめ予想できるキーワードを音声で入力しICレコーダに記憶させておくことで、録音と同時進行でキーワード検索を実行し、録音が終わったらすぐに該当位置を確認できるようになり、議事録の作成や聞き返したい箇所の検索が容易にできる。
(6)また、この発明の構成をICレコーダなどの録音機器に持たせることで、録音したデータをパーソナルコンピュータなどの他の機器に移す必要もなくなる。
この発明の実施形態について図面を用いて説明する。図1はこの発明をICレコーダに適用した場合の記録再生装置の構成例を示し、図2は同装置のシステム構成を示すブロック図である。
(システム構成)
図1において、 CPU101は中央処理装置であり、バス102を介してROM130に記録された命令コードを読み込み、処理を実行すると共に、バス102を介して各種処理部、各種デバイスを制御する。バス102には、操作部103と接続されている入力処理部112と、データ記録装置114と接続されているファイル処理部113と、データ圧縮処理部127、データ伸張処理部128、データ比較処理部129等の処理部と、マイク121と接続されているA/Dコンバータ122と、スピーカー123と接続されているD/Aコンバータ124と、RAM117、表示部126を制御する表示制御部125と、時間計測部131等が接続されている。
操作部103は、RECキー104、PLAYキー105、STOPキー106、SEARCHキー107、ENNTER108キー、CANSELキー109、NEXTキー110、PREVキー111等のキー有する。データ記録装置114は、フラッシュメモリやそれを用いたメモリカード、またはハードディスクドライブなどの高容量メモリであり、音声ファイル115、データベース領域116等を有する。RAM117は、PCMデータ領域118、圧縮データ領域119、検索鍵領域120等を有する。
図2について、この記録再生装置は、上記図1の装置により従来ICレコーダと同様に録音及び再生が可能に構成された録音部1及び音声再生部2と、音声入力により音声データの検索が可能な検索部3と、検索して見つかった場所にマークを付加するマーク付加手段4と、マーク付加位置を呼出し再生させるマーク付加位置呼出し手段5とを有する構成となっている。
以下に、この記録再生装置の各部の構成及び動作を処理の流れと共に説明する。
(録音部)
録音部1の録音時の処理の流れの一例について述べる。
ユーザが操作部103にあるRECキー104を押下すると、入力処理部112がそれを検知し、CPU101に通知する。CPU101は、ファイル処理部113にファイル記録を指示する。ファイル処理部113は、データ記録装置114に音声ファイル115を作成する。
CPU101は、A/Dコンバータ122にマイク121から入力されるアナログ音声信号をデジタル信号に変換することを指示する。A/Dコンバータ122は、マイク121から入力されるアナログ信号を一定周期ごとに変換したデジタル信号をRAM117のPCMデータ領域118に書き込み、書き込んだことをCPU101に通知する。
CPU101は、データ圧縮処理部127にPCMデータ領域118のデータの圧縮を指示する。データ圧縮処理部127は、圧縮したデータをRAM117の圧縮データ領域119に書き込む。CPU101は、ファイル処理部113に圧縮データ領域119のデータを音声ファイル115に書き込むことを指示する。ファイル処理部113は、書き込みが完了したことをCPU101に通知する。
ユーザが操作部103にあるSTOPキー106を押下するまで、上記録音時の処理の流れを繰り返す。
ユーザがSTOPキー106を押下すると、入力処理部112がそれを検知し、CPU101に通知する。CPU101は、ファイル処理部113に音声ファイル115への書き込みの停止を、データ圧縮処理部127に圧縮処理の停止を、A/Dコンバータ122にデジタル信号への変換の停止を、指示する。
(音声再生部)
音声再生部2の音声ファイルを再生する処理の流れの一例について述べる。
ユーザが操作部103にあるPLAYキー105を押下すると、入力処理部112がそれを検知し、CPU101に通知する。CPU101は、ファイル処理部113にデータ記録装置114上の音声ファイル115の読み出しを指示する。ファイル処理部113は、システムで規定された量のデータを読み出し、RAM117上の圧縮データ領域119に書き込み、CPU101に通知する。CPU101は、データ伸長処理部128に圧縮データ領域119のデータの伸長を指示する。データ伸長処理部118は、伸長したデータをRAM117上のPCMデータ領域118に書き込み、CPU101に通知する。
CPU101は、D/Aコンバータ124に、PCMデータ領域118のデジタルデータをアナログデータに変換し、スピーカー123から出力することを指示する。D/Aコンバータ124は、変換したデータを出力したことをCPU101に通知する。
ユーザがSTOPキー106を押下するまで、上記音声ファイルを再生する処理の流れを繰り返す。
ユーザがSTOPキー106を押下すると、入力処理部112がそれを検知し、CPU101に通知する。CPU101は、ファイル処理部113に音声ファイル115からの読み出しの停止を、データ伸長処理部128に伸長処理の停止を、A/Dコンバータ124にアナログ信号への変換の停止を、指示する。
(検索部)
この発明の主である検索部3における音声による検索処理の流れについて、図3を用いて述べる。この実施形態では、ユーザがSEARCHキー107を押下しながら、マイク121に向かって検索鍵をしゃべり、SEARCHキー107を放すことで検索機能が実行されるようにしてある。
(検索鍵データ処理S201)ユーザが操作部103にあるSEARCHキー107を押下すると、入力処理部112がそれを検知する。SEARCHキー107が一定時間、例えば、500msec、押されたままであればCPU101に通知する。CPU101は、表示制御部125にユーザ操作法を説明するメッセージ、例えば、「探したい言葉をマイクに向かってお話ください」を表示するように指示する。表示制御部125は画面を作成し、表示部126に表示する。
さらに、CPU101は、A/Dコンバータ118にマイク117からのアナログ信号をデジタル信号に変換することを指示する。A/Dコンバータ122は、マイク121から入力されるアナログ信号を一定周期ごとに変換したデジタル信号をRAM117のPCMデータ領域118に書き込み、書き込んだことをCPU101に通知する。CPU101は、PCMデータ領域118に書き込まれたデータを同じくRAM117上にある検索鍵領域120に書き込む。
ユーザがSEARCHキー107を放すまで(S202)、上記S201、S202の処理を繰り返す。
ユーザがSEARCHキー107を放すと、入力処理部112がそれを検知し、CPU101に通知する。CPU101は、A/Dコンバータ122にデジタル信号への変換の停止を指示する。
さらに、CPU101は、ファイルの終端になっていないことを条件に(S203)、ファイル処理部113にデータ記録装置114上の音声ファイル115の読み出し処理を、データ比較処理部129にデータ比較処理の開始を指示する。
(音声ファイル読み出し処理S204)ファイル処理部113は、システムで規定された量のデータを読み出し、RAM117上の圧縮データ領域119に書き込み、CPU101に通知する。CPU101は、データ伸長処理部128に圧縮データ領域119のデータの伸長を指示する。データ伸長処理部118は、伸長したデータをRAM117上のPCMデータ領域118に書き込み、CPU101に通知する。
データ比較処理部129は、検索鍵領域120とPCMデータ領域118のデータを比較する(S205)。(この発明では、データ比較処理部129の比較アルゴリズムについては規定しない。)データ比較処理部129は検索鍵と一致すると判断したときにCPU101に一致したことを、一致した場所を特定する情報と共に通知する。
データ比較処理部129から一致したと通知されるか(S205)、音声ファイル115の終端に達するまで(S203)、上記S203〜S205の処理を繰り返す。
CPU101は、データ比較処理部129から一致した(検索鍵が見つかった)と通知されると、ファイル処理部113に音声ファイル115からの読み出しの停止を、データ伸長処理部128に伸長処理の停止を、データ比較処理部129にデータ比較処理の停止を指示する。
(マーク付加手段・マーク付加位置呼出手段)
この実施形態では、検索鍵が見つかった場合、その位置から自動再生を開始し、5秒間表示部126に「この位置にマークを付けますか?ENTER/CANCEL」とメッセージを表示し、表示している間にユーザがENTERキー108を押下したら検索鍵が見つかった位置にマークを付加するものとする。
検索鍵が見つかったときの、CPU101の処理の流れの一例について図4を用いて述べる。
CPU101は、時間計測部131に5秒間の時間計測を指示する(S301)。
(音声ファイル再生処理S302)CPU101は、表示制御部125に「この位置にマークを付けますか?ENTER/CANCEL」とメッセージを表示することを指示する。表示制御部125は画面を構成し、表示部126に表示する。ファイル処理部113に一致した位置からの読み出しを指示する。ファイル処理部113は、システムで規定された量のデータを読み出し、RAM117上の圧縮データ領域119に書き込み、CPU101に通知する。
CPU101は、データ伸長処理部128に圧縮データ領域119のデータの伸長を指示する。データ伸長処理部128は伸長したデータをRAM117上のPCMデータ領域118に書き込み、CPU101に通知する。
CPU101はD/Aコンバータ124に、PCMデータ領域118のデジタルデータをアナログデータに変換し、スピーカー123から出力することを指示する。D/Aコンバータ124は変換したデータを出力したことをCPU101に通知する。検索鍵が見つかった位置からの録音がスピーカー123から自動再生される。
ユーザが操作部103にあるENTERキー108を押下すると(S303)、入力処理部112がそれを検出し、CPU101に通知する。CPU101は、ファイル処理部113に検索鍵と一致した場所にマークを付加することを指示する。ファイル処理部113は、データ記録装置114上のデータベース領域116に当該音声ファイル115に関する情報として、検索鍵と一致した場所のアドレス情報を書き込む(S304)。これにより、検索鍵と一致した発言の前にインデックスとしてのマークが付く。
CPU101は、表示制御部125にマークの付加が完了したことをユーザに通知するためのメッセージ(例えば「マークが付加されました」)の表示を指示する。表示制御部125は、画面を構成し、表示部126に表示する(S305)。
このようにして、検索鍵を音声で入力し、一致した場所にマークを付加したので、ユーザがこの音声ファイルを再生中に、操作部103にあるNEXTキー110またはPREVキー111を押下することで、簡単にマーク位置を呼び出すことができるようになる。つまり、1度だけ音声で検索すれば、次回以降は簡単操作で希望の場所を呼び出すことができるようになる。
以上、検索鍵と一致すると判断された場所が、ユーザの希望するものであった場合について述べたが、希望するものでなかった場合、ユーザは操作部にあるCANCELキー109を押下するか(S306)、何も操作をせず5秒経過するのを待てばよい(S607)。
ユーザがENTERキー108を押下しないまま、時間計測部131から5秒経過したことがCPU101に通知された場合は、CPU101は表示制御部125にメッセージの表示消去を指示する。また、ユーザがENTERキー108ではなくCANCELキー109を押下した場合も、CPU101は表示制御部125にメッセージの表示消去を指示する。表示制御部125はメッセージが消去された画面を構成し、表示部126に表示する。
以上、検索鍵と一致する部分が見つかった場合の処理について述べたが、データ比較処理部129から一致したことの通知が無いままファイルの終端まで達したとき、CPU101は表示制御部125に一致する部分が無かったことをユーザに知らせるためのメッセージ(例えば「見つかりませんでした」)を表示することを指示する。表示制御部125は画面を作成し、表示部126に表示する。
(変形例)
上記実施形態では、検索鍵と一致する最初の位置で検索機能を停止しているが、ユーザ操作でそれ以降に一致する個所がないか、検索の再開を行うこともできる。例えば、最初に一致すると判断した位置を再生中にユーザにより操作部103にあるNEXTキー110を押下されると、現在の再生位置より後方に検索鍵に一致する場所が無いか検索を開始しPREVキー111が押下されたら、現在の再生位置より前方に検索鍵に一致する場所が無いか検索を開始する。あるいは、音声ファイル115全体に対して検索を行い、一致すると判断した個所を一覧表示することもできる。
一覧表示する場合、データ比較処理部129に一致の度合いを評価する機能を設けることにより、その値を合致率として併記したり、合致率の高い順に整列したりして表示することもできる。合致率がある値を下回るものについては表示しないようにユーザが設定できてもよい。
図5に、音声ファイル115全体に対して検索を行ったときの結果画面表示の一例として、時間と一致の度合(%)の画面を示す。この画面を見て、一致度の高い順にマーク位置を呼び出して自動再生することができる。また、一致度の低いマークを削除することができる。
上記例は録音済みのデータに対して、音声入力により検索を行うものであったが、録音前に予め複数のキーワードを音声入力し、それをICレコーダが記憶する。録音を開始すると、記憶しているキーワードと録音している音声を比較し、一致した場所にマークを付加する。ユーザは録音終了後に、操作部103にあるNEXTキー110、PREVキー111を押下することで、マーク位置つまりキーワードに一致したと判断された場所を簡単に探すことができる。マークがつけられていた場所が希望の場所でなかった場合は、マーク削除操作により簡単に取り除くことができる。
会議を録音する際などは、予め議題が分かっていれば、議題をキーワードとして記憶させておくことで、議題の変わり目にマークが付加されることが期待でき、あとで議事録を作成する際に便利である。また複数の講演者が登場する講演会においては、講演者名をキーワードとして記憶させておくことで、講演者の変わり目にマークが付加されることが期待でき、あとで講演を聞く際に、希望の講演者の講演を探しやすくなる。
この発明の記録再生装置(例)の構成図である。 同装置のシステム構成を示すブロック図である。 音声ファイル再生処理の流れの一例を示すフロー図である。 検索鍵が見つかったときの処理の流れの一例を示すフロー図である。 ファイル全体に対して検索を行なったときの結果表示画面の一例を示す図である。
符号の説明
101…CPU(中央処理装置) 102…バス
103…操作部 104…RECキー
105…PLAYキー 106…STOPキー
107…SEARCHキー 108…ENTERキー
109…CANCERUキー 110…NEXTキー
111…PREVキー 112…入力処理部
113…ファイル処理部 114…データ記録装置
115…音声ファイル 116…データベース領域
117…RAM 118…PCMデータ領域
119…圧縮データ領域 120…検索鍵領域
121…マイク 122…A/Dコンバータ
123…スピーカー 124…D/Aコンバータ
125…表示制御部 126…表示部
127…データ圧縮処理部 128…データ伸張処理部
129…データ比較処理部 130…ROM
131…時間計測部

Claims (4)

  1. 少なくとも音声信号が入力される入力手段と、
    音声信号を音声データとして記憶する記憶手段と、
    上記記憶手段に記憶された音声データを再生する再生手段と、
    音声信号に基づいて上記記憶手段に記憶された音声データの特定の音声部分を検索する検索手段と、
    録音操作がなされたときには、上記入力手段に入力される音声信号を音声データとして上記記憶手段に記憶させ、検索操作がなされたときには、上記入力手段に入力される音声信号に基づいて、上記検索手段に上記記憶手段に記憶された音声データの特定の音声部分を検索させるように制御を行う制御手段と、
    を備える記録再生装置。
  2. 上記制御手段は、上記特定の音声部分からの再生を開始して所定時間内に所定操作がなされたときに、上記特定の音声部分の位置情報を上記記憶手段に記憶させるように制御を行うことを特徴とする
    請求項1記載の記録再生装置。
  3. 上記制御手段は、上記特定の音声部分からの再生を上記再生手段に自動的に行わせるように制御を行うことを特徴とする
    請求項2記載の記録再生装置。
  4. 上記制御手段は、上記特定の音声部分の再生中に上記所定の操作とは異なる他の操作がなされたときに、上記検索手段によって上記特定の音声部分とは異なる他の特定の音声部分を検索させ、上記検索手段の検索結果に基づいて上記再生手段に上記他の特定の音声部分からの再生を行わせるように制御を行うことを特徴とする
    請求項2記載の記録再生装置。
JP2003336789A 2003-09-29 2003-09-29 音声データ検索装置。 Pending JP2005107617A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003336789A JP2005107617A (ja) 2003-09-29 2003-09-29 音声データ検索装置。

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003336789A JP2005107617A (ja) 2003-09-29 2003-09-29 音声データ検索装置。

Publications (2)

Publication Number Publication Date
JP2005107617A JP2005107617A (ja) 2005-04-21
JP2005107617A5 true JP2005107617A5 (ja) 2006-10-19

Family

ID=34532788

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003336789A Pending JP2005107617A (ja) 2003-09-29 2003-09-29 音声データ検索装置。

Country Status (1)

Country Link
JP (1) JP2005107617A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100771249B1 (ko) 2006-07-28 2007-10-29 (주)동원에스앤에스 다채널 입력보드를 이용한 파형정보 분석 시스템
CN103970793B (zh) * 2013-02-04 2020-03-03 腾讯科技(深圳)有限公司 信息查询方法、客户端及服务器
JP6128146B2 (ja) 2015-02-24 2017-05-17 カシオ計算機株式会社 音声検索装置、音声検索方法及びプログラム
CN106776793B (zh) * 2016-11-23 2019-01-22 广州酷狗计算机科技有限公司 一种播放音频数据的方法和装置

Similar Documents

Publication Publication Date Title
US8085632B2 (en) Recording apparatus
JPH05100699A (ja) 音声記録再生装置
JP4341111B2 (ja) 記録再生装置および記録再生方法
JP2005107617A5 (ja)
JP2005107617A (ja) 音声データ検索装置。
JP2005044409A (ja) 情報再生装置、情報再生方法および情報再生プログラム
JP4588626B2 (ja) 楽曲再生装置、再生制御方法、および、プログラム
KR100381345B1 (ko) 오디오북 재생 장치 및 방법
JP3889672B2 (ja) データ記録再生装置
JP2007095155A (ja) コンテンツ選択方法およびコンテンツ選択装置
JP2006323857A (ja) 音声認識処理装置および音声認識処理プログラムを記録した記録媒体
JP4394465B2 (ja) 再生装置、情報処理方法およびプログラム
JPS613242A (ja) デイジタル録音再生機の録音再生方式
JP2005235365A (ja) 情報再生装置及び音声録音・再生装置
KR100563320B1 (ko) 단일 메모리를 갖는 어학학습장치 및 그 제어방법
JPH10283162A (ja) 音声情報ファイルの検索方式
JPH0927189A (ja) 音声情報再生方式
JP3905181B2 (ja) 音声認識処理装置及び音声認識処理プログラムを記録した記録媒体
JP4635809B2 (ja) 音声記録再生装置、音声記録再生システム、音声記録再生方法及びプログラム
JP2009237256A (ja) 音声記憶再生装置、音声記憶再生方法
JPS63250699A (ja) デ−タフアイリング方式
JP2008145757A (ja) 音声データ処理装置、方法及びプログラム
JPH05334893A (ja) Icメモリ音声録音再生装置
JPH10301825A (ja) 情報再生装置
KR20040024416A (ko) 음악 파일 저장 및 재생 장치와 그 방법