JP2010054991A - 録音装置 - Google Patents

録音装置 Download PDF

Info

Publication number
JP2010054991A
JP2010054991A JP2008222067A JP2008222067A JP2010054991A JP 2010054991 A JP2010054991 A JP 2010054991A JP 2008222067 A JP2008222067 A JP 2008222067A JP 2008222067 A JP2008222067 A JP 2008222067A JP 2010054991 A JP2010054991 A JP 2010054991A
Authority
JP
Japan
Prior art keywords
section
situation
data
speech
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008222067A
Other languages
English (en)
Inventor
Noriyuki Hata
紀行 畑
Eiko Kobayashi
詠子 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2008222067A priority Critical patent/JP2010054991A/ja
Priority to PCT/JP2009/065142 priority patent/WO2010024426A1/ja
Publication of JP2010054991A publication Critical patent/JP2010054991A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】出席者の発言区間や非発言区間を区分して表示するとともに、各区間の雰囲気を一覧表示することができる録音装置を提供する。
【解決手段】録音端末1では、収音部10が収音した音声を、解析部11が会議出席者の発言ごとの区間に区分するとともに、各区間の情況を解析する。再生端末2では、各発言者の発言区間および非発言区間をタイムチャート形式で表示するとともに、各区間の情況を示すマークを表示し、そのマークに基づいて区間を選択して個別に再生できるようにする。
【選択図】図2

Description

この発明は、会議等の音声を録音し、所望の位置から再生する録音装置に関する。
従来より会議を録音する装置が提案されている。たとえば、特許文献1には、会議の音声を録音するだけでなく、録音した音声データを発言者ごとの区間に区切ってタイムチャート形式で一覧表示することにより、どの区間が誰の発言であるかが一見して判るようにされたものが一覧表示できるものが提案されている。
特開2007−256498号公報
上記特許文献1の装置では、だれがいつ発言したかを一覧表示することができるが、それぞれの発言がどのような雰囲気であったか、また、どのような情況で発言されたものであったかを知ることはできず、録音を聴いてみなければわからなかった。
また、会議においては、出席者が発言していない時間帯が存在し、このような時間帯は、録音データにおいては無音区間等の非発言区間となる。従来、会議の録音において、無音区間等の非発言区間は議事録として意味のない区間であるとしてデータを削除されていたが、会議の雰囲気等を計り知るためにはこのような非発言区間も情況としての意味を持つ場合がある。しかし、非発言区間がどのような雰囲気の時間帯であったかも録音を聴いてみないとわからなかった。
この発明は、出席者の発言区間や非発言区間を区分して表示するとともに、各区間の雰囲気を一覧表示することができる録音装置を提供することを目的とする。
請求項1の発明である録音装置は、音声データを記憶する音声データ記憶部と、該音声データを音声の発生源に基づいて複数の区間に区分する区間情報を記憶する区間情報記憶部と、各区間の音声の情況を分析した情況データを記憶する情況データ記憶部と、各区間の時間的範囲を時間軸に沿って帯状に表示するとともに、各区間の情況を示す図形を前記帯に重ねて表示する表示部と、を備えたことを特徴とする。
この発明では、音声データを音声の発生源に基づいて複数の区間に区分する。会議の場合、複数の出席者の各々が音声の発生源となる。なお、特定の発生源が発生した音声が存在しない時間帯(たとえば無音区間、不特定の音声が発生している区間等)も区間として分割される。これにより、どの音声区間が誰の発言かを区分することができる。さらに、この発明では、各区間の音声の情況を分析結果を記憶する。音声の情況とは、明るい声、怒った声等の音声やその場の雰囲気である。そして、各区間とその雰囲気を表示する。これにより利用者は、一見して区間の分布とその雰囲気を知ることができる。
請求項2の発明は、請求項1の発明において、前記音声データの波形データに基づき各区間の情況を解析し、解析した各区間の情況を前記情況データ記憶部に書き込む情況解析部を備えたことを特徴とする。
請求項3の発明は、請求項2の発明において、前記情況解析部は、無音の区間の情況を直前の有音区間の情況に基づいて解析することを特徴とする。
請求項4の発明は、請求項2、3の発明において、前記音声データをストリーム入力して前記音声データ記憶部に書き込む音声データ入力部を備え、前記情況解析部は、ストリーム入力される音声データの情況をリアルタイムに解析することを特徴とする。
請求項5の発明は、請求項1〜4の発明において、区間の選択操作、および、選択された区間の情況データの入力操作を受け付け、入力された情況データを前記選択された区間の情況データとして前記情況データ記憶部に書き込む情況データ入力手段をさらに備えたことを特徴とする。
請求項2〜4の発明では、情況データ記憶部に記憶される情況データを音声データに基づき分析する情況解析部を設けた。情況解析部は、バッチ処理で情況を解析しても請求項4に示すようにリアルタイムで情況を解析してもよい。また、無音区間の情況はその前後の有音区間の情況に基づいて解析してもよい。一方、請求項5の発明では、情況データ記憶部に記憶される情況データを操作者がマニュアル入力するための情況データ入力手段を設けた。これにより、操作者が録音された音声データを聴きながら情況データを入力することができる。
請求項6の発明は、請求項1〜5の発明において、前記音声データ記憶部は、会議における複数の出席者の発言を収音した音声データを記憶し、前記区間情報記憶部は、前記音声データを各出席者の発言の区間および発言でない区間ごとに区分する区間情報を記憶することを特徴とする。
請求項7の発明は、請求項6の発明において、前記区間情報記憶部は、笑い声、拍手、物音または無音の区間を前記発言でない区間として記憶することを特徴とする。
本発明の録音装置は、会議の録音に適用するのが好適であり、その場合、各出席者の発言ごとに区間が分割されるとともに、発言でない時間帯(たとえば笑い声、拍手、物音、無音)も発言でない区間(非発言区間)として区間に分割し、情況が解析される。
請求項8の発明は、請求項1〜7の発明において、前記表示部上で、前記区間を指定する操作を受け付ける操作部と、前記操作部で指定された区間の音声データを再生する再生部と、を備えたことを特徴とする。
請求項1に示すように、各区間は音声の発生源、時間帯を示す帯状の形状に表示されるため、この表示エリアをマウスでクリックする等の操作で指定することにより、容易に所望の区間の再生が可能になる。
この発明によれば、音声データを会議の発言者等の音声の発生源に基づいて複数の区間に区分し、その音声の情況を示す図形を表示することにより、発言者等の音声の発生源の分布を一覧で知ることができるとともに、各区間の情況を一見して知ることができる。
図1はこの発明の実施形態である議事記録システムの構成図、図2は、同議事記録システムのブロック図である。この実施形態において、議事記録システムは、録音端末1、再生端末2および記録メディア3で構成されている。
図1において、録音端末1は会議が行われる部屋に設置され、各出席者の発言を収音して記録メディア3に音声データとして記録する。記録時に音声データを各出席者の発言単位の区間に区切り、各区間の情況を解析したデータを収音した音声データとともに記録する。このため、録音端末1は、図2に示すように、収音部10、解析部11、記録部12を備えている。
収音部10は、図1に示すように複数の出席者(出席者A〜G)の音声を収音し、デジタル音声信号に変換して解析部11および記録部12に入力する。収音部10は、必要数のマイクを備えている。マイクは、マイクアレイ、各出席者に個別に向けられた複数の単一指向性マイク、全話者の音声を一括して収音する1または複数の単一指向性または無指向性マイクのいずれであってもよい。マイクアレイを用いる場合、狭指向性の収音ビームを複数形成して各出席者の音声を別々に収音してもよく、広角の指向特性を持つ収音特性を持たせて複数の出席者の音声を一括して収音するようにしてもよい。なお、収音ビームを形成して各出席者の音声を個別に収音する方式については、本出願人の特開2007−256498号公報に詳細に記載されている。
解析部11は、収音部から入力されたデジタル音声信号をリアルタイムに解析して、各出席者の発言の区切りを検出することにより、各出席者の発言区間、および、特定の出席者の発言区間でない非発言区間を割り出す。さらに、各発言区間については、どの出席者の発言であるかの発言者を特定し、非発言区間については、その区間が無音区間、笑い区間、拍手区間、物音区間のいずれであるかの非発言音声を特定する。
ここで、各出席者の発言は、音声波形を認識することによって識別することができる。また、各出席者に個別にマイクが設けられている場合、マイクアレイを用いて各出席者に個別に収音ビームが向けられている場合には、どのマイク、収音ビームで収音されたかによって発言者を識別することができる。
また、笑い区間とは、不特定の出席者の笑い声が収音された区間である。拍手区間とは、不特定の出席者の拍手が収音された区間である。また、物音区間とは、出席者の発言・笑い声・拍手以外の物音(たとえば書類を配布するときの紙の擦れる音など)が収音された区間である。また、無音区間とは、発言者が沈黙し、他の物音も聴こえない区間である。
上記の解析部11による処理結果の例を図4に示す。この図では、各発言者、各非発音音声が縦軸に、会議の経過時間が横軸に割り当てられ、各発言者の発言区間、各非発言音声の非発言区間がその区間時間の長さの帯状に表示されている。
さらに、解析部11は、各発言区間、非発言区間の情況を解析し、解析結果を情況データとして出力する。ここで、情況とは、たとえば、発言者の語調等から割り出される発言区間の雰囲気、前後の発言から推測される非発言区間の雰囲気等である。発言区間の場合、解析の結果「怒っている」、「楽しい」、「無感情」等の雰囲気に分類され、この雰囲気を示す情況データが割り当てられる。また、非発言区間であっても、前後の発言区間との関係で、その場の雰囲気を表す時間として意味を持つものがある。たとえば、無音区間の場合、「話題が無くなってしまった沈黙」、「怒ったあとの沈黙」、「考え込んでいる沈黙」等である。解析部11は、前後の発言区間の雰囲気(情況データ)を参照して非発言区間の雰囲気(情況データ)を解析する。
このため、解析部11は、情況を解析するための解析エンジン、知識ベースを備えている。なお、この情況の解析は、たとえば、特開2002−91482号公報等に記載の技術を適用して実現することができる。この技術では、発言に含まれる感情を強度、テンポ、抑揚等に基づいて解析している。
また、解析部11は、情況を解析できなかった区間については、解析データに代えて解析不可であった旨を示す解析不可データを付加する。解析不可の区間は、図5に示す発言一覧表示において「?」のマークが表示されるが、再生端末2の操作者がマニュアル操作で情況データ(マーク)を入力することができる。
記録部12は、記憶メディア3のスロットを有し、このスロットにセットされている記録メディア3に、図3に示す議事録データを記録する。議事録データは、会議中に録音したデジタル音声信号列である音声データ、各発言区間・非発言区間を区分するとともに発言者・非発言音声を特定するデータである区間データ、各発言区間・非発言区間の情況を解析したデータである情況データからなる。なお、記憶メディア3としては、たとえばSDカードなどの半導体メディアが用いられる。
一方、再生端末2は、録音端末1で議事録データが記録された記憶メディア3を読み込んで、再生・編集するための装置であり、たとえばノートパソコンにプログラムを実行させて実現される。再生端末2は、記憶メディア3に記録されている議事録データに基づき、図5に示すような発言一覧を表示する。そして、ユーザの指定した区間を再生するとともに、ユーザが聴いた結果、その発言の雰囲気が情況データと異なると判断された場合に、情況データの訂正を受け付ける。このため、再生端末2は、図2に示すように、記憶管理部20、表示部21、再生部22および操作部23を機能的に備えている。
記憶管理部20はノートパソコンのメディアスロットを含み、スロットに挿入されたSDカードの読み出しや書き込みを実行する。また、表示部21は、ノートパソコンのディスプレイを含み、記録管理部20に表示されているマークデータ、情況データを、図5に示すようなグラフ状に時系列に表示する。なお、表示部21は各情況データに対応するマーク画像を記憶する画像メモリを含んでいる。再生部22は、ノートパソコンのオーディオ回路・スピーカ等を含み、指定された区間の音声データを読み出して再生し、音響として放音する。
操作部23は、ノートパソコンのキーボードやマウスを含み、発言一覧(図5)の表示、発言区間・非発言区間の指定、音声データの再生/停止、発言区間・非発言区間の情況データの訂正などの操作を受け付ける。
図3は、議事録データの例を示す図である。議事録データは、会議中に録音したデジタル音声信号列である音声データ、各発言区間・非発言区間を区分するとともに発言者・非発言音声を特定するデータである区間データ、各発言区間・非発言区間の情況を解析したデータである情況データからなる。音声データトラックには、音声データがタイムコードを付されて時系列に書き込まれており、区間データトラックには、区間の開始タイミング、終了タイミングの時刻(タイムコード)およびその区間の発言者または非発言音声からなる区間データが、各区間ごとに時系列に書き込まれる。情況データトラックには、各発言区間・非発言区間の情況解析結果である情況データが各区間に対応づけて書き込まれる。
図5は、再生装置2のディスプレイに表示される発言一覧の画面を示す図である。この表示は、発言者および非発言音声を縦軸に、経過時間を横軸に配し、各発言者、非発言音声の区間をその占有時間の長さの帯状に表示するとともに、各区間の情況データに対応するマークをその区間の帯状エリアの上に表示したものである。たとえば、発言区間31の表示は、出席者1(キャラ1)が、会議開始00時00分00秒から50秒発言したこと、および、その発言情況はおおむね明るい口調であった旨を表示している。ここで、発言区間のマークは、晴れマーク=明るい口調、雨マーク=暗い口調、曇りマーク=やや暗い口調、雷マーク=怒った口調の情況データに対応している。発言区間31のように1つの発言区間中で口調が変化したとき(情況データが変化したとき)には、発言区間内に複数のマークが付される場合もある。
また、無音区間33のマークは、重い沈黙を表すマークである。この情況は、たとえば、その直前の区間32で話者4が怒ったことに対応して会議の出席者全員が沈黙してしまったことによって発生した無音区間であると考えられるため、重い沈黙の情況データ(マーク)が割り当てられる。
また、笑い区間35、36および拍手区間37には音符のマークが割り当てられる。これら笑い区間・拍手区間の情況データはその笑い・拍手の大きさを示しており、発言一覧の表示においては、音符の大きさで笑い・拍手の大きさが表現される。
図6は、再生装置2の再生動作を示すフローチャートである。この再生動作では、操作者の操作に応じて音声データを再生するとともに、操作者の操作に応じて各区間に割り当てられているマーク(情況データ)を修正する。
再生動作がスタートすると、まず図5に示す発言一覧をディスプレイに表示する(S1)。そして指定操作、再生操作、再生停止操作、マーク変更操作、終了操作があるまで待機ルーチン(S2〜S6)で待機する。
ここで、指定操作(S2)とは、ディスプレイに表示されている発言一覧(図5参照)のなかから、1つの区間を指定する操作である。この指定操作は、操作者がマウスで所望の区間の表示エリアをクリックすることで行われる。また、再生操作(S3)/再生停止操作(S4)は、音声データの再生の開始/停止を指示する操作であり、ディスプレイに表示される開始ボタン/停止ボタンのマウスクリック、または、キーボードの特定操作(たとえばCtrl+a/Ctrl+zなど)によって行われる。また、マーク変更操作
(S5)は、指定された(選択状態の)区間に割り当てられている情況データ(マーク)を変更する操作であり、ディスプレイに表示されるマーク変更ボタンのマウスクリックまたはキーボードの特定操作(たとえばCtrl+xなど)の操作によってディスプレイにマーク一覧をウィンドウを表示させ、そのウィンドウ内の所望のマークをマウスクリックすることによって行われる。また、終了操作(S6)は、この再生動作の終了を指示する操作であり、発言一覧ウィンドウのクローズボタン「×」のマウスクリックまたはキーボードの特定操作(たとえばCtrl+qなど)によって行われる。
指定操作が行われると(S2:Y)
、その指定された区間を選択状態とする(S10)。選択状態とは、再生操作やマーク変更操作が行われたとき、その処理を行う対象となる区間として選択されている状態をいう。このときディスプレイのその区間の表示色を反転させる等、指定された区間が操作者に判るように表示形態を変更する。そして、現在S3の操作で音声データを再生中であるかを判定する(S11)。音声データを再生中であれば(S11:Y)、指定された区間に再生位置をジャンプさせる(S12)。再生中でないときは、そのまま待機ルーチンにもどる。
再生操作が行われると(S3:Y)、選択状態の区間があるかを判断する(S13)、選択状態の区間が存在すれば(S13:Y)、その区間から再生をスタートする(S14)。選択状態の区間が存在しない場合には(S13:N)、音声データの先頭から再生をスタートさせる(S15)。なお、音声データの再生中は、その時点の再生位置が属する区間を選択状態とし、再生位置が進行してゆくのに伴って選択状態の区間も進行させてゆく。
再生停止操作があった場合には(S4:Y)、再生操作(S3)により、現在再生中であるか否かを判断する(S20)。再生中の場合には(S20:Y)、再生を停止して(S21)待機ルーチンにもどる。なお、このとき、再生を停止した時点での再生位置が属する区間を選択状態にしておく。一方、再生中でなければ(S20:N)何もしないで待機ルーチンへもどる。
マーク変更操作(S5)があると、現在選択状態の区間があるかを判断する(S22)、選択状態の区間がない場合には(S22:N)何もしないで待機ルーチンにもどる。一方、選択状態の区間が存在する場合には(S22:Y)、操作にしたがって選択状態の区間の情況データを書き換える(S23)とともに、ディスプレイに表示されている発言一覧(図5参照)中の対応する区間のマークを書き換える(S24)。
また、終了操作が行われた場合(S6)には、再生の停止・ディスプレイの消去等の終了処理を行ったのち(S25)、動作を終了する。
なお、再生部22に複数の効果音を記憶しておき、再生する区間の情況データに応じた効果音を音声データとともに再生するようにしてもよい。
なお、この実施形態では、録音端末1に解析部11を設け、収音されたデジタル音声信号の情況(雰囲気)をリアルタイムに解析しているが、情況の解析は録音後にバッチ処理で行ってもよい。この場合、解析部を再生端末2側に設けてもよい。
また、この実施形態では、本発明の録音装置を録音端末1、再生端末2および記憶メディア3からなる議事記録システムで構成しているが、これらを一体に構成した録音装置としてもよい。
上記実施形態では、録音装置を会議に適用する例を示しているが、本発明の録音装置は会議以外にも適用することができる。たとえば、屋外録音に適用することも可能である。また、野鳥の鳴き声の録音に適用することも可能であり、鳥の種類ごとに区間を分割すれば利用者が所望の鳴き声を自由に再生することができる。
この発明の実施形態である議事記録システムの構成図である。 同議事記録システムの機能を示すブロック図である。 同議事記録システムで記録される議事録データの例を示す図である。 議事録データの区間分割例を示す図である。 同議事記録システムの発言一覧の表示例を示す図である。 同議事記録システムの再生装置の動作を示すフローチャートである。
符号の説明
1…録音端末
2…再生端末
3…記録メディア
11…解析部

Claims (8)

  1. 音声データを記憶する音声データ記憶部と、
    該音声データを音声の発生源に基づいて複数の区間に区分する区間情報を記憶する区間情報記憶部と、
    各区間の音声の情況を分析した情況データを記憶する情況データ記憶部と、
    各区間の時間的範囲を時間軸に沿って帯状に表示するとともに、各区間の情況を示す図形を前記帯に重ねて表示する表示部と、
    を備えた録音装置。
  2. 前記音声データの波形データに基づき各区間の情況を解析し、解析した各区間の情況を前記情況データ記憶部に書き込む情況解析部を備えた請求項1に記載の録音装置。
  3. 前記情況解析部は、無音の区間の情況を直前の有音区間の情況に基づいて解析する請求項2に記載の録音装置。
  4. 前記音声データをストリーム入力して前記音声データ記憶部に書き込む音声データ入力部を備え、
    前記情況解析部は、ストリーム入力される音声データの情況をリアルタイムに解析する請求項2または請求項3に記載の録音装置。
  5. 区間の選択操作、および、選択された区間の情況データの入力操作を受け付け、入力された情況データを前記選択された区間の情況データとして前記情況データ記憶部に書き込む情況データ入力手段をさらに備えた請求項1乃至請求項4のいずれかに記載の録音装置。
  6. 前記音声データ記憶部は、会議における複数の出席者の発言を収音した音声データを記憶し、
    前記区間情報記憶部は、前記音声データを各出席者の発言の区間および発言でない区間ごとに区分する区間情報を記憶する
    請求項1乃至請求項5のいずれかに記載の録音装置。
  7. 前記区間情報記憶部は、笑い声、拍手、物音または無音の区間を前記発言でない区間として記憶する請求項6に記載の録音装置。
  8. 前記表示部上で、前記区間を指定する操作を受け付ける操作部と、
    前記操作部で指定された区間の音声データを再生する再生部と、
    を備えた請求項1乃至請求項7のいずれかに記載の録音装置。
JP2008222067A 2008-08-29 2008-08-29 録音装置 Pending JP2010054991A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008222067A JP2010054991A (ja) 2008-08-29 2008-08-29 録音装置
PCT/JP2009/065142 WO2010024426A1 (ja) 2008-08-29 2009-08-25 録音装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008222067A JP2010054991A (ja) 2008-08-29 2008-08-29 録音装置

Publications (1)

Publication Number Publication Date
JP2010054991A true JP2010054991A (ja) 2010-03-11

Family

ID=41721587

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008222067A Pending JP2010054991A (ja) 2008-08-29 2008-08-29 録音装置

Country Status (2)

Country Link
JP (1) JP2010054991A (ja)
WO (1) WO2010024426A1 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016038546A (ja) * 2014-08-11 2016-03-22 オリンパス株式会社 音声処理装置、電子機器、音声処理システム、音声処理方法、及び音声処理プログラム
JP2016071029A (ja) * 2014-09-29 2016-05-09 株式会社東芝 電子機器、方法及びプログラム
JP5959771B2 (ja) * 2014-06-27 2016-08-02 株式会社東芝 電子機器、方法およびプログラム
WO2018034059A1 (ja) * 2016-08-17 2018-02-22 パナソニックIpマネジメント株式会社 音声入力装置、翻訳装置、音声入力方法、及び音声入力プログラム
KR20180064353A (ko) * 2018-05-31 2018-06-14 연세대학교 원주산학협력단 소리데이터 자동분할 장치
JP2018097239A (ja) * 2016-12-15 2018-06-21 カシオ計算機株式会社 音声再生装置及びプログラム
JP2018132892A (ja) * 2017-02-14 2018-08-23 株式会社イトーキ 会議記録装置、会議記録方法、及びプログラム。
US10089061B2 (en) 2015-08-28 2018-10-02 Kabushiki Kaisha Toshiba Electronic device and method
US10770077B2 (en) 2015-09-14 2020-09-08 Toshiba Client Solutions CO., LTD. Electronic device and method

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110265027B (zh) * 2019-06-19 2021-07-27 安徽声讯信息技术有限公司 一种用于会议速记系统的音频传输方法
JP7509008B2 (ja) 2020-11-17 2024-07-02 トヨタ自動車株式会社 情報処理システム、情報処理方法及びプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08286693A (ja) * 1995-04-13 1996-11-01 Toshiba Corp 情報処理装置
JP2006208482A (ja) * 2005-01-25 2006-08-10 Sony Corp 会議の活性化を支援する装置,方法,プログラム及び記録媒体

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10592198B2 (en) 2014-06-27 2020-03-17 Toshiba Client Solutions CO., LTD. Audio recording/playback device
JP5959771B2 (ja) * 2014-06-27 2016-08-02 株式会社東芝 電子機器、方法およびプログラム
JP2016038546A (ja) * 2014-08-11 2016-03-22 オリンパス株式会社 音声処理装置、電子機器、音声処理システム、音声処理方法、及び音声処理プログラム
JP2016071029A (ja) * 2014-09-29 2016-05-09 株式会社東芝 電子機器、方法及びプログラム
US10089061B2 (en) 2015-08-28 2018-10-02 Kabushiki Kaisha Toshiba Electronic device and method
US10770077B2 (en) 2015-09-14 2020-09-08 Toshiba Client Solutions CO., LTD. Electronic device and method
WO2018034059A1 (ja) * 2016-08-17 2018-02-22 パナソニックIpマネジメント株式会社 音声入力装置、翻訳装置、音声入力方法、及び音声入力プログラム
JPWO2018034059A1 (ja) * 2016-08-17 2018-11-22 パナソニックIpマネジメント株式会社 音声入力装置、翻訳装置、音声入力方法、及び音声入力プログラム
JP2018097239A (ja) * 2016-12-15 2018-06-21 カシオ計算機株式会社 音声再生装置及びプログラム
JP2018132892A (ja) * 2017-02-14 2018-08-23 株式会社イトーキ 会議記録装置、会議記録方法、及びプログラム。
JP7060327B2 (ja) 2017-02-14 2022-04-26 株式会社イトーキ 会議記録装置、会議記録方法、及びプログラム。
KR101976986B1 (ko) * 2018-05-31 2019-05-10 연세대학교 원주산학협력단 소리데이터 자동분할 장치
KR20180064353A (ko) * 2018-05-31 2018-06-14 연세대학교 원주산학협력단 소리데이터 자동분할 장치

Also Published As

Publication number Publication date
WO2010024426A1 (ja) 2010-03-04

Similar Documents

Publication Publication Date Title
WO2010024426A1 (ja) 録音装置
JP4558308B2 (ja) 音声認識システム、データ処理装置、そのデータ処理方法及びプログラム
US7825321B2 (en) Methods and apparatus for use in sound modification comparing time alignment data from sampled audio signals
JP5143569B2 (ja) 音響的特徴の同期化された修正のための方法及び装置
JP2006301223A (ja) 音声認識システム及び音声認識プログラム
KR20070020252A (ko) 메시지를 수정하기 위한 방법 및 시스템
JP2013222347A (ja) 議事録生成装置及び議事録生成方法
CN102254553A (zh) 语音音节时长的自动归一化
JP2016080944A (ja) 音声合成装置およびプログラム
CN101111884A (zh) 用于声学特征的同步修改的方法和装置
JP2006330170A (ja) 記録文書作成支援システム
US7308407B2 (en) Method and system for generating natural sounding concatenative synthetic speech
JP2004309965A (ja) 会議録音・書き起こしシステム
JP2007058767A (ja) 発話記録作成システム
JP4564416B2 (ja) 音声合成装置および音声合成プログラム
JP2009260718A (ja) 画像再生装置及び画像再生処理プログラム
JP2001325250A (ja) 議事録作成装置および議事録作成方法および記録媒体
US20040054524A1 (en) Speech transformation system and apparatus
JP2019213160A (ja) 動画編集装置、動画編集方法、及び動画編集プログラム
JP7288530B1 (ja) システムおよびプログラム
JP4294502B2 (ja) 電話端末及び画像生成方法
JP5471138B2 (ja) 音素符号変換装置および音声合成装置
JP2005043628A (ja) 対話記録装置および対話記録方法
JP2007329794A (ja) 音声録音装置
JP6185136B1 (ja) 音声生成プログラムおよびゲーム装置