JP2015106058A - 電子機器および録音ファイル送信方法 - Google Patents

電子機器および録音ファイル送信方法 Download PDF

Info

Publication number
JP2015106058A
JP2015106058A JP2013248153A JP2013248153A JP2015106058A JP 2015106058 A JP2015106058 A JP 2015106058A JP 2013248153 A JP2013248153 A JP 2013248153A JP 2013248153 A JP2013248153 A JP 2013248153A JP 2015106058 A JP2015106058 A JP 2015106058A
Authority
JP
Japan
Prior art keywords
recording
recording file
file
content
determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013248153A
Other languages
English (en)
Inventor
裕作 菊川
Yusaku Kikukawa
裕作 菊川
長田 将高
Masataka Osada
将高 長田
健太郎 竹田
Kentaro Takeda
健太郎 竹田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2013248153A priority Critical patent/JP2015106058A/ja
Priority to US14/535,158 priority patent/US20150155001A1/en
Publication of JP2015106058A publication Critical patent/JP2015106058A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/32Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
    • G11B27/327Table of contents
    • G11B27/329Table of contents on a disc [VTOC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】ユーザが聞きたい内容を含む録音ファイルを提供すること。【解決手段】実施形態によれば、電子機器は、検索処理手段と、判定処理手段と、送信処理手段とを具備する。検索処理手段は、録音場所を示す位置情報と、録音日時を示す時間情報とがそれぞれ関連付けられ、複数の録音装置によって作成された複数の録音ファイルから、各録音ファイルに関連付けられている位置情報および時間情報に基づいて、指定された第1の録音ファイルに対応する第2の録音ファイルを検索する。判定処理手段は、第2の録音ファイルの録音内容が第1の録音ファイルの録音内容の少なくとも一部を含むかを判定する。第2の録音ファイルの録音内容が第1の録音ファイルの録音内容の少なくとも一部を含むと判定された場合に、送信処理手段は、第2の録音ファイルの少なくとも一部を含む第3の録音ファイルを第1の録音装置に送信する。【選択図】 図5

Description

本発明の実施形態は、複数の録音ファイルを有する電子機器および録音ファイル送信方法に関する。
近年、フラッシュメモリ等の不揮発性メモリに録音ファイルを記録(録音)するデジタル音声レコーダが普及している。録音時、バッテリ切れや不揮発性メモリの容量不足等の理由で連続して録音できなくなる場合がある。録音できなくなった場合に、別のレコーダで録音を引き継ぐことが提案されている。
特開2011−114726号公報
別のレコーダで録音を引き継ぐために、録音開始時に、レコーダ間で相互に登録しておく必要があった。そのため、相互に登録されていなければ、別のレコーダに録音を引き継ぐことができず、録音したい内容の全ての内容を得ることができなかった。
本発明の目的は、ユーザが聞きたい内容を含む録音ファイルを提供することが可能な電子機器および録音ファイル送信方法を提供することにある。
実施形態によれば、電子機器は、検索処理手段と、判定処理手段と、送信処理手段とを具備する。検索処理手段は、録音場所を示す位置情報と、録音日時を示す時間情報とがそれぞれ関連付けられ、複数の録音装置によって作成された複数の録音ファイルから、各録音ファイルに関連付けられている位置情報および時間情報に基づいて、指定された第1の録音ファイルに対応する第2の録音ファイルを検索する。判定処理手段は、前記第2の録音ファイルの録音内容が前記第1の録音ファイルの録音内容の少なくとも一部を含むかを判定する。前記第2の録音ファイルが前記第1の録音ファイルの録音内容の少なくとも一部を含むと判定された場合に、送信処理手段は、前記第2の録音ファイルの少なくとも一部を含む第3の録音ファイルを第1の録音装置に送信する。
実施形態のシステムの構成の一例を示す図。 図1に示すシステムの運用例を示す図。 図1に示す各デジタル音声録音装置の構成を示すブロック図。 図1に示すサーバの構成を示すブロック図。 録音ファイル管理アプリケーションの構成を示すブロック図。 判定処理部による判定処理を説明するための図。 判定処理部による判定結果が一致しない場合を示す図。 閾値を変えることにより判定処理部による判定結果が一致した場合を示す図。 判定処理部による判定処理を説明するための図。 判定処理部による判定処理を説明するための図。 判定処理部による判定処理を説明するための図。 録音ファイルが指定されてから、録音ファイルを送信するまでの手順の一例を示すフローチャート。 録音ファイルの一部を切り出し、切り出された録音ファイルを結合する録音ファイル管理アプリケーションの構成を示すブロック図。 録音ファイルの一部を切り出し、切り出された録音ファイルを別の録音ファイルに結合する手順の一例を示すフローチャート。 二つの録音ファイルの結合を説明するための図。
以下、実施の形態について図面を参照して説明する。
図1は、本実施形態のシステムを示す図である。
本システムは、サーバコンピュータ10と複数のデジタル音声録音装置20(20A,20B,20C)とを含む。
各デジタル音声録音装置20は、同一発話内容を録音し、録音ファイルを生成する。各デジタル音声録音装置20は、録音ファイルと、録音位置を示す位置情報と録音日時を示す時間情報とを含むメタ情報とをサーバ10にアップロードする。なお、メタ情報は、録音ファイルに追記されていても良い。
例えば、録音した音声がユーザの都合によって、例えば録音品質の良い音声が必要になった場合は、他のユーザがアップロードした録音ファイルがないかをサーバに問い合わせる。サーバ10は、例えばデジタル音声録音装置20Aによってアップロードされた録音ファイルに対応するメタ情報に含まれる位置情報および時間情報に基づいて、デジタル音声録音装置20Aによってアップロードされた録音ファイルと、ほぼ同一位置およびほぼ同一日時に録音された録音ファイルが無いかを検索する。録音ファイルが検索された場合、サーバ10は、録音ファイルが録音ファイルがあることをデジタル音声録音装置20Aに通知する。図2に示すように、デジタル音声録音装置20Aは、サーバ10から録音ファイルをダウンロードする。
図3は、各デジタル音声録音装置音声録音装置20の構成を示すブロック図である。
デジタル音声録音装置20は、図3に示されるように、タッチスクリーンディスプレイ17、CPU101、システムコントローラ102、主メモリ103、グラフィクスコントローラ104、BIOS−ROM105、ストレージデバイス106、無線通信デバイス107、エンベデッドコントローラ(EC)108、マイク109、GPSモジュール110、およびRTC(Real Time Clock)111等を備える。
CPU101は、デジタル音声録音装置20内の各種モジュールの動作を制御するプロセッサである。CPU101は、ストレージデバイスであるストレージデバイス106から揮発性メモリである主メモリ103にロードされる各種ソフトウェアを実行する。これらソフトウェアには、オペレーティングシステム(OS)200、および各種アプリケーションプログラムが含まれている。各種アプリケーションプログラムには、録音アプリケーション(録音APP)300が含まれている。
また、CPU101は、BIOS−ROM105に格納された基本入出力システム(BIOS)も実行する。BIOSは、ハードウェア制御のためのプログラムである。
システムコントローラ102は、CPU101のローカルバスと各種コンポーネントとの間を接続するデバイスである。システムコントローラ102には、主メモリ103をアクセス制御するメモリコントローラも内蔵されている。また、システムコントローラ102は、PCI EXPRESS規格のシリアルバスなどを介してグラフィクスコントローラ104との通信を実行する機能も有している。
グラフィクスコントローラ104は、デジタル音声録音装置20のディスプレイモニタとして使用されるLCD17Aを制御する表示コントローラである。このグラフィクスコントローラ104によって生成される表示信号はLCD17Aに送られる。LCD17Aは、表示信号に基づいて画面イメージを表示する。このLCD17A上にはタッチパネル17Bが配置されている。タッチパネル17Bは、LCD17Aの画面上で入力を行うための静電容量式のポインティングデバイスである。指が接触される画面上の接触位置および接触位置の動き等はタッチパネル17Bによって検出される。
無線通信デバイス107は、無線LANまたは3G移動通信などの無線通信を実行するように構成されたデバイスである。EC108は、電力管理のためのエンベデッドコントローラを含むワンチップマイクロコンピュータである。EC108は、ユーザによるパワーボタンの操作に応じてデジタル音声録音装置20を電源オンまたは電源オフする機能を有している。
GPSモジュール110は、デジタル音声録音装置20の位置を測定する。RTC111は、日時を計る。
録音アプリケーション300は、マイクによって集音された音を圧縮符号化する処理を行う。録音アプリケーション300は、録音ファイルに、GPSモジュール110によって測位された位置を示す位置情報と、RTC111によって計られた日時を示す時間情報とをメタ情報として、追記する。録音アプリケーション300は、圧縮符号化された録音ファイルを無線通信デバイス107を用いて、サーバに送信する処理を行う。
図4は、サーバ10の構成を示すブロック図である。
サーバ10は、図4に示されるように、CPU301、システムコントローラ302、主メモリ303、グラフィクスコントローラ304、BIOS−ROM305、ストレージデバイス306、ネットワークコントローラ307、エンベデッドコントローラ(EC)308等を備える。
CPU301は、サーバ10内の各種モジュールの動作を制御するプロセッサである。CPU301は、ストレージデバイス306から揮発性メモリである主メモリ303にロードされる各種ソフトウェアを実行する。これらソフトウェアには、オペレーティングシステム(OS)400、および各種アプリケーションプログラムが含まれている。各種アプリケーションプログラムには、録音ファイル管理アプリケーション(録音ファイル管理APP)500が含まれている。
また、CPU301は、BIOS−ROM305に格納された基本入出力システム(BIOS)も実行する。BIOSは、ハードウェア制御のためのプログラムである。
システムコントローラ302は、CPU301のローカルバスと各種コンポーネントとの間を接続するデバイスである。システムコントローラ302には、主メモリ303をアクセス制御するメモリコントローラも内蔵されている。また、システムコントローラ302は、PCI EXPRESS規格のシリアルバスなどを介してグラフィクスコントローラ304との通信を実行する機能も有している。
グラフィクスコントローラ304は、サーバ10のディスプレイモニタとして使用されるLCD317を制御する表示コントローラである。このグラフィクスコントローラ304によって生成される表示信号はLCD317に送られる。LCD317は、表示信号に基づいて画面イメージを表示する。
ネットワークコントローラ307は、ネットワークを介してデジタル音声録音装置20と通信を実行するように構成されたデバイスである。EC308は、電力管理のためのエンベデッドコントローラを含むワンチップマイクロコンピュータである。EC308は、ユーザによるパワーボタンの操作に応じてサーバ10を電源オンまたは電源オフする機能を有している。
図5は、録音ファイル管理アプリケーション500の構成を示すブロック図である。
録音ファイル管理アプリケーション500は、受信処理部501、格納処理部502、データベース管理処理部(DB管理処理部)503、検索処理部504、判定処理部505、および送信処理部506等を備えている。
受信処理部501は、各デジタル音声録音装置20からアップロードされた録音ファイルを受信する。格納処理部502は、受信した録音ファイルをストレージデバイス306に格納する。データベース管理処理部503は、格納された録音ファイルのストレージデバイス306の格納位置と、メタ情報内の位置情報に基づいた録音ファイルの録音位置と、メタ情報内の時間情報に基づいた録音ファイルの録音日時とが関連付けられたデータをデータベース600に格納する。
デジタル音声録音装置が、アップロードした録音ファイルの内から指定された録音ファイルに対応する録音ファイルがあるかをサーバ10に問い合わせた場合、検索処理部504は、指定された録音ファイルの録音位置および録音日時とデータベース600に基づいて、ストレージデバイスに格納されている録音ファイルから指定された録音ファイルに対応する録音ファイル検索する。指定された録音ファイルに対応する録音ファイルは、指定された録音ファイルとほぼ同一位置およびほぼ同一日時に録音された録音ファイルのことである。
指定された録音ファイルに対応する録音ファイルが検索された場合、判定処理部505は、検索された録音ファイルの録音内容が、指定された録音ファイルの録音内容の少なくとも一部を含むかを判定する。検索された録音ファイルの録音内容が、指定された録音ファイルの録音内容の少なくとも一部を含むと判定された場合、送信処理部506は、指定された録音ファイルに対応する録音ファイルがあることを、問合せを行ったデジタル音声録音装置20に通知する。デジタル音声録音装置20からダウンロードの要求があった場合、送信処理部506は、録音ファイルをデジタル音声録音装置に送信する。なお、判定処理部505の判定処理を行わずに、検索された録音ファイルをデジタル音声録音装置に送信しても良い。
判定処理部505の判定処理について説明する。同じ場所、時間で録音された録音ファイルが検索されても、検索された録音ファイルが、建物の階が異なる場所で行われた講義の発話内容を含む場合も有る。従って、同じ場所、時間で録音された録音ファイルが検索されても、簡単に、同一発話内容を含む録音ファイルとして絞り込めない可能性もある。
そのため、検索された録音ファイルが同一発話内容の音声であるかを判定する必要がある。同一発話内容の音声であるかを判定するためには、指定された録音ファイルと、検索された録音ファイルとに対して、信号レベルでの相互相関の比較を行うと実現できるが、録音環境が異なると同一発話内容でも一致しないことがある。また、録音した録音ファイルが長時間になる場合、マッチング処理を行う時間が膨大になってしまうリスクもある。
まず、録音環境が異なる場合でも同一発話内容であるかを判定するために、図6に示すように、判定処理部505は、指定された録音ファイルと、検索された録音ファイルとに対して、例えば一定音声区間(フレーム)ごとに有音判定(VAD:Voice activity detection)や有音無音判定を行った結果に対して判定を行う。そして、判定処理部505は、各音声区間毎に二つの判定結果が一致するかを判定するマッチング処理を行う。また、判定処理部505は、時間領域の特徴量だけではなく、周波数領域の特徴量(例えば、フォルマント周波数)を算出し、特徴量を用いてマッチング処理を行っても良い。以上によって、多少のノイズには関係なく判定を判定を行うことが可能になる。
以上の処理でも、自身が録音した際に、近くにファン等の騒音源があった場合、図7に示すように、判定結果が一致しない場合がある。VADや有音無音判定を行う際の閾値を変化させる。図8に示すように、閾値の変化後に一致する場合は、同一発話内容を含む録音ファイルとして判定する。
また、自身が録音した際に、近隣に別の発話者がいた場合、判定結果が一致しない場合がある。図9に示すように、判定処理部505は、指定録音ファイルに対して、一定音声区間(フレーム)ごとに話者識別を行う。一話者でもVADまたは有音無音判定が一致すれば、判定処理部505は、同一発話内容の音声と判定しても良い。
また、2本の指向性マイクで録音されている場合、話者識別の代わりに、図10に示すように、判定処理部505は、指定録音ファイルに対してビームフォーミング処理により、特定の任意の角度から発生された音声を強調する。判定処理部505は、強調された音声に対して行われたVAD結果や有音無音判定結果と、検索録音ファイルに対して行われたVAD結果や有音無音判定結果とが一致すれば、同一発話内容の音声と判定してもよい。
一方、処理時間が膨大とならないようにするためには、図11に示すように、判定処理部505は、指定録音ファイルおよび検索録音ファイルのそれぞれから音声の一部を切り出した後に、マッチング処理を行えば良い。そして、この切り出し音声のファイルサイズを、録音時間が長くなっても変わらないように調整すると、録音時間によらず、マッチング処理時間は一定となる。なお、簡単な音声の切り出し方法としては、時間情報に合わせて、間欠区間ごとに一意的に切り出せばよい。
以上のような、マッチング判定を行った結果、同一発話内容の録音ファイルを検索することができれば、録音引継ぎに掛る面倒な操作がなくとも、ユーザの要求に合わせて、別ユーザの録音ファイルを視聴することが可能となる。具体的には、SNRが最も良いクリアは音声が視聴できるようになったり、講義や会議の開始から終了までの一通りの内容を視聴できるようになる。
次に、録音ファイルが指定されてから、録音ファイルを送信するまでの手順について図12を参照して説明する。図12は、録音ファイルが指定されてから、録音ファイルを送信するまでの手順の一例を示すフローチャートである。
判定処理部505は、指定された録音ファイルに関連付けられている位置情報および時間情報に基づいて、ストレージデバイス106に格納されている複数の録音ファイルから、指定録音ファイルに対応する録音ファイルを検索する(ステップB11)。検索処理部504は、指定録音ファイルに対応する録音ファイルの検索に成功したかを判定する(ステップB12)。成功した場合(ステップB12のYes)、判定処理部505は、検索録音ファイルの録音内容が、指定録音ファイルの録音内容の少なくとも一部を含むかを判定する(ステップB13)。検索録音ファイルの録音内容が、指定録音ファイルの録音内容の少なくとも一部を含むと判定された場合(ステップB13のYes)、判定処理部505は、デジタル音声録音装置に指定録音ファイルに対応する録音ファイルがあることを通知する(ステップB14)。デジタル音声録音装置からダウンロードの要求があったら、送信処理部506は、検索された録音ファイルをデジタル音声録音装置20に送信する(ステップB15)。検索に失敗した場合(ステップB12のNo)、または指定録音ファイルの録音内容の少なくとも一部を含まないと判定された場合(ステップB13のNo)、検索処理部504は、デジタル音声録音装置に指定録音ファイルに対応する録音ファイルがないことを通知する(ステップB16)。
なお、サーバ上で複数の同一発話内容の録音ファイルがある場合では、録音品質の良い録音音声を開始から終了まで視聴できるように、それぞれの音声フイルを切り出し、結合しても良い。
サーバ10内の録音ファイルの一部を切り出し、切り出された録音ファイルを結合する例を図13,図14、図15を参照して説明する。
図13は、録音ファイルの一部を切り出し、切り出された録音ファイルを結合する録音ファイル管理アプリケーション500の構成を示すブロック図である。
録音ファイル管理アプリケーション500は、結合処理部507を更に有する。結合処理部507は、録音ファイルの一部を切り出し、切り出された録音ファイルを結合する。
図14は、録音ファイルの一部を切り出し、切り出された録音ファイルを別の録音ファイルに結合する手順の一例を示すフローチャートである。
結合処理部507は、検索された各録音ファイルのSNR(signal-noise ratio)を測定する(ステップB21)。結合処理部507は、測定されたSNRに基づいて最も録音状態が良い録音ファイルを1つ選択する(ステップB22)。その後、結合処理部507は、選択された録音ファイル(以下、第1録音ファイル)の録音時間が他の録音ファイルの録音時間よりも短いかを判定する(ステップB23)。録音時間が短いと判定された場合(ステップB23のYes)、結合処理部507は、第1録音ファイルより録音時間が長い録音ファイルの内で、測定されたSNRに基づいて最も録音状態が良い録音ファイル(以下、第2録音ファイル)を選択する(ステップB24)。結合処理部507は、第1録音ファイルの不足部分を第2録音ファイルから切り出す(ステップB25)。結合処理部507は、第1録音ファイルと切り出された録音ファイルとを結合する(ステップB26)。結合時、図15に示すように、結合点は無声音部分で行い、振幅を限りなく0としておくと結合部での音質差は少なくなる。また、結合部分の前後でノイズや音量に差がある場合は、ノイズキャンセラや音量正規化処理等のスムーズ化処理を施し、同一の品質にする(ステップB27)。
ストレージデバイスに格納されている複数の録音ファイルから、指定された録音ファイルに関連付けられている位置情報および時間情報に基づいて、指定された録音ファイルに対応する録音ファイルを検索し、検索された録音ファイルの少なくとも一部を含む録音ファイルを送信することで、ユーザが聞きたい内容を含む録音ファイルを提供することが可能になる。
また、本実施形態の各種処理はコンピュータプログラムによって実現することができるので、このコンピュータプログラムを格納したコンピュータ読み取り可能な記憶媒体を通じてこのコンピュータプログラムを通常のコンピュータにインストールして実行するだけで、本実施形態と同様の効果を容易に実現することができる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
10…サーバコンピュータ(電子機器)、200…オペレーティングシステム、300…録音アプリケーション、301…CPU、303…主メモリ、306…ストレージデバイス、307…ネットワークコントローラ、400…オペレーティングシステム、500…録音ファイル管理アプリケーション、501…受信処理部、502…格納処理部、503…データベース管理処理部、504…検索処理部、505…判定処理部、506…送信処理部、507…結合処理部、600…データベース。

Claims (9)

  1. 録音場所を示す位置情報と、録音日時を示す時間情報とがそれぞれ関連付けられ、複数の録音装置によって作成された複数の録音ファイルから、各録音ファイルに関連付けられている位置情報および時間情報に基づいて、指定された第1の録音ファイルに対応する第2の録音ファイルを検索する検索処理手段と、
    前記第2の録音ファイルの録音内容が、前記第1の録音ファイルの録音内容の少なくとも一部を含むかを判定する判定処理手段と、
    前記第2の録音ファイルの録音内容が前記第1の録音ファイルの録音内容の少なくとも一部を含むと判定された場合に、前記第2の録音ファイルの少なくとも一部を含む第3の録音ファイルを第1の録音装置に送信する送信処理手段と
    を具備する電子機器。
  2. 前記判定処理手段は、前記第1の録音ファイルおよび前記第2の録音ファイルの一定音声区間毎に有音判定または有音無音判定を行い、前記有音判定または前記有音無音判定の判定結果に基づいて、前記第2の録音ファイルの録音内容が前記第1の録音ファイルの録音内容の少なくとも一部を含むかを判定する
    請求項1に記載の電子機器。
  3. 前記判定処理手段は、
    前記第1の録音ファイルに対して一定音声区間毎に話者識別を行い、
    前記第1の録音ファイルおよび前記第2の録音ファイルに対して有音判定または有音無音判定を前記一定音声区間毎に行い、
    識別された話者の内の一人の話者の前記有音判定または前記有音無音判定が一致した場合に、前記第2の録音ファイルの録音内容が前記第1の録音ファイルの録音内容の少なくとも一部を含むと判定する、
    請求項2に記載の電子機器。
  4. 前記第1の録音ファイルの一部を含む第4の録音ファイルと、前記第2の録音ファイルを含む第5の録音ファイルとに対して、前記有音判定または前記有音無音判定を行う
    請求項2に記載の電子機器。
  5. 前記複数の録音ファイルから、前記第1の録音ファイルに対応する第6の録音ファイルが更に検索された場合、前記送信処理手段は、前記第2の録音ファイルと前記第6の録音ファイルの内から録音品質が良い録音ファイルを前記第1の録音装置に送信する
    請求項1に記載の電子機器。
  6. 前記第2の録音ファイルの録音品質が、前記第6の録音ファイルの録音品質よりも高く、前記第6の録音ファイルの録音内容が、前記第2の録音ファイルの録音内容に含まれない録音内容を含む場合、前記第6の録音ファイルから前記第2の録音ファイルの録音内容に含まれない録音内容を含む第7の録音ファイルを切り出し、前記第2の録音ファイルと前記第7の録音ファイルとを結合する、結合処理手段
    を更に具備する請求項5に記載の電子機器。
  7. 前記第3の録音ファイルの音声内容は、前記第2の録音ファイルの音声内容の全てを含む請求項1に記載の電子機器。
  8. 録音場所を示す位置情報と、録音日時を示す時間情報とがそれぞれ関連付けられ、複数の録音装置によって作成された複数の録音ファイルから、各録音ファイルに関連付けられている位置情報および時間情報に基づいて、指定された第1の録音ファイルに対応する第2の録音ファイルを検索し、
    前記第2の録音ファイルの録音内容が前記第1の録音ファイルの録音内容の少なくとも一部を含むかを判定し、
    前記第2の録音ファイルの録音内容が前記第1の録音ファイルの録音内容の少なくとも一部を含むと判定された場合に、前記第2の録音ファイルの少なくとも一部を含む第3の録音ファイルを第1の録音装置に送信する
    録音ファイル送信方法。
  9. 録音場所を示す位置情報と、録音日時を示す時間情報とがそれぞれ関連付けられ、複数の録音装置によって作成された複数の録音ファイルから、各録音ファイルに関連付けられている位置情報および時間情報に基づいて、指定された第1の録音ファイルに対応する第2の録音ファイルを検索する手順と、
    前記第2の録音ファイルの録音内容が、前記第1の録音ファイルの録音内容の少なくとも一部を含むかを判定する手順と、
    前記第2の録音ファイルの録音内容が前記第1の録音ファイルの録音内容の少なくとも一部を含むと判定された場合に、前記第2の録音ファイルの少なくとも一部を含む第3の録音ファイルを第1の録音装置に送信する手順とを
    コンピュータに実行させるプログラム。
JP2013248153A 2013-11-29 2013-11-29 電子機器および録音ファイル送信方法 Pending JP2015106058A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013248153A JP2015106058A (ja) 2013-11-29 2013-11-29 電子機器および録音ファイル送信方法
US14/535,158 US20150155001A1 (en) 2013-11-29 2014-11-06 Electronic apparatus and recording file transmission method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013248153A JP2015106058A (ja) 2013-11-29 2013-11-29 電子機器および録音ファイル送信方法

Publications (1)

Publication Number Publication Date
JP2015106058A true JP2015106058A (ja) 2015-06-08

Family

ID=53265842

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013248153A Pending JP2015106058A (ja) 2013-11-29 2013-11-29 電子機器および録音ファイル送信方法

Country Status (2)

Country Link
US (1) US20150155001A1 (ja)
JP (1) JP2015106058A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017167318A (ja) * 2016-03-16 2017-09-21 株式会社アドバンスト・メディア 議事録生成装置、及び議事録生成プログラム
JP6433003B1 (ja) * 2017-09-04 2018-12-05 Necプラットフォームズ株式会社 通話録音システム、通話録音方法および通話録音プログラム

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10963841B2 (en) 2019-03-27 2021-03-30 On Time Staffing Inc. Employment candidate empathy scoring system
US10728443B1 (en) 2019-03-27 2020-07-28 On Time Staffing Inc. Automatic camera angle switching to create combined audiovisual file
US11127232B2 (en) 2019-11-26 2021-09-21 On Time Staffing Inc. Multi-camera, multi-sensor panel data extraction system and method
US11023735B1 (en) 2020-04-02 2021-06-01 On Time Staffing, Inc. Automatic versioning of video presentations
US11144882B1 (en) 2020-09-18 2021-10-12 On Time Staffing Inc. Systems and methods for evaluating actions over a computer network and establishing live network connections
US11727040B2 (en) 2021-08-06 2023-08-15 On Time Staffing, Inc. Monitoring third-party forum contributions to improve searching through time-to-live data assignments
US11423071B1 (en) 2021-08-31 2022-08-23 On Time Staffing, Inc. Candidate data ranking method using previously selected candidate data
US11907652B2 (en) 2022-06-02 2024-02-20 On Time Staffing, Inc. User interface and systems for document creation

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017167318A (ja) * 2016-03-16 2017-09-21 株式会社アドバンスト・メディア 議事録生成装置、及び議事録生成プログラム
JP6433003B1 (ja) * 2017-09-04 2018-12-05 Necプラットフォームズ株式会社 通話録音システム、通話録音方法および通話録音プログラム
WO2019044147A1 (ja) * 2017-09-04 2019-03-07 Necプラットフォームズ株式会社 通話録音システム、通話録音方法および通話録音プログラム
JP2019047381A (ja) * 2017-09-04 2019-03-22 Necプラットフォームズ株式会社 通話録音システム、通話録音方法および通話録音プログラム
US10979562B2 (en) 2017-09-04 2021-04-13 Nec Platforms, Ltd. Call recording system, call recording method, and call recording program

Also Published As

Publication number Publication date
US20150155001A1 (en) 2015-06-04

Similar Documents

Publication Publication Date Title
JP2015106058A (ja) 電子機器および録音ファイル送信方法
JP6513749B2 (ja) 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム
US10475464B2 (en) Method and apparatus for connecting service between user devices using voice
US9609441B2 (en) Smart hearing aid
CN106663430B (zh) 使用用户指定关键词的说话者不相依关键词模型的关键词检测
US8874448B1 (en) Attention-based dynamic audio level adjustment
US20180158441A1 (en) Karaoke processing method and system
EP3382707B1 (en) Audio file re-recording method, device and storage medium
US9466310B2 (en) Compensating for identifiable background content in a speech recognition device
EP2827252A1 (en) Device and method for providing user activity information in portable terminal
JP2017509009A (ja) オーディオストリームの中の音楽の追跡
CN110097895B (zh) 一种纯音乐检测方法、装置及存储介质
US20120053937A1 (en) Generalizing text content summary from speech content
WO2017101260A1 (zh) 音频切换方法、装置以及存储介质
CN109637541B (zh) 语音转换文字的方法和电子设备
WO2019061292A1 (zh) 一种终端降噪方法及终端
WO2016110156A1 (zh) 语音搜索方法、装置、终端和计算机存储介质
CN113658581B (zh) 声学模型的训练、语音处理方法、装置、设备及存储介质
US11166118B1 (en) Mobile aware intermodal assistant
US9860365B2 (en) Providing setting adjustments to a communication device
CN109671444B (zh) 一种语音处理方法及装置
CN111046219B (zh) 音频文件存储、搜索的方法、装置、终端、服务器及系统
US20240194199A1 (en) Information processing device
US20240193205A1 (en) Information processing device, information processing method, and non-transitory storage medium
JP6829606B2 (ja) カラオケシステム、サーバ装置