JP2005012339A - Speech recording system - Google Patents

Speech recording system Download PDF

Info

Publication number
JP2005012339A
JP2005012339A JP2003172026A JP2003172026A JP2005012339A JP 2005012339 A JP2005012339 A JP 2005012339A JP 2003172026 A JP2003172026 A JP 2003172026A JP 2003172026 A JP2003172026 A JP 2003172026A JP 2005012339 A JP2005012339 A JP 2005012339A
Authority
JP
Japan
Prior art keywords
data
call
call content
recording
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003172026A
Other languages
Japanese (ja)
Inventor
Tetsuya Taguchi
哲也 田口
Masato Iwanaga
正人 岩永
Kingo Tabata
金悟 田畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brainyworks Ltd
Original Assignee
Brainyworks Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brainyworks Ltd filed Critical Brainyworks Ltd
Priority to JP2003172026A priority Critical patent/JP2005012339A/en
Publication of JP2005012339A publication Critical patent/JP2005012339A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a speech recording system wherein voice data can easily be diverted for other applications and can easily be searched. <P>SOLUTION: The system is provided with a phone terminal 1 and an operator terminal 2 that is connected to the phone terminal 1, records a speech via the phone terminal 1 to acquire the recording as voice data, and receives the outline of the speech as character data. Related data are given to the voice data and the character data and thereafter the resulting data are stored in a voice database server 4 and a speech contents database server 5. A server 3 provides a searching application for searching data in the databases 4, 5 to a staff terminal 6 in charge. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、電話による通話を音声データとして保存すると共に、その通話の内容や日時等を示す内容データをデータベースに保存し、関係者に後にこれらデータを提供することができるように構成した通話録音システムに関する。
【0002】
【従来の技術】
コールセンターなどのオペレータが、不在の担当者に代わって発呼者と通話し、その通話内容を音声データとして録音してデータベースサーバ等に保存し、関係者が後ほどこのデータベースサーバにアクセスすることにより、その音声を聞くことができるようにした通話録音システムが、例えば特許文献1により知られている。このシステムでは、オペレータが、通話をしながらその内容を文字入力し、この文字データを通話内容データとして、音声データと共に保存するようにしている。
【0003】
【特許文献1】
特開平8−195815号公報(第3頁、図1等)
【発明が解決しようとする課題】
【0004】
しかしながら、この特許文献1の通話録音システムでは、音声データと、通話内容データとを一体とした特殊形式のデータを生成し、これをデータベースに保存するものであった。このため、後に録音された音声データのみを、別の用途に転用したい場合であっても、この特殊形式のデータをそのまま音声再生用ソフトウエア等で再生させることはできず、音声データの利用の範囲が狭いものであった。
本発明は、この点に鑑みてなされたものであり、音声データの別の用途への転用が容易であり、その検索も容易である通話録音システムを提供することを目的とする。
【0005】
【課題を解決するための手段】
上記目的達成のため、本発明に係る通話録音システムは、電話回線網に接続される電話端末と、前記電話端末を介した通話を録音して音声データとして取得する録音手段と、前記録音手段による録音の開始及び終了を指示する指示手段と、前記通話の概要のデータを含む通話内容データを入力するための通話内容データ入力手段と、前記音声データを格納する音声データベースと、前記通話内容データを格納する通話内容データベースと、前記指示手段による指示がされた時間との関係で前記音声データと前記通話内容データを関連付ける関連付け情報を生成する関連付け情報生成手段と、検索条件を基にして前記通話内容データを前記通話内容データベースから検索すると共に、検索された前記通話内容データに係る前記関連付け情報を基にして前記音声データを前記音声データベースより検索する検索手段とを備えたことを特徴とする。
【0006】
この発明によれば、発呼者からの電話端末による通話が、録音手段により音声データとして録音され、録音の開始及び終了は、指示手段により指示される。一方、通話内容データ入力手段により、前記通話の概要を示す通話内容データが通話内容データとして入力される。音声データは音声データベースに、通話内容データは通話内容データベースにそれぞれ入力される。そして、関連付け情報生成手段において、前記指示手段による指示がされた時間との関係で前記音声データと通話内容データとを関連付ける関連付け情報が生成される。こうして、音声データベース及び通話内容データベースへのデータの格納、並びに関連付け情報の生成が終了した後、検索手段において検索条件を入力して通話内容データベースから通話内容データを検索すると、その検索された通話内容データに係る関連付け情報に基づいて、前記音声データベースより音声データベースが検索される。この発明では、音声データを音声データベースに格納し、通話内容データとは別個に格納するため、音声データの別の用途への転用が容易となっていると共に、関連付け情報により、検索も容易に行うことができる。
【0007】
この通話録音システムにおいて、前記音声データは、前記指示手段による録音の開始又は終了の指示がされた時間を示す時間データを付加されており、前記関連付け情報付与手段は、前記時間データが示す時間と共通する時間に作成された前記通話内容データを、前記音声データと関連付けるものとすることができる。
また、前記関連付け情報生成手段は、前記音声データを含むファイルと、前記通話内容データを含むファイルとに、同一のファイル名を前記関連付け情報として付与するものとすることができる。
【0008】
【発明の実施の形態】
以下、本発明の実施の形態を、図面に基づいて詳細に説明する。
図1は、本発明の実施の形態に係る通話録音システムが適用されたコンピュータネットワーク100を示している。この図1に基づいて、本システムの概要を説明する。このコンピュータネットワーク100は、オペレータが応対する電話端末1と、オペレータにより操作されるオペレータ端末2と、サーバ3と、音声データベースサーバ4と、通話内容データベースサーバ5と、各担当者、すなわち、電話端末1上で行われる通話に本来応対すべき者(例えば研究部門の研究者、営業部門の営業担当など)により操作される担当者端末6と、これらのサーバや端末を接続するLAN(Local Area Network)7とにより構成される。
【0009】
オペレータ端末2は、オペレータが、電話端末1において発呼者と自身との間でやりとりされる通話を録音して音声データとして保存するための録音手段、及びその通話の概要等を通話内容データとして入力するための入力手段として機能するものである。
【0010】
サーバ3は、オペレータ端末2による音声データ、通話内容データの取得後、これらのデータを担当者端末6による検索の用に供するための環境を提供するものである。例えばサーバ3は、受け取った音声データ及び通話内容データを、それぞれ、音声データベースサーバ4及び通話内容データベースサーバ5に格納する。このとき、サーバ3は、後の検索の便宜のため、両データを関連付ける関連付け情報を生成してこれを保存する。また、サーバ3は、音声データベースサーバ4及び通話内容データベースサーバ5に格納されたデータを担当者端末6において検索するための検索用アプリケーションを、サーバサイドプログラムとして各担当者端末6に提供する。担当者端末6は、WWWブラウザ・ソフトウエアを格納しており、これにより、サーバ3から提供される検索アプリケーションを起動可能にしている。
【0011】
次に、図2に基づいて、オペレータ端末2の構成を説明する。オペレータ端末2は、制御装置としてのCPU20、記憶装置としてのROM21、RAM22及びハードディスクドライブ(HDD)23、入力装置としてのマウス24及びキーボード25、出力装置としてのディスプレイ26及びスピーカ27を備えている。また、オペレータ端末2は、電話端末1から得られる音声信号をサンプリング及び符号化して、ディジタル音声信号に変換する信号変換部28と、LAN7に接続するためのインタフェース(I/F)29とを備えている。
【0012】
HDD23には、基本ソフトウエア(OS)23aの他、アプリケーションソフトウエアとして、録音再生アプリケーション23b、音声圧縮アプリケーション23c、文字入力アプリケーション23d等を格納している。
録音再生アプリケーション23bは、信号変換部28から送信されたディジタル音声信号を、例えばwav形式の音声ファイル(wavファイル)として保存するとともに、そのwavファイルを再生するアプリケーションである。すなわち、この録音再生アプリケーション23bが、RAM24等の記憶手段と共に録音手段を構成している。
【0013】
音声圧縮アプリケーション23cは、保存されたwavファイルを、所定の圧縮形式でoggファイルなどの圧縮ファイルに変換するものである。
文字入力アプリケーション23dは、オペレータが通話中に、通話の内容を聞きながら、所定の事項をマウス24又はキーボード25により入力するためのものである。すなわち、この文字入力アプリケーション23dが、マウス24等の入力装置と共に通話内容データ入力手段を構成している。
【0014】
続いて、図3及び図4に基づいて、オペレータ端末2による音声データ及び通話内容データの取得手順を説明する。
図3は、この文字入力アプリケーション23dの、ディスプレイ26上に表示される実行画面の一例を示している。この実行画面には、事項入力欄31、ボリューム調整部32、及び録音等指示部33が表示される。
事項入力欄31は、オペレータが、電話端末1での発呼者の話の内容を聞きながら、所定の事項をキーボード25を使用して入力するための欄である。事項入力欄31には、例えば、「タイトル」入力欄31a、「商品名」入力欄31b、「種別」入力欄31c、「緊急度」入力欄31d、「概要」入力欄31e等の欄が設けられる。「概要」入力欄31e以外の欄31a−31dには、その右端にプルダウンボタンが設けられる。これをクリックすることにより、頻繁に選択される選択肢が複数表示され、オペレータはこの中から適当な選択肢を選択できるようになっている。例えば、「緊急度」入力欄31dのプルダウンボタンをクリックすると、緊急度を示す選択肢として、「高」「中」「低」の3つが表示され、任意の1つが選択可能となる。
【0015】
ボリューム調整部32は、録音時、及び再生時のボリュームを調整するためのものである。オペレータは、ノブ32aをマウス24でドラグすることにより、ノブ32aを左右方向に移動させることができ、これにより録音、再生のボリュームを調整することができる。
【0016】
録音等指示部33は、各種ボタン33a〜33fを備え、これにより録音再生アプリケーション23bに対し、電話端末1上での通話の音声の録音や再生等を指示するためのものである。Playボタン33aは、録音された音声の再生の開始を指示するものである。Playボタン33aが押されると、録音再生アプリケーション23bが起動され、指定された音声ファイルの再生が開始される。Pauseボタン33bは、録音及び再生の一時停止を指示するためのものである。Stopボタン33cは、録音及び再生の停止を指示するためのものである。
【0017】
また、Recボタン33dは、通話の録音の開始を指示するためのものである。Saveボタン33eは、wavファイルを、圧縮ファイル形式であるoggファイルに変換して保存することを指示するためのものである。
また、Exitボタン33fは、この文字入力アプリケーション23d自体を終了する場合にクリックされるものである。
【0018】
このオペレータ端末2における、通話の録音、及び通話内容を示す通話内容データの入力及び保存の手順を、図4に示すフローチャートに従って説明する。
発呼者からの着信があり(S1)、Recボタン33dが押されると(S2)、録音再生アプリケーション23bがwavファイルの生成を開始する(S3)。一方、オペレータは、このwavファイルの生成開始と並行して、発呼者との通話を行いつつ、その内容を文字データとして事項入力欄31へ入力することを開始する(S4)。発呼者との通話が終わり(又は録音を継続する必要がなくなり)、Stopボタン33cが押されると(S5)、wavファイルがRAM22に保存される(S6)。
【0019】
その後さらにSaveボタン33eが押されると(S7)、音声圧縮アプリケーション23cが起動し、RAM22等に一旦保存されたwavファイルがoggファイルに変換されてRAM22等に保存される(S8)。この保存の際、oggファイルには、録音等指示部33により指定された、Wavファイル作成開始の日時に対応するファイル名が付与される。例えば、2003年6月12日の、15時47分30秒に当該oggファイルが保存された場合には、「2003−06−12_154730.ogg」というファイル名が付与される。
【0020】
その後、文字入力アプリケーション23dは、事項入力欄31に入力された通話内容データを、テキストファイル(txtファイル)に変換して、RAM22等に保存する(S9)。この際、このtxtファイルには、同時に取得したoggファイルに付与されたファイル名と同様のファイル名が付与される。例えば、oggファイルに付与されたファイル名が「2003−06−12_154730.ogg」である場合、対応するtxtファイルのファイル名は、「2003−06−12_154730.ogg」となる。
このようにして、オペレータ端末2における、音声データとしてのoggファイル、通話内容データとしてのtxtファイルの取得が完了する。なお、オペレータは、playボタン33aを押すことにより、oggファイルの内容をスピーカ27から音声出力させて確認することも可能である。
【0021】
次に、サーバ3、音声データベースサーバ4及び通話内容データベースサーバ5における、データベースサーバ4及び5への音声データ及び通話内容データの格納動作を、図5に基づいて説明する。
同一ファイル名を冠したoggファイルとtxtファイルとを取得したオペレータ端末2は、サーバ3にアクセスし、これらのデータのアップロードを要求するコマンドであるSQL−Insertを出力する(S11)。SQL−Insertを受け取ったサーバ3は、認証のため、オペレータ端末2にID及びパスワードの入力を要求する(S12)。
【0022】
ID及びパスワードが正規のものであれば、サーバ3はオペレータ端末6を正規のものと認証する。これにより、オペレータ端末6は、oggファイル及びtxtファイルをサーバ3にアップロードすることができる(S13)。この後、サーバ3は、後の検索の便宜のため、ogg、txt両ファイルを関連付ける関連付けデータを生成してこれを保存する(S14)。そして、サーバ3は、oggファイル及びtxtファイルを、それぞれ、音声データベースサーバ4及び通話内容データベースサーバ5に格納する(S15)。
以上のようにして、oggファイル及びtxtファイルの、音声データベースサーバ4及び通話内容データベースサーバ5への格納が完了する。
【0023】
次に、このようにして音声データベースサーバ4及び通話内容データベースサーバ5へ格納されたoggファイル及びtxtファイルからなる通話データを、担当者端末6から検索するための構成を説明する。
サーバ3は、音声データベースサーバ4及び通話内容データベースサーバ5に格納されたデータを担当者端末6において検索するための検索用アプリケーションを、サーバサイドプログラムとして各担当者端末6に提供する。各担当者端末6は、サーバ3にアクセスすることにより、この検索用アプリケーションを実行することができる。
図6は、この検索用アプリケーションによる、検索結果一覧を表示した画面の一例を示している。各担当者端末6がサーバ6にアクセスすると、サーバ3は、その担当者端末6の所有者宛ての通話に係るtxtファイルを検索し、その検索結果を検索結果一覧として図6に示すようにリストアップするものである。
【0024】
図7は、この検索用アプリケーションによる、txtファイルおよびoggファイルの検索及び閲覧の手順を概念的に示している。
まず、担当者端末6は、サーバ3にアクセスした後、ID及びパスワードと共に、自分宛ての通話のデータの検索を要求するコマンドSQL−Inquiryを、サーバ3に向けて出力する(S21)。
サーバ3は、このコマンドSQL−Inquiryを受けて、アクセス中の担当者端末6宛てのtxtファイルを、入力されたIDに基づいて通話内容データベース5から検索し、その検索結果一覧を、図6に示すように担当者端末6上で表示させる(S22)。
【0025】
担当者端末6を操作する所有者は、この図6に示すような検索結果一覧画面を見て、その詳細を見たいと思う項目を見つけた場合には、その項目中の「詳細」ボタン41をマウス24でクリックする(S23)。これにより、サーバ3が、該当するtxtファイルを通話内容データベースサーバ5から検索し、これを担当者端末6に送信する。担当者端末6の所有者は、図示しないビューアソフトウエア等を起動することにより、このtxtファイルの内容を閲覧することができる。
【0026】
また、担当者端末6の所有者が、図6に示す検索結果一覧画面を見て、その通話の音声データを聞きたいと思う項目を見つけた場合には、その項目中の「再生」ボタン42をマウス24でクリックする。これにより、サーバ3が、該当するoggファイルを、保存された関連付けデータ(図5のS14)に基づいて、音声データベースサーバ4から検索し、これを担当者端末6にこれを送信する。担当者端末6では、図示しない音声再生ソフトウエアを起動することにより、このoggファイルに格納された通話を聞くことができる。
このように、本実施の形態では、音声圧縮ファイルとして広く利用されるoggファイルを音声データベースサーバ4に格納し、通話内容を含むtxtファイルとは別個に通話内容データベースサーバ5に格納している。このため、oggファイルを、他の用途に転用する場合にでも、特別なファイル変換作業等をすることなく、一般的な音声再生アプリケーションにより再生することができる。
【0027】
[変形例]
以上、発明の実施の形態を説明したが、本発明はこれに限定されるものではない。例えば、上記実施の形態では、ファイル名でoggファイルとtxtファイルの関連付けを行ったが、例えば、対応するoggファイルとtxtファイルとを、そのプロパティに示された作成日時データを取得し、この作成日時データに基づいて両ファイルを関連付けてもよい。この場合、対応する両ファイルのファイル名は同一のものとする必要は無い。
【0028】
また、上記の実施の形態では、音声圧縮アプリケーション23cをオペレータ端末2のHDD23に格納するようにしていたが、サーバ3がこのような音声圧縮アプリケーションを備え、oggファイルへの変換動作をサーバ3に委ねるようにしてもよい。
また、上記の実施の形態では、通話内容の入力は、文字入力アプリケーション23dにより、マウス24やキーボード25を使用して入力するようにしていたが、例えば音声認識ソフトウエアを設け、これにより認識された音声を文字に変換し、この文字を通話内容データとすることもできる。
また、上記の実施の形態では、オペレータ端末2とサーバ3とをLAN7によりネットワーク接続していたが、オペレータ端末2をスタンドアロン、すなわちネットワークと接続されない端末とし、オペレータ端末2が取得したデータを、DVD−RAMやCD−Rなどの搬送可能な記録媒体に記録し、サーバ3にオフラインで手渡すようにしてもよい。
【0029】
【発明の効果】
以上述べたように、音声データを音声データベースに格納し、通話内容データは通話内容データベースに別個に格納するため、音声データの別の用途への転用が容易となる共に、関連付け情報により、検索も容易に行うことができる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る通話録音システムが適用されたコンピュータネットワーク100を示す。
【図2】図1に示すオペレータ端末2の構成を示す。
【図3】オペレータ端末2で実行される文字入力アプリケーション23dの、実行画面の一例を示している。
【図4】オペレータ端末2における、通話の録音、及び通話内容を示す通話内容データの入力及び保存の手順を示すフローチャートである。
【図5】サーバ3による、データベースサーバ4及び5への音声データ及び通話内容データの格納動作を示す概念図である。
【図6】サーバ3により担当者端末6に提供される検索用アプリケーションによる、検索結果一覧を表示した画面の一例を示している。
【図7】サーバ3により担当者端末6に提供される検索用アプリケーションによる、txtファイルおよびoggファイルの検索及び閲覧の手順を概念的に示している。
【符号の説明】
100・・・コンピュータネットワーク、 1・・・電話端末、 2・・・オペレータ端末 3・・・サーバ、 4・・・音声データベースサーバ、 5・・・通話内容データベースサーバ、 6・・・担当者端末、7・・・LAN、 20・・・CPU、 21・・・ROM、 22・・・RAM、 23・・・ハードディスクドライブ、 24・・・マウス、 25・・・キーボード、 26・・・ディスプレイ、 27・・・スピーカ、 28・・・信号変換部、 29・・・インタフェース、 31・・・事項入力欄、 32・・・ボリューム調整部、 33・・・録音等指示部。
[0001]
BACKGROUND OF THE INVENTION
The present invention saves a telephone call as voice data, and saves contents data indicating the contents and date / time of the call in a database so that the data can be provided to related parties later. About the system.
[0002]
[Prior art]
An operator such as a call center makes a call with a caller on behalf of an absent person, records the call content as voice data, stores it in a database server, etc., and the related parties later access this database server, A call recording system that can listen to the voice is known, for example, from Japanese Patent Application Laid-Open No. H10-228707. In this system, the operator inputs the contents while making a call and saves the character data as call contents data together with the voice data.
[0003]
[Patent Document 1]
JP-A-8-195815 (Page 3, FIG. 1 etc.)
[Problems to be solved by the invention]
[0004]
However, in the call recording system disclosed in Patent Document 1, data in a special format in which voice data and call content data are integrated is generated and stored in a database. For this reason, even if only audio data recorded later is to be used for other purposes, this special format data cannot be reproduced as it is with audio reproduction software or the like. The range was narrow.
The present invention has been made in view of this point, and an object of the present invention is to provide a call recording system in which voice data can be easily diverted to another use and can be easily searched.
[0005]
[Means for Solving the Problems]
To achieve the above object, a call recording system according to the present invention comprises a telephone terminal connected to a telephone network, a recording means for recording a call via the telephone terminal and acquiring it as voice data, and the recording means. Instruction means for instructing the start and end of recording, call content data input means for inputting call content data including the outline data of the call, a voice database for storing the voice data, and the call content data Association information generating means for generating association information for associating the voice data with the call content data in relation to a call content database to be stored and a time when an instruction is given by the instruction means; and the call content based on a search condition Data is retrieved from the call content database and based on the association information related to the retrieved call content data. Characterized in that a search means for searching from the audio database the voice data.
[0006]
According to the present invention, a call from a caller to a telephone terminal is recorded as voice data by the recording means, and the start and end of the recording are instructed by the instruction means. On the other hand, call content data indicating the outline of the call is input as call content data by the call content data input means. The voice data is input to the voice database, and the call content data is input to the call content database. Then, in the association information generating means, association information for associating the voice data with the call content data in relation to the time when the instruction is given by the instruction means is generated. Thus, after storing the data in the voice database and the call content database and generating the association information, when the search content is searched for in the call content database by inputting the search condition in the search means, the retrieved call content A speech database is searched from the speech database based on the association information related to the data. According to the present invention, the voice data is stored in the voice database and stored separately from the call content data. Therefore, the voice data can be easily used for another purpose, and the search can be easily performed using the association information. be able to.
[0007]
In this call recording system, the voice data is added with time data indicating a time when the instruction means instructs to start or end recording, and the association information providing means includes the time indicated by the time data. The call content data created at a common time may be associated with the voice data.
Further, the association information generating means may give the same file name as the association information to the file including the voice data and the file including the call content data.
[0008]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
FIG. 1 shows a computer network 100 to which a call recording system according to an embodiment of the present invention is applied. The outline of this system will be described based on FIG. The computer network 100 includes a telephone terminal 1 to which an operator responds, an operator terminal 2 operated by the operator, a server 3, a voice database server 4, a call content database server 5, and each person in charge, that is, a telephone terminal. 1 is a person-in-charge terminal 6 operated by a person who should originally respond to a call made on the network (for example, a researcher in a research department or a salesperson in a sales department), and a LAN (Local Area Network) connecting these servers and terminals. 7).
[0009]
The operator terminal 2 is a recording means for the operator to record a call exchanged between the caller and itself at the telephone terminal 1 and store it as voice data, and an outline of the call as call content data. It functions as an input means for inputting.
[0010]
The server 3 provides an environment for providing these data for retrieval by the person-in-charge terminal 6 after obtaining the voice data and the call content data by the operator terminal 2. For example, the server 3 stores the received voice data and call content data in the voice database server 4 and the call content database server 5, respectively. At this time, the server 3 generates association information for associating both data and saves it for the convenience of later retrieval. In addition, the server 3 provides each person-in-charge terminal 6 with a search application for searching the person-in-charge terminal 6 for data stored in the voice database server 4 and the call content database server 5 as a server-side program. The person-in-charge terminal 6 stores WWW browser software, thereby enabling the search application provided from the server 3 to be activated.
[0011]
Next, the configuration of the operator terminal 2 will be described based on FIG. The operator terminal 2 includes a CPU 20 as a control device, a ROM 21, a RAM 22 and a hard disk drive (HDD) 23 as a storage device, a mouse 24 and a keyboard 25 as input devices, a display 26 and a speaker 27 as output devices. The operator terminal 2 also includes a signal conversion unit 28 that samples and encodes a voice signal obtained from the telephone terminal 1 and converts it into a digital voice signal, and an interface (I / F) 29 for connection to the LAN 7. ing.
[0012]
In addition to the basic software (OS) 23a, the HDD 23 stores a recording / playback application 23b, a voice compression application 23c, a character input application 23d, and the like as application software.
The recording / reproducing application 23b is an application for saving the digital audio signal transmitted from the signal converting unit 28 as, for example, a wav format audio file (wav file) and reproducing the wav file. That is, the recording / playback application 23b constitutes recording means together with storage means such as the RAM 24.
[0013]
The audio compression application 23c converts the saved wav file into a compressed file such as an ogg file in a predetermined compression format.
The character input application 23d is for an operator to input predetermined items with the mouse 24 or the keyboard 25 while listening to the contents of the call during the call. That is, the character input application 23d constitutes call content data input means together with an input device such as a mouse 24.
[0014]
Next, a procedure for acquiring voice data and call content data by the operator terminal 2 will be described with reference to FIGS. 3 and 4.
FIG. 3 shows an example of an execution screen displayed on the display 26 of the character input application 23d. On this execution screen, an item input field 31, a volume adjustment unit 32, and a recording instruction unit 33 are displayed.
The item input column 31 is a column for the operator to input predetermined items using the keyboard 25 while listening to the content of the caller's story on the telephone terminal 1. The item input field 31 includes fields such as a “title” input field 31a, a “product name” input field 31b, a “type” input field 31c, an “emergency” input field 31d, and a “summary” input field 31e. It is done. A pull-down button is provided at the right end of each of the fields 31a-31d other than the “Summary” input field 31e. By clicking this, a plurality of frequently selected options are displayed, and the operator can select an appropriate option from these. For example, when the pull-down button of the “Urgent Level” input field 31d is clicked, three options “high”, “medium”, and “low” are displayed as options indicating the urgent level, and any one can be selected.
[0015]
The volume adjustment unit 32 is for adjusting the volume during recording and reproduction. The operator can move the knob 32a in the left-right direction by dragging the knob 32a with the mouse 24, thereby adjusting the recording and playback volume.
[0016]
The recording instruction unit 33 includes various buttons 33a to 33f, and is used to instruct the recording / reproducing application 23b to record or reproduce the voice of a call on the telephone terminal 1. The Play button 33a is used to instruct the start of reproduction of the recorded voice. When the Play button 33a is pressed, the recording / playback application 23b is started and playback of the designated audio file is started. The Pause button 33b is used to instruct to pause recording and playback. The Stop button 33c is for instructing stop of recording and reproduction.
[0017]
The Rec button 33d is used to instruct the start of call recording. The Save button 33e is for instructing to convert the wav file into an ogg file which is a compressed file format and save it.
The Exit button 33f is clicked when the character input application 23d itself is terminated.
[0018]
The procedure for recording and recording call content data indicating the call content in the operator terminal 2 will be described with reference to the flowchart shown in FIG.
When there is an incoming call from the caller (S1) and the Rec button 33d is pressed (S2), the recording / playback application 23b starts generating a wav file (S3). On the other hand, in parallel with the start of the generation of the wav file, the operator starts inputting the contents as character data into the item input field 31 while making a call with the caller (S4). When the call with the caller ends (or there is no need to continue recording) and the Stop button 33c is pressed (S5), the wav file is saved in the RAM 22 (S6).
[0019]
Thereafter, when the Save button 33e is further pressed (S7), the voice compression application 23c is activated, and the wav file once stored in the RAM 22 or the like is converted into an ogg file and stored in the RAM 22 or the like (S8). At the time of saving, the ogg file is given a file name corresponding to the start date and time of the Wav file creation specified by the recording instruction unit 33. For example, when the ogg file is saved at 15:47:30 on June 12, 2003, the file name “2003-06-12_154730.ogg” is given.
[0020]
Thereafter, the character input application 23d converts the call content data input in the item input field 31 into a text file (txt file) and stores it in the RAM 22 or the like (S9). At this time, a file name similar to the file name assigned to the og file acquired at the same time is assigned to the txt file. For example, when the file name given to the ogg file is “2003-06-12_154730.ogg”, the file name of the corresponding txt file is “2003-06-12_154730.ogg”.
In this way, the operator terminal 2 completes the acquisition of the ogg file as the voice data and the txt file as the call content data. The operator can also check the contents of the ogg file by outputting the sound from the speaker 27 by pressing the play button 33a.
[0021]
Next, the storage operation of voice data and call content data in the database servers 4 and 5 in the server 3, the voice database server 4 and the call content database server 5 will be described with reference to FIG.
The operator terminal 2 that has acquired the ogg file and the txt file bearing the same file name accesses the server 3 and outputs SQL-Insert, which is a command for requesting uploading of these data (S11). Upon receiving the SQL-Insert, the server 3 requests the operator terminal 2 to input an ID and password for authentication (S12).
[0022]
If the ID and password are legitimate, the server 3 authenticates the operator terminal 6 as legitimate. Thereby, the operator terminal 6 can upload an ogg file and a txt file to the server 3 (S13). Thereafter, the server 3 generates association data for associating both the ogg and txt files and saves them for convenience of later retrieval (S14). Then, the server 3 stores the ogg file and the txt file in the voice database server 4 and the call content database server 5 respectively (S15).
As described above, the storage of the ogg file and the txt file in the voice database server 4 and the call content database server 5 is completed.
[0023]
Next, a configuration for retrieving call data composed of the ogg file and the txt file stored in the voice database server 4 and the call content database server 5 in this way from the person-in-charge terminal 6 will be described.
The server 3 provides each person-in-charge terminal 6 with a search application for retrieving data stored in the voice database server 4 and the call content database server 5 in the person-in-charge terminal 6 as a server-side program. Each person-in-charge terminal 6 can execute this search application by accessing the server 3.
FIG. 6 shows an example of a screen displaying a search result list by this search application. When each person-in-charge terminal 6 accesses the server 6, the server 3 searches for a txt file related to a call addressed to the owner of the person-in-charge terminal 6, and lists the search results as a search result list as shown in FIG. It is something to be up.
[0024]
FIG. 7 conceptually shows a procedure for searching and browsing the txt file and the ogg file by this search application.
First, the person-in-charge terminal 6 accesses the server 3 and then outputs a command SQL-Inquiry for requesting retrieval of data of a call addressed to the server 3 to the server 3 together with the ID and password (S21).
Upon receiving this command SQL-Inquiry, the server 3 searches the call content database 5 for a txt file addressed to the person-in-charge terminal 6 being accessed based on the input ID, and a list of search results is shown in FIG. As shown, it is displayed on the person-in-charge terminal 6 (S22).
[0025]
When the owner operating the person-in-charge terminal 6 looks at the search result list screen as shown in FIG. 6 and finds an item for which details are desired, the “detail” button 41 in the item is displayed. Is clicked with the mouse 24 (S23). As a result, the server 3 searches the call content database server 5 for the corresponding txt file and transmits it to the person-in-charge terminal 6. The owner of the person-in-charge terminal 6 can view the contents of the txt file by starting up viewer software (not shown).
[0026]
Further, when the owner of the person-in-charge terminal 6 looks at the search result list screen shown in FIG. 6 and finds an item for which he / she wants to hear the voice data of the call, the “play” button 42 in that item is displayed. Is clicked with the mouse 24. As a result, the server 3 searches the voice database server 4 for the corresponding ogg file based on the stored association data (S14 in FIG. 5), and transmits it to the person-in-charge terminal 6. The person-in-charge terminal 6 can listen to the call stored in the ogg file by starting up sound reproduction software (not shown).
As described above, in the present embodiment, an ogg file widely used as a voice compression file is stored in the voice database server 4 and stored in the call content database server 5 separately from the txt file including the call content. Therefore, even when the ogg file is diverted to other uses, it can be reproduced by a general audio reproduction application without performing a special file conversion operation or the like.
[0027]
[Modification]
As mentioned above, although embodiment of invention was described, this invention is not limited to this. For example, in the above embodiment, the ogg file and the txt file are associated with each other by the file name. For example, the creation date / time data indicated in the property is obtained for the corresponding ogg file and the txt file, and this creation is performed. Both files may be associated based on the date / time data. In this case, the file names of both corresponding files need not be the same.
[0028]
In the above embodiment, the voice compression application 23c is stored in the HDD 23 of the operator terminal 2. However, the server 3 includes such a voice compression application, and the server 3 performs the conversion operation to the og file. It may be entrusted.
In the above embodiment, the content of the call is input using the mouse 24 or the keyboard 25 by the character input application 23d. However, for example, voice recognition software is provided and recognized. It is also possible to convert the voice to characters and use the characters as call content data.
In the above embodiment, the operator terminal 2 and the server 3 are connected to each other via the LAN 7, but the operator terminal 2 is a stand-alone, ie, a terminal that is not connected to the network, and the data acquired by the operator terminal 2 is stored on the DVD. -It may be recorded on a transportable recording medium such as a RAM or a CD-R and handed to the server 3 offline.
[0029]
【The invention's effect】
As described above, since the voice data is stored in the voice database and the call content data is stored separately in the call content database, the voice data can be easily transferred to another application, and the search can be performed by using the association information. It can be done easily.
[Brief description of the drawings]
FIG. 1 shows a computer network 100 to which a call recording system according to an embodiment of the present invention is applied.
2 shows a configuration of the operator terminal 2 shown in FIG.
FIG. 3 shows an example of an execution screen of a character input application 23d executed on the operator terminal 2.
FIG. 4 is a flowchart showing a procedure for recording and recording call content data indicating call content and storing in the operator terminal 2;
FIG. 5 is a conceptual diagram showing an operation of storing voice data and call content data in the database servers 4 and 5 by the server 3;
6 shows an example of a screen displaying a search result list by a search application provided to the person-in-charge terminal 6 by the server 3. FIG.
7 conceptually shows a procedure for searching and browsing a txt file and an ogg file by a search application provided to a person-in-charge terminal 6 by a server 3. FIG.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 100 ... Computer network, 1 ... Telephone terminal, 2 ... Operator terminal 3 ... Server, 4 ... Voice database server, 5 ... Call content database server, 6 ... Person in charge terminal 7 ... LAN, 20 ... CPU, 21 ... ROM, 22 ... RAM, 23 ... hard disk drive, 24 ... mouse, 25 ... keyboard, 26 ... display, 27 ... Speaker, 28 ... Signal conversion unit, 29 ... Interface, 31 ... Item input column, 32 ... Volume adjustment unit, 33 ... Recording etc. instruction unit.

Claims (3)

電話回線網に接続される電話端末と、
前記電話端末を介した通話を録音して音声データとして取得する録音手段と、
前記録音手段による録音の開始及び終了を指示する指示手段と、
前記通話の概要のデータを含む通話内容データを入力するための通話内容データ入力手段と、
前記音声データを格納する音声データベースと、
前記通話内容データを格納する通話内容データベースと、
前記指示手段による指示がされた時間との関係で前記音声データと前記通話内容データを関連付ける関連付け情報を生成する関連付け情報生成手段と、
検索条件を基にして前記通話内容データを前記通話内容データベースから検索すると共に、検索された前記通話内容データに係る前記関連付け情報を基にして前記音声データを前記音声データベースより検索する検索手段と
を備えたことを特徴とする通話録音システム。
A telephone terminal connected to the telephone network;
Recording means for recording a call via the telephone terminal and acquiring it as voice data;
Instruction means for instructing start and end of recording by the recording means;
Call content data input means for inputting call content data including data of the outline of the call;
An audio database for storing the audio data;
A call content database for storing the call content data;
Association information generating means for generating association information for associating the voice data with the call content data in relation to the time when the instruction is given by the instruction means;
Search means for searching the call content data from the call content database based on a search condition and searching the voice data from the voice database based on the association information relating to the searched call content data. A call recording system characterized by comprising.
前記音声データは、前記指示手段による録音の開始又は終了の指示がされた時間を示す時間データを付加されており、前記関連付け情報付与手段は、前記時間データが示す時間と共通する時間に作成された前記通話内容データを、前記音声データと関連付ける請求項1記載の通話録音システム。The voice data is added with time data indicating the time when the instruction means instructs to start or end recording, and the association information adding means is created at a time common to the time indicated by the time data. The call recording system according to claim 1, wherein the call content data is associated with the voice data. 前記関連付け情報生成手段は、前記音声データを含むファイルと、前記通話内容データを含むファイルとに、同一のファイル名を前記関連付け情報として付与するものである請求項1又は2記載の通話録音システム。3. The call recording system according to claim 1, wherein the association information generating unit assigns the same file name as the association information to a file including the audio data and a file including the call content data.
JP2003172026A 2003-06-17 2003-06-17 Speech recording system Pending JP2005012339A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003172026A JP2005012339A (en) 2003-06-17 2003-06-17 Speech recording system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003172026A JP2005012339A (en) 2003-06-17 2003-06-17 Speech recording system

Publications (1)

Publication Number Publication Date
JP2005012339A true JP2005012339A (en) 2005-01-13

Family

ID=34096308

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003172026A Pending JP2005012339A (en) 2003-06-17 2003-06-17 Speech recording system

Country Status (1)

Country Link
JP (1) JP2005012339A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009232016A (en) * 2008-03-21 2009-10-08 Brother Ind Ltd Information processing system and information processor
JP2011525768A (en) * 2008-06-23 2011-09-22 アルカテル−ルーセント Information recovery from telephone terminals via communication server

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009232016A (en) * 2008-03-21 2009-10-08 Brother Ind Ltd Information processing system and information processor
JP4609509B2 (en) * 2008-03-21 2011-01-12 ブラザー工業株式会社 Information processing system
US8751471B2 (en) 2008-03-21 2014-06-10 Brother Kogyo Kabushiki Kaisha Device, system, method and computer readable medium for information processing
JP2011525768A (en) * 2008-06-23 2011-09-22 アルカテル−ルーセント Information recovery from telephone terminals via communication server
US8571196B2 (en) 2008-06-23 2013-10-29 Alcatel Lucent Method for retrieving information from a telephone terminal via a communication server, and associated communication server

Similar Documents

Publication Publication Date Title
US7735012B2 (en) Audio user interface for computing devices
US7574655B2 (en) System and method for encapsulation of representative sample of media object
KR20030019230A (en) Mail transmitting/receiving device and method
JP2004117618A (en) Information processor, content transfer method, and music reproduction apparatus
TW200824408A (en) Methods and systems for information retrieval during communication, and machine readable medium thereof
US11769532B2 (en) Generation and distribution of a digital mixtape
JP2002335478A (en) Video recording reproducing system
JP2005012339A (en) Speech recording system
US8819551B2 (en) Display device and method, and program
JP2006004152A (en) Searching apparatus, searching method, information processing system
JP5342509B2 (en) CONTENT REPRODUCTION DEVICE, CONTENT REPRODUCTION DEVICE CONTROL METHOD, CONTROL PROGRAM, AND RECORDING MEDIUM
KR20070004256A (en) Database searching method and apparatus
JP2002304420A (en) Audio-visual content distribution system
JP2002373075A (en) Voice message bulletin board system, information processing terminal, server and method for transmitting voice message
JP2018169977A (en) Minute book support device, minute book support method, and computer program
JP4396404B2 (en) CONTENT PROVIDING SYSTEM, ITS METHOD, SERVER, AND PROGRAM
JP2005107617A5 (en)
JP2011022883A (en) Data reproducing system and data reproducing method
JP2005107617A (en) Voice data retrieval apparatus
JP4068018B2 (en) Audio equipment
KR100689417B1 (en) Apparatus and method for reproducing link multiple files
JP2006189938A (en) Information distribution terminal, information distribution server, information distribution system, and information distribution method
JP2001243751A (en) Information recording controller
KR20110103626A (en) Apparatus and method for providing tag information of multimedia data in portable terminal
JP4930116B2 (en) Audio playback device, audio data display method, and program