JP2016144024A - 音声メモ保存機能を有する電話装置 - Google Patents
音声メモ保存機能を有する電話装置 Download PDFInfo
- Publication number
- JP2016144024A JP2016144024A JP2015018289A JP2015018289A JP2016144024A JP 2016144024 A JP2016144024 A JP 2016144024A JP 2015018289 A JP2015018289 A JP 2015018289A JP 2015018289 A JP2015018289 A JP 2015018289A JP 2016144024 A JP2016144024 A JP 2016144024A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- sentence
- change
- memo
- voices
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Telephone Function (AREA)
Abstract
【課題】通話中の音声から自動的に話者の質問に対する回答または応答をメモ情報として記録する事が可能な電話装置を提供することにある。
【解決手段】通話録音機能を具備する電話装置において、自装置側/相手装置側が発した音声を検知する音声検知手段と、自装置側/相手装置側のいずれか一方が発した音声を検知すると前記いずれか一方が発した音声から一定時間以上の無音を検知する無音検知手段と、前記無音を検知した無音の所定時間前からの音声の強弱の変化を検知する強弱変化検知手段と、検知した無音の所定時間前からの音声の強弱の変化が疑問文の文末の音声の強弱の変化か否かを判定する疑問文文末判定手段と、を有し、疑問文の文末の音声の強弱の変化であると判定した場合に、前記音声検知手段は、他方の音声を検知し、検知した他方の音声を音声メモとして保存することを特徴とする。
【選択図】図1
【解決手段】通話録音機能を具備する電話装置において、自装置側/相手装置側が発した音声を検知する音声検知手段と、自装置側/相手装置側のいずれか一方が発した音声を検知すると前記いずれか一方が発した音声から一定時間以上の無音を検知する無音検知手段と、前記無音を検知した無音の所定時間前からの音声の強弱の変化を検知する強弱変化検知手段と、検知した無音の所定時間前からの音声の強弱の変化が疑問文の文末の音声の強弱の変化か否かを判定する疑問文文末判定手段と、を有し、疑問文の文末の音声の強弱の変化であると判定した場合に、前記音声検知手段は、他方の音声を検知し、検知した他方の音声を音声メモとして保存することを特徴とする。
【選択図】図1
Description
本発明は、音声メモ保存機能を有する電話装置に関し、特に質問に対する回答または応答を音声メモとして自動保存する電話装置に関する。
特許文献1には、携帯電話端末が、通話中に「日時情報」(例えば、○○時○○分※○は任意の数字)に係るキーワードを検出すると、当該日時情報のキーワードを発した話者の冒頭から末尾までの音声データをメモ情報として保存する技術が記載されている。
この技術によれば、例えば、通話中に会議の開始時刻に関する会話をすると、その開始時刻のキーワードを含む音声データがメモ情報として自動保存される。
しかしながら、例えば、会議開催場所や会議参加メンバー等、質問に対する回答が複数存在する場合に、予想されるキーワードを事前に全て登録しておかなければならず、大変である。
さらに、例えば会議開催場所が出先での打合せであった場合や会議参加メンバーが他社の社員であった場合等、キーワードを事前に登録しておくことが出来ない場合は、メモ情報を自動保存できない。
本発明は、上記問題に鑑みてなされたものであり、その課題は、メモ情報として残すべきキーワードを事前に登録しなくともメモ情報を自動保存することができる電話装置を提供することにある。
上記課題を解決するために、本発明は、通話録音機能を具備する電話装置において、自装置側または相手装置側が発した音声を検知する音声検知手段と、前記音声検知手段が自装置側または相手装置側のいずれか一方が発した音声を検知すると、前記いずれか一方が発した音声から一定時間以上の無音を検知する無音検知手段と、前記無音を検知した無音の所定時間前からの音声の強弱の変化を検知する強弱変化検知手段と、前記強弱変化検知手段が検知した無音の所定時間前からの音声の強弱の変化が疑問文の文末の音声の強弱の変化か否かを判定する疑問文文末判定手段と、を有し、前記疑問文文末判定手段が、疑問文の文末の音声の強弱の変化であると判定した場合に、前記音声検知手段は、他方の音声を検知し、検知した他方の音声を音声メモとして保存することを特徴とする。
本発明の電話装置によれば、自装置側から発せられた音声の末尾の強弱の変化が疑問文に対応した強弱の変化であった場合、次に相手装置より受信した音声を回答として記憶するので、メモ情報として残すべきキーワードを事前に登録しなくともメモ情報を自動保存することができる。
以下、本発明の一実施形態について、図面を用いながら説明する。
図1は、本発明の電話装置10を含む電話装置システムの全体構成図および電話装置10の機能ブロック図である。
図示するように、電話装置システムは、ネットワーク20に接続される電話装置10と、相手装置30とから構成される。
電話装置10は、ネットワーク20を介して相手装置30に接続し通話を実現する。
また、電話装置10は、自装置側の音声と相手装置側の音声をそれぞれ分けて録音する通話録音機能と、有音を検出してから無音の状態が一定期間(例えば2秒以上)続くまでの区間の音声データ(以下、1センテンスと呼称)を検知する1センテンス検出機能とを有する。
尚、本実施例では、1センテンスを、「有音を検出してから無音の状態が一定期間(例えば2秒以上)続くまでの区間の音声データ」と説明しているが「一方(自装置側の音声と相手装置側の音声のいずれか一方)の有音を検出してから他方の有音を検出するまでの区間の音声データ」を1センテンスとするようにしてもよい。
電話装置10は、自装置側の1センテンスを検出すると、検出した1センテンスが質問に係る音声か否かを判定し、質問に係る音声の場合、さらに相手装置側から発せられる1センテンスを検出すると、自装置側の1センテンスと相手装置側の1センテンスを対応付けて音声メモとして記憶する。
相手装置30は、ネットワーク20に接続し、電話装置10と接続する汎用の電話機である。
次に、音声メモの具体的な記憶方法について電話装置10の機能ブロックを用いて説明する。
図示するように、電話装置10は、通信インタフェース部101、呼制御部102、端末制御部103、マンマシンインタフェース部104、有音検出部105、音声データ記憶部106、音声メモ処理部107、終助詞記憶部108、音声メモ記憶部109、音声再生処理部110から構成される。
通信インタフェース部101は、電話装置10がネットワーク20に接続するための接続コネクタ(例えばRJ−45)等の接続インタフェースである。
呼制御部102は、電話装置10における発信、着信、転送など、電話に係る呼制御全般を処理する。
端末制御部103は、電話装置10の端末に係る制御全般を処理する。また、端末制御部103は、マンマシンインタフェース部104から音声メモの再生を指示する操作情報を渡された場合に、音声再生処理部110へ音声メモの再生処理を指示する。そして、端末制御部103は、音声再生処理部110から音声メモの音声データ(以下、音声メモデータと呼称)を受け取った場合、マンマシンインタフェース部104に中継する。端末制御部103は、終話に係る制御を処理した後に、音声メモ記憶部109に記憶されている回答文が対応付けられていない質問文を破棄する。
マンマシンインタフェース部104は、マイク、スピーカを備えた受話器や、ダイヤルキー等の入出力インタフェースである。マンマシンインタフェース部104は、ユーザが操作した操作情報を端末制御部103へ渡す。マンマシンインタフェース部104は、端末制御部103から音声メモデータを中継されるとスピーカから再生する。
有音検出部105は、呼制御部102を監視し、呼制御部102によって確立した通話音声から有音を検出すると該音声の1センテンスを抽出する。1センテンスを抽出すると、有音検出部105は、前記有音が自装置のマイクから渡された1センテンス(以下、自装置側の1センテンスと呼称)か、または相手装置30から渡された有音(以下、相手装置側の1センテンスと呼称)か判定し、1センテンスの音声データと判定結果を音声データ記憶部106に記憶する。さらに有音検出部105は、音声メモ判定指示を音声メモ処理部107へ渡す。
音声データ記憶部106は、1センテンスの音声データを記憶する記憶部である。音声データ記憶部106は、音声メモ処理部107からの要求に応じて、記憶した1センテンスの音声データと判定結果を音声メモ処理部107へ渡す、または、記憶した1センテンスの音声データと判定結果を削除する。
音声メモ処理部107は、有音検出部105から音声メモ判定指示を指示されると、音声データ記憶部106に記憶した自装置側の1センテンスに、後述する音程変化判定処理または後述する終助詞判定処理を行う。
ここで、音程変化判定処理とは、音声メモ処理部107が、音声データ記憶部106から自装置側の1センテンスの音声データを参照し、自装置側の1センテンスのイントネーション・抑揚が、質問する際のイントネーション・抑揚と同じかの判定を行い、一致する場合に質問時の文書(以下、質問文と呼称)と判定する。具体的には、1センテンスの音声データの末尾の音声の強弱の変化が疑問文に対応した強弱の変化かの判定を行い、末尾の音声の強弱の変化が疑問文に対応した強弱の変化であった場合に質問文と判定する。
また、終助詞判定処理とは、音声メモ処理部107が、終助詞記憶部108を参照し、音声メモ判定指示に対応する1センテンスの文末が、疑問の終助詞(例えば「か」、「の」、「ん」、「のん」、「かいな」)か否かを判定する。具体的に、音声メモ処理部107は、1センテンスの音声データを音声認識して、文字に変換し、変換した文字の文末が終助詞記憶部108に記憶された疑問の終助詞が含まれている場合に質問文と判定する。
尚、本実施例では、「疑問」の終助詞を例に説明しているが、「疑問」以外の終助詞(例えば、「希望」、「強意」)であってもよい。さらに、「疑問」以外の終助詞の場合、当該終助詞を含む1センテンスを音声メモとして保存するようにしてもよい。
尚、本実施例では、終助詞を例に説明しているが、疑問詞(例えば、代名詞の疑問詞「どれ」、「どちら」、「どなた」、「どこ」、「だれ」、「いつ」、「いくつ」:連体詞の疑問詞「どの」、副詞の疑問詞「どう」、「なぜ」等)であってもよい。この場合、音声メモ処理部107は、1センテンスの音声データを音声認識して、文字に変換し、変換した文字の冒頭もしくは文末に疑問詞が含まれている場合に質問文と判定する(疑問の終助詞と疑問詞を総じて「疑問文に存在する品詞」と呼称)。
尚、本実施例では音程変化判定処理および終助詞判定処理において自装置側の1センテンスが「質問文」であるか否か判定し、自装置側の1センテンスが「質問文」である場合に、相手装置側の音声を「回答文」として記憶しているが本願はこれに限定しない。
相手装置側の1センテンスが「質問文」であるか否か判定し、相手装置側の1センテンスが「質問文」である場合に、自装置側の音声を「回答文」として記憶するようにしてもよい。
自装置側の1センテンスが質問文であると判定した場合、音声メモ処理部107は、音声データ記憶部106から自装置側の1センテンスの音声データを抽出し、音声メモ記憶部109に質問文として記憶し、音声データ記憶部106に相手装置側の1センテンスの音声データが記憶されるのを待つ。
そして、音声データ記憶部106に相手装置側の1センテンスの音声データが記憶されると、音声メモ処理部107は、音声データ記憶部106から当該相手装置側の1センテンスの音声データを抽出し、回答文として、前述の質問文と対応付けて音声メモ記憶部109に記憶する(以下、質問文と回答文が対応付けて記憶することを音声メモの記憶と呼称)。
また、音声メモ処理部107は、音声データ記憶部106に相手装置側の1センテンスの音声データが記憶される前に、新たに音声データ記憶部106に自装置側の1センテンスの音声データが記憶されると、音声メモ記憶部109に記憶した質問文を破棄する。
終助詞記憶部108は、質問文か否かを判定するための終助詞を記憶する。
音声メモ記憶部109は、質問文や音声メモを記憶する。
音声再生処理部110は、端末制御部103から音声メモの再生を指示されると、音声メモ記憶部109に記憶された音声メモを取り出し、端末制御部103へ渡す。
図2は、本発明の電話装置10の動作フロー図である。本フローは電話装置10に電源が投入され、通話が可能な状態から開始する。
電話装置10は、自装置と相手装置30との間で通話を開始する(S101)、または、音声メモ再生操作を検知する(S106)、の何れかの状態になるのを待つ。
自装置と相手装置30との間で通話を開始すると(S101でYES)、電話装置10は、自装置側の1センテンスを検出する(S102)、または、自装置と相手装置30とが終話する(S108)、の何れかの状態になるのを待つ。
自装置と相手装置30との通話が終話した場合(S108でYES)、電話装置10は、呼切断処理を実施してステップ101へ戻る。
自装置側の1センテンスを検知した場合(S102でYES)に、電話装置10は、音程変化判定処理を行い、自装置側の1センテンスのイントネーション・抑揚が質問時と同じか否かの判定を行う(S103)。
自装置側の1センテンスのイントネーション・抑揚が質問時と同じと判定した場合(S103でYES)、電話装置10は、検知した自装置側の1センテンスを「質問文」として記憶する(S105)。
一方、自装置側の1センテンスのイントネーション・抑揚が質問時と同じでないと判定した場合(S103でNO)、電話装置10は、終助詞判定処理を行い、自装置側の1センテンスの文末が、疑問の終助詞か否かの判定を行う(S104)。
自装置側の1センテンスの文末が、疑問の終助詞であると判定した場合(S104でYES)、電話装置10は、ステップ105へ移行する。自装置側の1センテンスの文末が、疑問の終助詞でないと判定した場合(S104でNO)、電話装置10は、ステップ102へ戻る。
また、音声メモ再生操作を検知した場合(S106でYES)、電話装置10は、選択された音声メモを「質問文」、「回答文」の順に再生し(S107)、ステップ101へ戻る。
ステップ105において自装置側の1センテンスを「質問文」として記憶すると、電話装置10は、相手装置側の1センテンスを検知する(S109)、または、電話装置10と相手装置30とが終話する(S111)、または、自装置側の有音を新たに検知する(S113)の何れかの状態になるのを待つ。
相手装置側の1センテンスを検出した場合(S109でYES)、電話装置10は、録音した相手装置側の1センテンスを「回答文」として、記憶されている「質問文」に対応付けて記憶(音声メモの記憶)し(S110)、ステップ102に戻る。
また、通話が終了した場合(S111でYES)、電話装置10は、当該通話の呼切断処理を行い、「回答文」と対応づけられていない「質問文」を破棄し(S112)、ステップ101へ戻る。
また、自装置側の1センテンスを新たに検知すると(S113でYES)、電話装置10は、ステップ105において記憶した「質問文」を破棄し(S114)、ステップ103へ移行する。
以上、本発明の一実施形態について説明した。
本発明の一実施形態において、電話装置10は、通話を開始すると有音を監視し、自装置側の有音を検出すると、有音を検出した音声の1センテンスにおいて、当該1センテンスの音声データの末尾の音声の強弱の変化が疑問文に対応した強弱の変化と同じかどうかの判定を行い、同じ場合に、次に相手装置側の1センテンスを検出すると、これを「回答文」として保存する。
これにより、電話装置10は、メモ情報として残すべきキーワードを事前に登録しなくとも、メモ情報を自動保存することができる。
また、本発明の一実施形態において、電話装置10は、通話を開始すると有音を監視し、自装置側の有音を検出すると、有音を検出した1センテンスの音声データの文末に終助詞記憶部108に記憶された疑問の終助詞が含まれている否か判定し、疑問の終助詞が含まれている場合に、次に相手装置側の1センテンスを検出すると、これを「回答文」として保存する。
これにより、電話装置10は、メモ情報として残すべきキーワードを事前に登録しなくともメモ情報を自動保存することができる。
また、本発明の一実施形態において、電話装置10は、相手装置側の音声を「回答文」として記憶する際に、自装置側の音声の「質問文」と対応付けて記憶している。
これにより、電話装置10は、通話中の音声からQ&A形式のメモ情報を自動保存することができる。
尚、本実施例では通話中の電話装置をリアルタイムに処理する内容で説明しているが、本願はこれに限定しない。予め自装置側と相手装置側の音声を分けて録音し、録音した音声から音声メモを抽出するようにしてもよい。
10・・・電話装置
20・・・ネットワーク
30・・・相手装置
101・・・通信インタフェース部
102・・・呼制御部
103・・・端末制御部
104・・・マンマシンインタフェース部
105・・・有音検出部
106・・・音声データ記憶部
107・・・音声メモ処理部
108・・・終助詞記憶部
109・・・音声メモ記憶部
110・・・音声再生処理部
20・・・ネットワーク
30・・・相手装置
101・・・通信インタフェース部
102・・・呼制御部
103・・・端末制御部
104・・・マンマシンインタフェース部
105・・・有音検出部
106・・・音声データ記憶部
107・・・音声メモ処理部
108・・・終助詞記憶部
109・・・音声メモ記憶部
110・・・音声再生処理部
Claims (2)
- 通話録音機能を具備する電話装置において、
自装置側または相手装置側が発した音声を検知する音声検知手段と、
前記音声検知手段が自装置側または相手装置側のいずれか一方が発した音声を検知すると、前記いずれか一方が発した音声から一定時間以上の無音を検知する無音検知手段と、
前記無音を検知した無音の所定時間前からの音声の強弱の変化を検知する強弱変化検知手段と、
前記強弱変化検知手段が検知した無音の所定時間前からの音声の強弱の変化が疑問文の文末の音声の強弱の変化か否かを判定する疑問文文末判定手段と、を有し、
前記疑問文文末判定手段が、疑問文の文末の音声の強弱の変化であると判定した場合に、
前記音声検知手段は、他方の音声を検知し、検知した他方の音声を音声メモとして保存することを特徴とする音声メモ保存機能を有する電話装置。 - 請求項1に記載の電話装置であって、
音声メモとして保存する際、前記一方が発した音声と、前記他方が発した音声とを対応付けて記憶することを特徴とする音声メモ保存機能を有する電話装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015018289A JP2016144024A (ja) | 2015-02-02 | 2015-02-02 | 音声メモ保存機能を有する電話装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015018289A JP2016144024A (ja) | 2015-02-02 | 2015-02-02 | 音声メモ保存機能を有する電話装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016144024A true JP2016144024A (ja) | 2016-08-08 |
Family
ID=56568855
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015018289A Pending JP2016144024A (ja) | 2015-02-02 | 2015-02-02 | 音声メモ保存機能を有する電話装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016144024A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018116512A (ja) * | 2017-01-19 | 2018-07-26 | 株式会社ナカヨ | 重要事項抽出方法 |
-
2015
- 2015-02-02 JP JP2015018289A patent/JP2016144024A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018116512A (ja) * | 2017-01-19 | 2018-07-26 | 株式会社ナカヨ | 重要事項抽出方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8611507B2 (en) | Systems and methods for intelligent call transcription | |
JP6318255B2 (ja) | 通話中のバーチャルアシスタント | |
US11570217B2 (en) | Switch controller for separating multiple portions of call | |
CN1946107B (zh) | 交互式电话训练器和练习器 | |
US20110128953A1 (en) | Method and System of Voice Carry Over for Instant Messaging Relay Services | |
KR20160005075A (ko) | 전화 호출의 수신자가 말하기가 부적당하다고 판단할 때 전화 호출에 응답하는 장치, 및 관련 방법 | |
CN101193378A (zh) | 一种实现无干扰通话的方法及移动终端 | |
US10257350B2 (en) | Playing back portions of a recorded conversation based on keywords | |
JP2007049657A (ja) | 留守番電話装置 | |
GB2578121A (en) | System and method for hands-free advanced control of real-time data stream interactions | |
US20210312143A1 (en) | Real-time call translation system and method | |
US20170310802A1 (en) | Emergency services access device | |
JP2015100054A (ja) | 音声通信システム、音声通信方法及びプログラム | |
JP2016144024A (ja) | 音声メモ保存機能を有する電話装置 | |
JP2007201906A (ja) | 携帯端末装置及び画像表示方法 | |
CN114390144A (zh) | 语音来电智能处理方法、装置和控制系统 | |
JP2007336237A (ja) | コールセンタの通話記録管理システムおよびその方法 | |
EP2536176B1 (en) | Text-to-speech injection apparatus for telecommunication system | |
US10818295B1 (en) | Maintaining network connections | |
EP2693429A1 (en) | System and method for analyzing voice communications | |
US11037567B2 (en) | Transcription of communications | |
JP4232453B2 (ja) | 通話音声のテキスト変換システム | |
US10178227B2 (en) | Personalizing the audio visual experience during telecommunications | |
JP2011147052A (ja) | 通話装置及び通話方法 | |
KR20000018938A (ko) | 휴대용 전화기의 통화 방법 |