JP2016144024A

JP2016144024A - 音声メモ保存機能を有する電話装置

Info

Publication number: JP2016144024A
Application number: JP2015018289A
Authority: JP
Inventors: 勝彦井川; Katsuhiko Igawa
Original assignee: Nakayo Inc
Current assignee: Nakayo Inc
Priority date: 2015-02-02
Filing date: 2015-02-02
Publication date: 2016-08-08

Abstract

【課題】通話中の音声から自動的に話者の質問に対する回答または応答をメモ情報として記録する事が可能な電話装置を提供することにある。
【解決手段】通話録音機能を具備する電話装置において、自装置側／相手装置側が発した音声を検知する音声検知手段と、自装置側／相手装置側のいずれか一方が発した音声を検知すると前記いずれか一方が発した音声から一定時間以上の無音を検知する無音検知手段と、前記無音を検知した無音の所定時間前からの音声の強弱の変化を検知する強弱変化検知手段と、検知した無音の所定時間前からの音声の強弱の変化が疑問文の文末の音声の強弱の変化か否かを判定する疑問文文末判定手段と、を有し、疑問文の文末の音声の強弱の変化であると判定した場合に、前記音声検知手段は、他方の音声を検知し、検知した他方の音声を音声メモとして保存することを特徴とする。
【選択図】図１

Description

本発明は、音声メモ保存機能を有する電話装置に関し、特に質問に対する回答または応答を音声メモとして自動保存する電話装置に関する。

特許文献１には、携帯電話端末が、通話中に「日時情報」（例えば、○○時○○分※○は任意の数字）に係るキーワードを検出すると、当該日時情報のキーワードを発した話者の冒頭から末尾までの音声データをメモ情報として保存する技術が記載されている。

この技術によれば、例えば、通話中に会議の開始時刻に関する会話をすると、その開始時刻のキーワードを含む音声データがメモ情報として自動保存される。

しかしながら、例えば、会議開催場所や会議参加メンバー等、質問に対する回答が複数存在する場合に、予想されるキーワードを事前に全て登録しておかなければならず、大変である。

さらに、例えば会議開催場所が出先での打合せであった場合や会議参加メンバーが他社の社員であった場合等、キーワードを事前に登録しておくことが出来ない場合は、メモ情報を自動保存できない。

特開２０１４−１３５５４３号公報

本発明は、上記問題に鑑みてなされたものであり、その課題は、メモ情報として残すべきキーワードを事前に登録しなくともメモ情報を自動保存することができる電話装置を提供することにある。

上記課題を解決するために、本発明は、通話録音機能を具備する電話装置において、自装置側または相手装置側が発した音声を検知する音声検知手段と、前記音声検知手段が自装置側または相手装置側のいずれか一方が発した音声を検知すると、前記いずれか一方が発した音声から一定時間以上の無音を検知する無音検知手段と、前記無音を検知した無音の所定時間前からの音声の強弱の変化を検知する強弱変化検知手段と、前記強弱変化検知手段が検知した無音の所定時間前からの音声の強弱の変化が疑問文の文末の音声の強弱の変化か否かを判定する疑問文文末判定手段と、を有し、前記疑問文文末判定手段が、疑問文の文末の音声の強弱の変化であると判定した場合に、前記音声検知手段は、他方の音声を検知し、検知した他方の音声を音声メモとして保存することを特徴とする。

本発明の電話装置によれば、自装置側から発せられた音声の末尾の強弱の変化が疑問文に対応した強弱の変化であった場合、次に相手装置より受信した音声を回答として記憶するので、メモ情報として残すべきキーワードを事前に登録しなくともメモ情報を自動保存することができる。

図１は、本発明の電話装置を含む電話装置システムの全体構成図および電話装置の機能ブロック図である。図２は、本発明の電話装置の動作フロー図である。

以下、本発明の一実施形態について、図面を用いながら説明する。

図１は、本発明の電話装置１０を含む電話装置システムの全体構成図および電話装置１０の機能ブロック図である。

図示するように、電話装置システムは、ネットワーク２０に接続される電話装置１０と、相手装置３０とから構成される。

電話装置１０は、ネットワーク２０を介して相手装置３０に接続し通話を実現する。

また、電話装置１０は、自装置側の音声と相手装置側の音声をそれぞれ分けて録音する通話録音機能と、有音を検出してから無音の状態が一定期間（例えば２秒以上）続くまでの区間の音声データ（以下、１センテンスと呼称）を検知する１センテンス検出機能とを有する。

尚、本実施例では、１センテンスを、「有音を検出してから無音の状態が一定期間（例えば２秒以上）続くまでの区間の音声データ」と説明しているが「一方（自装置側の音声と相手装置側の音声のいずれか一方）の有音を検出してから他方の有音を検出するまでの区間の音声データ」を１センテンスとするようにしてもよい。

電話装置１０は、自装置側の１センテンスを検出すると、検出した１センテンスが質問に係る音声か否かを判定し、質問に係る音声の場合、さらに相手装置側から発せられる１センテンスを検出すると、自装置側の１センテンスと相手装置側の１センテンスを対応付けて音声メモとして記憶する。

相手装置３０は、ネットワーク２０に接続し、電話装置１０と接続する汎用の電話機である。

次に、音声メモの具体的な記憶方法について電話装置１０の機能ブロックを用いて説明する。

図示するように、電話装置１０は、通信インタフェース部１０１、呼制御部１０２、端末制御部１０３、マンマシンインタフェース部１０４、有音検出部１０５、音声データ記憶部１０６、音声メモ処理部１０７、終助詞記憶部１０８、音声メモ記憶部１０９、音声再生処理部１１０から構成される。

通信インタフェース部１０１は、電話装置１０がネットワーク２０に接続するための接続コネクタ（例えばＲＪ−４５）等の接続インタフェースである。

呼制御部１０２は、電話装置１０における発信、着信、転送など、電話に係る呼制御全般を処理する。

端末制御部１０３は、電話装置１０の端末に係る制御全般を処理する。また、端末制御部１０３は、マンマシンインタフェース部１０４から音声メモの再生を指示する操作情報を渡された場合に、音声再生処理部１１０へ音声メモの再生処理を指示する。そして、端末制御部１０３は、音声再生処理部１１０から音声メモの音声データ（以下、音声メモデータと呼称）を受け取った場合、マンマシンインタフェース部１０４に中継する。端末制御部１０３は、終話に係る制御を処理した後に、音声メモ記憶部１０９に記憶されている回答文が対応付けられていない質問文を破棄する。

マンマシンインタフェース部１０４は、マイク、スピーカを備えた受話器や、ダイヤルキー等の入出力インタフェースである。マンマシンインタフェース部１０４は、ユーザが操作した操作情報を端末制御部１０３へ渡す。マンマシンインタフェース部１０４は、端末制御部１０３から音声メモデータを中継されるとスピーカから再生する。

有音検出部１０５は、呼制御部１０２を監視し、呼制御部１０２によって確立した通話音声から有音を検出すると該音声の１センテンスを抽出する。１センテンスを抽出すると、有音検出部１０５は、前記有音が自装置のマイクから渡された１センテンス（以下、自装置側の１センテンスと呼称）か、または相手装置３０から渡された有音（以下、相手装置側の１センテンスと呼称）か判定し、１センテンスの音声データと判定結果を音声データ記憶部１０６に記憶する。さらに有音検出部１０５は、音声メモ判定指示を音声メモ処理部１０７へ渡す。

音声データ記憶部１０６は、１センテンスの音声データを記憶する記憶部である。音声データ記憶部１０６は、音声メモ処理部１０７からの要求に応じて、記憶した１センテンスの音声データと判定結果を音声メモ処理部１０７へ渡す、または、記憶した１センテンスの音声データと判定結果を削除する。

音声メモ処理部１０７は、有音検出部１０５から音声メモ判定指示を指示されると、音声データ記憶部１０６に記憶した自装置側の１センテンスに、後述する音程変化判定処理または後述する終助詞判定処理を行う。

ここで、音程変化判定処理とは、音声メモ処理部１０７が、音声データ記憶部１０６から自装置側の１センテンスの音声データを参照し、自装置側の１センテンスのイントネーション・抑揚が、質問する際のイントネーション・抑揚と同じかの判定を行い、一致する場合に質問時の文書（以下、質問文と呼称）と判定する。具体的には、１センテンスの音声データの末尾の音声の強弱の変化が疑問文に対応した強弱の変化かの判定を行い、末尾の音声の強弱の変化が疑問文に対応した強弱の変化であった場合に質問文と判定する。

また、終助詞判定処理とは、音声メモ処理部１０７が、終助詞記憶部１０８を参照し、音声メモ判定指示に対応する１センテンスの文末が、疑問の終助詞（例えば「か」、「の」、「ん」、「のん」、「かいな」）か否かを判定する。具体的に、音声メモ処理部１０７は、１センテンスの音声データを音声認識して、文字に変換し、変換した文字の文末が終助詞記憶部１０８に記憶された疑問の終助詞が含まれている場合に質問文と判定する。

尚、本実施例では、「疑問」の終助詞を例に説明しているが、「疑問」以外の終助詞（例えば、「希望」、「強意」）であってもよい。さらに、「疑問」以外の終助詞の場合、当該終助詞を含む１センテンスを音声メモとして保存するようにしてもよい。

尚、本実施例では、終助詞を例に説明しているが、疑問詞（例えば、代名詞の疑問詞「どれ」、「どちら」、「どなた」、「どこ」、「だれ」、「いつ」、「いくつ」：連体詞の疑問詞「どの」、副詞の疑問詞「どう」、「なぜ」等）であってもよい。この場合、音声メモ処理部１０７は、１センテンスの音声データを音声認識して、文字に変換し、変換した文字の冒頭もしくは文末に疑問詞が含まれている場合に質問文と判定する（疑問の終助詞と疑問詞を総じて「疑問文に存在する品詞」と呼称）。

尚、本実施例では音程変化判定処理および終助詞判定処理において自装置側の１センテンスが「質問文」であるか否か判定し、自装置側の１センテンスが「質問文」である場合に、相手装置側の音声を「回答文」として記憶しているが本願はこれに限定しない。

相手装置側の１センテンスが「質問文」であるか否か判定し、相手装置側の１センテンスが「質問文」である場合に、自装置側の音声を「回答文」として記憶するようにしてもよい。

自装置側の１センテンスが質問文であると判定した場合、音声メモ処理部１０７は、音声データ記憶部１０６から自装置側の１センテンスの音声データを抽出し、音声メモ記憶部１０９に質問文として記憶し、音声データ記憶部１０６に相手装置側の１センテンスの音声データが記憶されるのを待つ。

そして、音声データ記憶部１０６に相手装置側の１センテンスの音声データが記憶されると、音声メモ処理部１０７は、音声データ記憶部１０６から当該相手装置側の１センテンスの音声データを抽出し、回答文として、前述の質問文と対応付けて音声メモ記憶部１０９に記憶する（以下、質問文と回答文が対応付けて記憶することを音声メモの記憶と呼称）。

また、音声メモ処理部１０７は、音声データ記憶部１０６に相手装置側の１センテンスの音声データが記憶される前に、新たに音声データ記憶部１０６に自装置側の１センテンスの音声データが記憶されると、音声メモ記憶部１０９に記憶した質問文を破棄する。

終助詞記憶部１０８は、質問文か否かを判定するための終助詞を記憶する。

音声メモ記憶部１０９は、質問文や音声メモを記憶する。

音声再生処理部１１０は、端末制御部１０３から音声メモの再生を指示されると、音声メモ記憶部１０９に記憶された音声メモを取り出し、端末制御部１０３へ渡す。

図２は、本発明の電話装置１０の動作フロー図である。本フローは電話装置１０に電源が投入され、通話が可能な状態から開始する。

電話装置１０は、自装置と相手装置３０との間で通話を開始する（Ｓ１０１）、または、音声メモ再生操作を検知する（Ｓ１０６）、の何れかの状態になるのを待つ。

自装置と相手装置３０との間で通話を開始すると（Ｓ１０１でＹＥＳ）、電話装置１０は、自装置側の１センテンスを検出する（Ｓ１０２）、または、自装置と相手装置３０とが終話する（Ｓ１０８）、の何れかの状態になるのを待つ。

自装置と相手装置３０との通話が終話した場合（Ｓ１０８でＹＥＳ）、電話装置１０は、呼切断処理を実施してステップ１０１へ戻る。

自装置側の１センテンスを検知した場合（Ｓ１０２でＹＥＳ）に、電話装置１０は、音程変化判定処理を行い、自装置側の１センテンスのイントネーション・抑揚が質問時と同じか否かの判定を行う（Ｓ１０３）。

自装置側の１センテンスのイントネーション・抑揚が質問時と同じと判定した場合（Ｓ１０３でＹＥＳ）、電話装置１０は、検知した自装置側の１センテンスを「質問文」として記憶する（Ｓ１０５）。

一方、自装置側の１センテンスのイントネーション・抑揚が質問時と同じでないと判定した場合（Ｓ１０３でＮＯ）、電話装置１０は、終助詞判定処理を行い、自装置側の１センテンスの文末が、疑問の終助詞か否かの判定を行う（Ｓ１０４）。

自装置側の１センテンスの文末が、疑問の終助詞であると判定した場合（Ｓ１０４でＹＥＳ）、電話装置１０は、ステップ１０５へ移行する。自装置側の１センテンスの文末が、疑問の終助詞でないと判定した場合（Ｓ１０４でＮＯ）、電話装置１０は、ステップ１０２へ戻る。

また、音声メモ再生操作を検知した場合（Ｓ１０６でＹＥＳ）、電話装置１０は、選択された音声メモを「質問文」、「回答文」の順に再生し（Ｓ１０７）、ステップ１０１へ戻る。

ステップ１０５において自装置側の１センテンスを「質問文」として記憶すると、電話装置１０は、相手装置側の１センテンスを検知する（Ｓ１０９）、または、電話装置１０と相手装置３０とが終話する（Ｓ１１１）、または、自装置側の有音を新たに検知する（Ｓ１１３）の何れかの状態になるのを待つ。

相手装置側の１センテンスを検出した場合（Ｓ１０９でＹＥＳ）、電話装置１０は、録音した相手装置側の１センテンスを「回答文」として、記憶されている「質問文」に対応付けて記憶（音声メモの記憶）し（Ｓ１１０）、ステップ１０２に戻る。

また、通話が終了した場合（Ｓ１１１でＹＥＳ）、電話装置１０は、当該通話の呼切断処理を行い、「回答文」と対応づけられていない「質問文」を破棄し（Ｓ１１２）、ステップ１０１へ戻る。

また、自装置側の１センテンスを新たに検知すると（Ｓ１１３でＹＥＳ）、電話装置１０は、ステップ１０５において記憶した「質問文」を破棄し（Ｓ１１４）、ステップ１０３へ移行する。

以上、本発明の一実施形態について説明した。

本発明の一実施形態において、電話装置１０は、通話を開始すると有音を監視し、自装置側の有音を検出すると、有音を検出した音声の１センテンスにおいて、当該１センテンスの音声データの末尾の音声の強弱の変化が疑問文に対応した強弱の変化と同じかどうかの判定を行い、同じ場合に、次に相手装置側の１センテンスを検出すると、これを「回答文」として保存する。

これにより、電話装置１０は、メモ情報として残すべきキーワードを事前に登録しなくとも、メモ情報を自動保存することができる。

また、本発明の一実施形態において、電話装置１０は、通話を開始すると有音を監視し、自装置側の有音を検出すると、有音を検出した１センテンスの音声データの文末に終助詞記憶部１０８に記憶された疑問の終助詞が含まれている否か判定し、疑問の終助詞が含まれている場合に、次に相手装置側の１センテンスを検出すると、これを「回答文」として保存する。

これにより、電話装置１０は、メモ情報として残すべきキーワードを事前に登録しなくともメモ情報を自動保存することができる。

また、本発明の一実施形態において、電話装置１０は、相手装置側の音声を「回答文」として記憶する際に、自装置側の音声の「質問文」と対応付けて記憶している。

これにより、電話装置１０は、通話中の音声からＱ＆Ａ形式のメモ情報を自動保存することができる。

尚、本実施例では通話中の電話装置をリアルタイムに処理する内容で説明しているが、本願はこれに限定しない。予め自装置側と相手装置側の音声を分けて録音し、録音した音声から音声メモを抽出するようにしてもよい。

１０・・・電話装置
２０・・・ネットワーク
３０・・・相手装置
１０１・・・通信インタフェース部
１０２・・・呼制御部
１０３・・・端末制御部
１０４・・・マンマシンインタフェース部
１０５・・・有音検出部
１０６・・・音声データ記憶部
１０７・・・音声メモ処理部
１０８・・・終助詞記憶部
１０９・・・音声メモ記憶部
１１０・・・音声再生処理部

Claims

通話録音機能を具備する電話装置において、
自装置側または相手装置側が発した音声を検知する音声検知手段と、
前記音声検知手段が自装置側または相手装置側のいずれか一方が発した音声を検知すると、前記いずれか一方が発した音声から一定時間以上の無音を検知する無音検知手段と、
前記無音を検知した無音の所定時間前からの音声の強弱の変化を検知する強弱変化検知手段と、
前記強弱変化検知手段が検知した無音の所定時間前からの音声の強弱の変化が疑問文の文末の音声の強弱の変化か否かを判定する疑問文文末判定手段と、を有し、
前記疑問文文末判定手段が、疑問文の文末の音声の強弱の変化であると判定した場合に、
前記音声検知手段は、他方の音声を検知し、検知した他方の音声を音声メモとして保存することを特徴とする音声メモ保存機能を有する電話装置。
請求項１に記載の電話装置であって、
音声メモとして保存する際、前記一方が発した音声と、前記他方が発した音声とを対応付けて記憶することを特徴とする音声メモ保存機能を有する電話装置。