JPH10224520A - マルチメディア公衆電話システム - Google Patents

マルチメディア公衆電話システム

Info

Publication number
JPH10224520A
JPH10224520A JP9026218A JP2621897A JPH10224520A JP H10224520 A JPH10224520 A JP H10224520A JP 9026218 A JP9026218 A JP 9026218A JP 2621897 A JP2621897 A JP 2621897A JP H10224520 A JPH10224520 A JP H10224520A
Authority
JP
Japan
Prior art keywords
voice
character
public telephone
recognition
telephone system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9026218A
Other languages
English (en)
Inventor
Kazuhiko Takahashi
和彦 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Original Assignee
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Corp, Meidensha Electric Manufacturing Co Ltd filed Critical Meidensha Corp
Priority to JP9026218A priority Critical patent/JPH10224520A/ja
Publication of JPH10224520A publication Critical patent/JPH10224520A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Prepayment Telephone Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

(57)【要約】 【課題】 マルチメディア公衆電話システムは、映像も
送受信できるが、難聴者の場合、会話を聞く事ができな
いなど、聴覚障害者にとって利用する範囲が限られてい
る。 【解決手段】 通話者の音声を通信システムを介して音
声信号受信手段11〜14で受信し、音声/文字変換ス
イッチ15で字幕受信を選択したとき、音声認識装置1
6により受信した音声信号を認識し、この認識音声を音
声認識生成装置17で文字データに変換してディスプレ
イ上に字幕で表示する。逆に、通話者が入力した文字列
を文字認識により文体として認識生成し、この文章を音
声合成により音声信号に変換し、通信システムを介して
通話相手に送信する手段も含むことができるようにす
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、公衆電話システム
において、音声の他に映像等を送受信できるようにした
マルチメディア公衆電話システムに関する。
【0002】
【従来の技術】現在のマルチメディア公衆電話システム
は、図12に示すように、CCDカメラ1による映像入
力とスクリーン2による映像出力になる映像入出力装置
により、相手の顔を見ながら同時に会話ができること、
FAX機能を持つこと、設置場所の周辺マップや情報案
内機能を持つこと、メモ欄機能を持つこと等の機能が加
えられ、さらに天気予報が聞けること、各イベントの情
報を取り寄せること等の各種の機能がある。この公衆電
話の操作入力は、プッシュボタン3とポインティングデ
バイス(ペン入力やタッチスクリーン方式)4が利用さ
れる。
【0003】
【発明が解決しようとする課題】従来のマルチメディア
公衆電話システムでは、以下の課題がある。
【0004】(1)通話者の顔を見ることができても、
難聴者の場合、会話を聞く事ができない。
【0005】(2)通話者の音声(会話の内容)を文字
として読み取ることができない。
【0006】(3)言語障害があって会話が難しい難聴
者の場合、メモ機能などで話の内容を伝えるために文字
で書き表した内容を音声で相手に伝える事ができない。
【0007】(4)健常者でも会話中、聞き間違えた
り、聞き取れなかったりすることがあり、話を中断する
事もある。
【0008】以上のように、従来のシステムは種々のマ
ルチメディア機能があっても聴覚障害者にとって利用で
きる範囲が限られている。
【0009】本発明の目的は、聴覚障害者等にも使い勝
手を良くしたマルチメディア公衆電話システムを提供す
ることにある。
【0010】
【課題を解決するための手段】本発明は、上記課題を解
決するため、従来の機能に音声理解システムを追加し、
相手の音声を字幕に変換処理してディスプレイ上に表示
させ、さらに言語系のハンディも緩和させるためにメモ
機能に音声理解機能を追加することでメモに記述した文
字を音声に変換して通話者に伝達できるようにしたもの
で、以下の構成を特徴とする。
【0011】(第1の発明)音声と映像の入出力手段と
通信手段を有して互いに音声及び映像を使った通話を可
能にしたマルチメディア公衆電話システムにおいて、通
話者の音声を通信システムを介して受信する音声信号受
信手段と、前記音声信号をそのまま音声で出力又は字幕
で出力するかを選択する音声/文字変換スイッチと、前
記スイッチが字幕出力を選択したとき、受信した音声信
号を認識する音声認識装置と、前記音声認識装置が認識
した音声を文字データに変換して前記ディスプレイ上に
字幕で表示する音声認識生成装置とを備えたことを特徴
とする。
【0012】(第2の発明)音声と映像の入出力手段と
通信手段を有して互いに音声及び映像を使った通話を可
能にしたマルチメディア公衆電話システムにおいて、通
話者の音声をそのまま通話相手に送信するか又は文字で
送信するかを選択する文字/音声変換スイッチと、前記
スイッチが文字送信を選択したとき、通話者が入力した
文字列を文字認識により文体として認識生成する文章理
解装置と、前記文章理解装置が生成した文章を音声合成
により音声波形に変換する音声合成装置と、前記音声合
成装置が合成した音声波形を音声信号に変換して通信シ
ステムを介して通話相手に送信する音声変換装置とを備
えたことを特徴とする。
【0013】
【発明の実施の形態】図1及び図2は、本発明の実施形
態を示すマルチメディア公衆電話システムのブロック図
であり、図3〜図6に各部の処理過程を同じ符号で対応
付けて示す。以下、各部の構成と処理を詳細に説明す
る。
【0014】(1)相手の音声を字幕表示で受信する場
合(図1)。
【0015】音声入力装置11は、公衆電話に搭載され
る受話器のマイクロフォンから音声を入力するためのも
のであり、通話者が受話器から音声を入力した信号を発
生する。雑音除去フィルタ12は、会話の中に紛れて入
ってくる雑音をノイズフィルタで除去する。
【0016】通信システム13は、例えば、ディジタル
回線で高速かつ広帯域性がある2B+DのB−ISDN
及びネットワークを制御するATM交換システムによっ
て通信制御を行い、音声入力装置11からの音声信号を
音声受信装置14に伝送する。
【0017】音声/文字変換スイッチ15は、受信した
音声(アナログ信号)をそのまま音声として受信する
か、文字(デジタル信号)に変換してディスプレイに表
示させるかを受信者が選択する。
【0018】音声理解装置16は、スイッチ15の選択
操作が文字変換にされた場合に受信音声を認識及び理解
する。この音声理解装置16は、受信した音声を認識及
び理解するため、不特定話者に対応可能な技術として音
声分析とファジイ制御によるあいまいな言語を除去する
特徴抽出後に単語・構文・意味解析による音声認識を行
うシステムに構成され、音声認識処理部161と音声合
成処理部162及び音声パターン辞書163を備える。
【0019】この装置16では、図3及び図4の処理フ
ローで示すように、入力された音声信号をA/D変換処
理した後、音声分析により音声入力信号を周波数スペク
トルによって大まかに分析し、特徴抽出によって音声分
析結果から音声信号の特徴パラメータを時系列に抽出・
変換し、セグメンテーション処理により音声単位へのセ
グメント化を行う。
【0020】特徴抽出には、「えーと」や「あー」、
「うーん」のように、冗長的な単語をファジイ推論によ
り抽出して除去し、人と人が会話をする上で本当に必要
な単語のみを抽出する。さらに、日常的に必要な単語は
前もって登録しておき、後に必要となった単語を学習機
能によってしだいに認識及び追加して行く。
【0021】次いで、音声認識により音声標準パターン
との比較で単語認識を行うことで音素系列を得、単語照
合と単語認識により音素系列について知識ベースに持つ
単語標準パターンとの照合で単語を認識する。この認識
に標準パターンが存在しなければ学習処理(認識・登
録)を行って単語知識を知識ベースに追加する。
【0022】次いで、認識した単語について、構文照合
と構文認識により知識ベースの構文パターンとの照合で
構文的に誤りがあるか否かを解析し、誤りがあれば再検
証することで構文認識を行う。さらに、意味解析と意味
認識により認識された単語構文について意味的に妥当で
あるかを調べ、妥当な結果が得られるまで構文解析処理
と意味解析処理を繰り返す。これら解析には文字に変換
可能か否かも含め、文字変換処理により変換可能である
文字を漢字やカナに変換する。
【0023】図1に戻って、音声認識生成装置17は、
音声理解装置16によって受信音声の内容が認識された
音声データをテキスト形式の文字データに変換する。こ
の文字データは、ディスプレイ表示装置18により公衆
電話のスクリーン2に字幕で画面表示される。
【0024】したがって、図1の構成により、受信した
音声を音声理解装置により音声認識を行い、これを文字
としてスクリーンに表示することにより、難聴者の場合
でも通話者の会話を文字として読み取ることができる。
【0025】また、健常者でも電話でのコミュニケーシ
ョン中、字幕表示により聞き漏らすなどのリスク回避を
可能にする。
【0026】(2)文字入力を相手に音声で送信する場
合(図2)。
【0027】文字/音声変換スイッチ19は、会話の受
信者が、送信者に返答するために、メモ機能で文字で書
き表した内容でコミュニケーションを行うときにその操
作で文字ボタンを選択する。
【0028】文字入力装置20は、スイッチ19の文字
ボタンを押すと、メモ帳(テキスト形式)を画面表示
し、話の内容をポィンティテングデバイス(電子ペン)
で入力可能にする。
【0029】文章理解装置21は、手書き入力した文字
列を解析して文章として認識するもので、文体認識処理
部211と文体形式分析部212と文字パターン認識辞書
213及び文体認識生成部214を備える。
【0030】この文章理解装置21では、図5に処理フ
ローを示すように、手書き文字入力に対して文字認識処
理部211が文字パターンと文体形式から文字の解析を
行い、分析内容と入力内容が違えば訂正として再入力を
受け、手書き文字の入力内容を文章として認識し、文体
認識生成部214により文章として生成する。
【0031】音声合成装置22は、文章理解装置21で
認識生成された文章を音声合成により音声信号に変換す
るもので、音声合成システム部221と音声パターン辞
書222を備える。
【0032】音声合成装置22は、規則合成方式により
音声合成を行い、漢字カナ混じり文に対して日本語辞書
を参照した構文解析、意味解析等により読み・単語・文
節境界等を解析し、この解析結果から音声パターン辞書
を参照して音韻系列のアクセントとイントネーション及
び音韻の継続時間の各パラメータを決定し、これらを音
響管モデルのパラメータとして音声合成を行う。
【0033】音声変換部23は、音声信号波形を音声に
変換する。この変換において、通話者本人が男性の声か
女性の声かをシステム上で選択し送信ボタンを押し、合
成した音声を通信システム24を介して相手に音声で送
信する。相手のマルチメディア公衆電話25では、直接
の音声又は合成した音声を受信する。
【0034】したがって、図2の構成により、スクリー
ンから文字入力することにより、これを文章理解と音声
合成により音声に変換し、これを音声信号として相手側
に送ることにより、言語障害があって会話が難しい難聴
者の場合でもメモ機能などで話の内容を伝えるために文
字で書き表した内容を音声で相手に伝える事ができる。
【0035】図7は、文字/音声変換スイッチの設置例
である。このスイッチは、字幕を表示させるための字幕
ボタンと、文字を入力して音声に変換させるための文字
入力ボタンである。図8は、画面レイアウト例である。
この画面はマルチメディア機能の他、映像部31、音声
を字幕に切り替えた受信内容テキスト画面32、相手に
文字を入力して音声で内容を送信するための送信内容テ
キスト画面33、入力した内容を送信する時、音声を男
性の声が女性の声がを選択する音声モード34の4つか
らなる。
【0036】なお、本発明は、図1の構成又は図2の構
成の両方の装置を搭載するマルチメディア公衆電話シス
テムとする他に、図1又は図2の一方の装置のみを単独
に搭載するマルチメディア公衆電話システムとすること
もできる。
【0037】図9は、相手の音声を字幕表示で受信する
機能と、文字入力を相手に音声で送信する機能の両方を
持つマルチメディア公衆電話システムのインタフェース
構成例を示す。
【0038】同図の音声入力部は、図10に処理手順で
示すように、マイクロフォンから音声を入力し(S
1)、ノイズフィルタで音声に交じっている雑音を除去
し(S2)、音声入力ボードによりクリアな音声をディ
ジタル信号に変換し(S3)、音声入力ドライバの制御
の基にニューッルネットワークによる学習機能を有して
音声認識し(S4)、ファジイ推論部の推論により認識
された音声信号に冗長な信号を除去し(S5)、知識ベ
ースと知識ベースファイルと自動プログラミングエディ
タにより認識された音声信号が知識ベースファイルに無
い場合に学習処理を行い記憶し(S6)、ウィンドウコ
ントロールにより最終的に音声信号処理が完了・認識さ
れた結果をウィンドウのエディタアプリケーション画面
に表示する(S7)。
【0039】図9の文字入力部は、図11に処理手順で
示すように、テキストエディタとペンにより文字入力し
(S11)、入力された文字のパターン処理で認識する
ため、文字パターン認識部と学習部と専用知識ベース及
び汎用知識べースエディタにより、入力した文字のパタ
ーンやデータベース(db)に記憶されていない単語を
学習して記憶し、そして文字のパターンが判別されるこ
とで認識する(S12)。次いで、認識された文字(デ
ィジタル)を音声に変換する(アナログ)ため、音声合
成システムにより男性の声又は女性の声で音声合成し
(S13)、音声合成処理を完了した結果を音声出力部
(マイクロホン)で出力する(S14)。
【0040】
【発明の効果】以上のとおり、本発明によれば、従来の
マルチメディア公衆電話機能に音声理解システムを追加
し、相手の音声を字幕に変換処理してディスプレイ上に
表示させ、さらにメモ機能に音声理解機能を追加するこ
とでメモに記述した文字を音声に変換して通話者に伝達
できるようにしたため、以下の効果がある。
【0041】(1)マルチメディア機能の利用範囲が広
げる事が可能になる。
【0042】(2)会話中、重要と思われる点を字幕で
表示させる事ができるため、聞き違いなどのリスクを回
避する事が可能になる。
【0043】(3)電話などの会話と共に様々な情報範
囲を広げる事が可能になる。
【0044】(4)聴覚障害者が、字幕や音声変換機能
によって電話での会話が可能となる。
【0045】(5)文字を入力して音声に変換して相手
へ送信する時、男性の声か女性の声がを選択する事がで
きる。
【図面の簡単な説明】
【図1】本発明の実施形態を示すマルチメディア公衆電
話システムのブロック構成図(その1)。
【図2】本発明の実施形態を示すマルチメディア公衆電
話システムのブロック構成図(その2)。
【図3】図1における処理フロー(その1)。
【図4】図1における処理フロー(その2)。
【図5】図2における処理フロー(その3)。
【図6】図2における処理フロー(その4)。
【図7】実施形態におけるスイッチ設置例。
【図8】実施形態における画面レイアウト例。
【図9】実施形態におけるインタフェース構成例。
【図10】図9における音声入力部の処理手順。
【図11】図9における文字入力部の処理手順。
【図12】現在のマルチメディア公衆電話の図。
【符号の説明】
11…音声入力装置 12…雑音除去ノイズフィルタ 13、24…通信システム 14…音声受信装置 15…音声/文字変換スイッチ 16…音声認識装置 17…音声認識生成装置 18…ディスプレイ表示装置 19…文字/音声変換スイッチ 20…文字入力装置 21…文章理解装置 22…音声合成装置 23…音声変換装置 25…マルチメディア公衆電話

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 音声と映像の入出力手段と通信手段を有
    して互いに音声及び映像を使った通話を可能にしたマル
    チメディア公衆電話システムにおいて、 通話者の音声を通信システムを介して受信する音声信号
    受信手段と、 前記音声信号をそのまま音声で出力又は字幕で出力する
    かを選択する音声/文字変換スイッチと、 前記スイッチが字幕出力を選択したとき、受信した音声
    信号を認識する音声認識装置と、 前記音声認識装置が認識した音声を文字データに変換し
    て前記ディスプレイ上に字幕で表示する音声認識生成装
    置とを備えたことを特徴とするマルチメディア公衆電話
    システム。
  2. 【請求項2】 音声と映像の入出力手段と通信手段を有
    して互いに音声及び映像を使った通話を可能にしたマル
    チメディア公衆電話システムにおいて、 通話者の音声をそのまま通話相手に送信するか又は文字
    で送信するかを選択する文字/音声変換スイッチと、 前記スイッチが文字送信を選択したとき、通話者が入力
    した文字列を文字認識により文体として認識生成する文
    章理解装置と、 前記文章理解装置が生成した文章を音声合成により音声
    波形に変換する音声合成装置と、 前記音声合成装置が合成した音声波形を音声信号に変換
    して通信システムを介して通話相手に送信する音声変換
    装置とを備えたことを特徴とするマルチメディア公衆電
    話システム。
JP9026218A 1997-02-10 1997-02-10 マルチメディア公衆電話システム Pending JPH10224520A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9026218A JPH10224520A (ja) 1997-02-10 1997-02-10 マルチメディア公衆電話システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9026218A JPH10224520A (ja) 1997-02-10 1997-02-10 マルチメディア公衆電話システム

Publications (1)

Publication Number Publication Date
JPH10224520A true JPH10224520A (ja) 1998-08-21

Family

ID=12187272

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9026218A Pending JPH10224520A (ja) 1997-02-10 1997-02-10 マルチメディア公衆電話システム

Country Status (1)

Country Link
JP (1) JPH10224520A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000176169A (ja) * 1998-12-18 2000-06-27 Konami Co Ltd 伝言ゲーム装置及び伝言送信方法
US6702676B1 (en) 1998-12-18 2004-03-09 Konami Co., Ltd. Message-creating game machine and message-creating method therefor
JP2008066866A (ja) * 2006-09-05 2008-03-21 Nec Commun Syst Ltd 電話システムと通話補助方法とプログラム
US7676372B1 (en) 1999-02-16 2010-03-09 Yugen Kaisha Gm&M Prosthetic hearing device that transforms a detected speech into a speech of a speech form assistive in understanding the semantic meaning in the detected speech
JP2017167384A (ja) * 2016-03-17 2017-09-21 独立行政法人国立高等専門学校機構 音声出力処理装置、音声出力処理プログラムおよび音声出力処理方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000176169A (ja) * 1998-12-18 2000-06-27 Konami Co Ltd 伝言ゲーム装置及び伝言送信方法
US6702676B1 (en) 1998-12-18 2004-03-09 Konami Co., Ltd. Message-creating game machine and message-creating method therefor
US7676372B1 (en) 1999-02-16 2010-03-09 Yugen Kaisha Gm&M Prosthetic hearing device that transforms a detected speech into a speech of a speech form assistive in understanding the semantic meaning in the detected speech
JP2008066866A (ja) * 2006-09-05 2008-03-21 Nec Commun Syst Ltd 電話システムと通話補助方法とプログラム
JP2017167384A (ja) * 2016-03-17 2017-09-21 独立行政法人国立高等専門学校機構 音声出力処理装置、音声出力処理プログラムおよび音声出力処理方法

Similar Documents

Publication Publication Date Title
US9111545B2 (en) Hand-held communication aid for individuals with auditory, speech and visual impairments
US7006604B2 (en) Relay for personal interpreter
US5995590A (en) Method and apparatus for a communication device for use by a hearing impaired/mute or deaf person or in silent environments
US7130801B2 (en) Method for speech interpretation service and speech interpretation server
US6510206B2 (en) Relay for personal interpreter
EP1486949A1 (en) Audio video conversion apparatus and method, and audio video conversion program
JP2003345379A6 (ja) 音声映像変換装置及び方法、音声映像変換プログラム
US20040034522A1 (en) Method and apparatus for seamless transition of voice and/or text into sign language
US5752230A (en) Method and apparatus for identifying names with a speech recognition program
WO2006070373A2 (en) A system and a method for representing unrecognized words in speech to text conversions as syllables
JP3806030B2 (ja) 情報処理装置及び方法
JPH10136327A (ja) ディスクトップ会議システム
US6574598B1 (en) Transmitter and receiver, apparatus and method, all for delivery of information
JP2004015478A (ja) 音声通信端末装置
JPH10224520A (ja) マルチメディア公衆電話システム
JP3260275B2 (ja) 活字入力で通話が可能な通信通話装置
JP2000349865A (ja) 音声通信装置
WO2006001204A1 (ja) 自動翻訳装置及び自動翻訳方法
US20220139417A1 (en) Performing artificial intelligence sign language translation services in a video relay service environment
JP2002027039A (ja) 通信通訳システム
JPH10336354A (ja) マルチメディア公衆電話システム
JPH0863185A (ja) 音声認識装置
KR102496398B1 (ko) 사용자 디바이스에 페어링되어 음성-텍스트를 변환하는 장치 및 그 방법
JPH09116648A (ja) 携帯用通信装置
JP2000184077A (ja) ドアホンシステム