JPH1188507A - ページャ用音声認識装置 - Google Patents

ページャ用音声認識装置

Info

Publication number
JPH1188507A
JPH1188507A JP9242769A JP24276997A JPH1188507A JP H1188507 A JPH1188507 A JP H1188507A JP 9242769 A JP9242769 A JP 9242769A JP 24276997 A JP24276997 A JP 24276997A JP H1188507 A JPH1188507 A JP H1188507A
Authority
JP
Japan
Prior art keywords
input
voice
pager
user
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9242769A
Other languages
English (en)
Inventor
Toshiyuki Matsuda
俊幸 松田
Hitoshi Sato
均 佐藤
Ryujiro Muramatsu
隆二郎 村松
Takuro Nakayama
卓郎 中山
Masahiro Kosaka
昌宏 小坂
Toshiaki Suzuki
利明 鈴木
Toshihiro Kujirai
俊宏 鯨井
Nobuo Hataoka
信夫 畑岡
Satoshi Matsuhashi
聡 松橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP9242769A priority Critical patent/JPH1188507A/ja
Publication of JPH1188507A publication Critical patent/JPH1188507A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

(57)【要約】 【課題】 ページャに対するメッセージを、簡便な音声
入力により迅速かつ容易に行い得るページャ用音声認識
装置を提供すること。 【解決手段】 仮名文字認識部51、定型文章認識部5
2、制御用語認識部53を有する音声認識部50を備え
た音声対話処理部40により、仮名文字、定型文章、又
はそれらの混在した音声入力により、ページャ端末に対
するメッセージを認識、作成できるようにしたページャ
用音声認識装置。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ページャシステム
に利用される音声認識装置に関するものである。
【0002】
【従来の技術】従来のページャシステムでは、利用者が
相手のページャの番号に電話をかけ、送信内容をプッシ
ュボタン(PB)で入力している。送信内容は、文字ま
たは定型文書を送信できる。しかし、この送信にあたっ
て、文字または定型文書とPBの操作組み合わせとの対
応が必要となり、利用者は、この対応を覚えておくか、
対応表を参照しながら入力する必要があり、入力操作が
極めて煩雑であり、利用者層や利用者数が限られ、普及
が阻害されている。
【0003】そこで、電話機を通して、音声によって、
メッセージを入力することが考えられ、いくつかの装置
が知られている。このような電話回線用の音声入力装置
の従来例は、単語音声を認識するタイプ、文字単位の音
声入力を行うタイプに大別できる。
【0004】前者の単語音声を認識するタイプの装置
は、予め用意された単語を認識対象として、PB入力の
代わりに音声入力を行うものであり、ページャシステム
用では、30ないし60の定型文章が用意されている。
しかし、発信者の名前やニックネーム等はなく、汎用的
な共通の定型文章だけでは、コミュニケーションの内容
や質に限度がある。
【0005】この制約を解決するために、従来のページ
ャで、任意の仮名・英字・数字・記号等の文字を用いて
作った自作の伝言文を設定しておくことができ、自作伝
言文番号に合わせて表示できるようにしたものがある。
しかし、この種の装置においては、個人用の定型文章
は、利用者のページャ本体に登録するため、ページャの
所有者しかメッセージが判らないと言う問題があった。
【0006】一方、前記後者の文字単位の音声入力を行
うタイプの装置は、例えば、仮名文字「あ」を入力する
ときは、「朝日のあ」と言うように、各仮名文字毎に予
め用意されている単語音声を発生するものである。これ
は、仮名文字などのように発生時間が短い音声を認識に
おいては、音声認識対象が、電話周波数帯域(0.3な
いし3.4kHz)であるため周波数の高域情報が欠落
し、子音の認識が極めて困難である上に、仮名文字音声
は情報時間が単語音声に比べて1/3以下と少ないため
に認識の性能を維持することが困難となるので、上記の
ように各仮名文字毎に予め用意されている単語音声を発
生して入力するようにしたものである。しかし、この仮
名文字単位の音声入力、認識装置でも、結果的にやはり
仮名文字と登録単語の対応表が必要となり、入力の煩雑
さはさして改善されない欠点があった。
【0007】また、従来の音声によるページャメッセー
ジ入力においては、どこまで入力したのか確認できない
欠点があった。特に、電話機を用いて音声で文字単位の
入力を行う場合、文字毎に区切って音声で入力する上
に、入力した内容の表示機能がないので、長文のメッセ
ージを入力する場合や、誤認識があった場合にどこまで
入力したかの確認は必須であるが、従来は、その確認の
ための手段がなかった。
【0008】また、音声によるページャメッセージ入力
においては、直前に入力したメッセージの内容を訂正、
変更した後、次の入力を行うために、入力の訂正変更機
能も必要であるが、従来の音声認識装置には、この機能
が備えられていなかった。
【0009】さらに、従来の音声認識装置は、誤認識が
発生することを前提としてシステムを構築しており、1
単語を発声し認識する毎に、認識結果が正しいか否かの
確認を対話形式で行う仕組みになっている。このため、
利用者とシステムの接続時間が長くなるとともに、利用
者にとって入力操作が煩わしいと言う問題があった。
【0010】以上、いずれにしても従来の音声認識装置
は、利用者の入力操作が煩雑であり、長時間を要し、ま
た、個々の利用者にとって、きめ細かなサービスを提供
できるものではなかった。
【0011】
【発明が解決しようとする課題】したがって、本発明の
一つの目的は、ページャシステムに用いられる音声認識
装置であって、利用者の入力操作が簡便で、短時間で可
能であり、また、個々の利用者にとって、きめ細かなサ
ービスを提供できるページャ用音声認識装置を提供する
ことである。
【0012】本発明の他の目的は、登録単語と入力音声
との複雑な対応が不要で、また、利用者がが登録単語を
知らなくても、簡単なルールを覚えておくだけで、文字
単位の入力を可能とするページャ用音声認識装置を提供
することである。
【0013】本発明のさらに他の目的は、個々の利用者
(発信者)が、頻繁に使用する個別の単語を定型文章と
して登録することを可能とするページャ用音声認識装置
を提供することである。
【0014】本発明のさらに他の目的は、音声入力、識
別の正誤の確認及び訂正等の対話制御を簡略化し、音声
入力操作の簡便化と接続時間の短縮化を図ることであ
る。
【0015】本発明のさらに他の目的は、発信者側でフ
リーワードによる自作の伝言文を音声認識させて作成
し、一度登録すると、以降、その伝言文そのものを発声
するだけで、音声入力できるようにすることである。す
なわち、比較的頻繁に送りたいようなメッセージや自分
の名前等の場合、毎回一字一句、仮名認識させるという
効率の悪さを解消することである。
【0016】
【課題を解決するための手段】上記目的を達成するため
の本発明による基本的な特徴によれば、音声認識が正し
く行われることを前提とし、認識ミスが発生したときの
み、利用者からの訂正要求を受け入力の訂正を行う音声
認識装置が提供される。より具体的には、本発明による
音声識別装置は、適時訂正機能及び次候補出力機能を備
え、認識結果が正しくないときに訂正要求を受け入れて
次候補出力するが、認識結果が正しい場合には、続けて
音声入力を行うことにより、スムーズな入力が可能とな
る。これによって、認識結果の確認を簡便にして入力操
作が煩雑になるのを防止するとともに入力時間を短縮す
ることができる。
【0017】本発明の他の特徴によれば、予め定められ
た認識対象単語だけでなく、仮名文字、アルファベット
文字、数字等の文字を認識が容易で簡単なルールにより
入力可能とするフリーワード入力機能を有する音声認識
装置を提供することである。上記した、文字を認識する
ための容易かつ簡単なルールとしては、入力すべき仮名
文字の信号時間軸を延ばすことができ、各文字に固有な
ものではない文字の集合又は単語を用いればよく、例示
的に述べると、複数の文字について共通のルールで作成
できる文字の集合、あるいは、複数の文字について同じ
情報量増加語を用いるのが好ましい。また、このフリー
ワード入力機能に、上記した適時訂正機能を併用するこ
とが望ましい。
【0018】本発明のさらに他の特徴によれば、利用者
毎に作成した固有の単語又はメッセージを、個々のペー
ジャではなくて、システム側に登録する音声認識装置が
提供される。
【0019】本発明のさらに他の特徴によれば、発信者
側で自作伝言文を登録する手段として、ページャ所有者
に対してシステム側にDBを設けてそのDBに登録す
る。そこでユーザ自身の自作伝言文としてシステム側に
一度登録することで、以後同じメッセージを送信する場
合、定型文と同様にして認識できるようにする。
【0020】さらに、本発明の他の特徴によれば、仮名
文字、英数文字等の文字情報を入力している最中に、既
入力内容の確認音声コマンド(例えば、「読み上げ」)
を発声すると、入力された文字情報を、初めから順番に
読み上げる手段と、既入力の文字情報を消去する手段と
を備えた音声認識装置が提供される。
【0021】以下、本発明を、実施の形態についてさら
に詳細に説明する。
【0022】
【発明の実施の形態】図1は、本発明によるページャ用
音声認識装置を含むネットワークの構成を示す。図1に
おいて、10はページャ端末、11は電話線で公衆通信
網20に接続されている電話機11、12は携帯電話
機、13はPHS電話機である。30は本発明による、
ページャ用音声認識装置で、ページャシステム装置1と
協同して、各種電話機からの音声入力メッセージを認識
して、ページャ端末10に、可視又は可聴の適切な形態
のメッセージとして送信する。
【0023】図1の動作を、電話機11から発信され、
認識装置30に着信する場合について説明する。電話機
11の利用者は、送信相手のページャ端末10のページ
ャ番号をPBで入力した後、送信内容を音声で認識装置
30へ入力する。このとき、音声認識装置に接続後、送
信相手のページャ番号は、音声で入力することもでき
る。利用者がいくつかの送信メッセージを入力し、通話
を終了した後、認識装置30はページャシステム装置1
へ発信相手と送信内容を送信する。ページャシステム装
置1では、この情報に基づき、利用者が指定したページ
ャ端末10へメッセージを送信する。
【0024】図1の例では、認識装置30はページャシ
ステム装置1と独立して位置しているが、ページャシス
テム装置1内に組み込むことも可能である。図2は、認
識装置30が、ページャシステム装置1に組み込まれた
場合を示す。
【0025】図3は、ページャ用音声認識装置30のブ
ロック図である。ページャ用音声認識装置30は、回線
インタフェース31と、音声対話処理部40と、これら
2つを制御し、また上位の制御部であるページャシステ
ムと通信を行う認識制御部32とから構成されている。
【0026】図3の動作を、公衆網20から直接接続す
る場合について説明する。この一例として一般家庭に入
る2線アナログ回線での接続を説明する。公衆網20か
らの着信があると、回線インタフェース31から認識制
御部32へ着信通知が送られる。認識制御部32では、
この通知を受信した後、音声対話処理部40への起動と
回線インタフェース31への接続とを指示する。公衆網
20と接続され音声対話処理部40は、利用者との対話
により、メッセージ送信先のページャ番号とメッセージ
内容を認識処理部32内に記録する。利用者との対話が
終了した後、音声対話処理部40は、認識制御部32
へ、ページャ番号とメッセージとを渡す。認識制御部3
2は利用者と音声対話処理部32との対話が終了した
後、音声対話処理部40へ停止命令をを発し、回線イン
タフェース31へ回線切断を指示する。認識制御部32
は、受け取った情報に基づき、該当するページャ端末1
0にメッセージを送信する。また、認識制御部32は、
回線インタフェース31と音声対話処理部40の動作状
態を常時監視する。
【0027】ここで、回線インタフェース31はISD
Nの接続でも良く、また、図2で説明したように音声認
識装置30がページャシステム装置1内に組み込まれた
場合は、専用のインタフェースでも構わない。
【0028】次に、音声対話処理部40及びその動作に
ついて説明する。図4は音声対話処理部40の機能ブロ
ック図を示す。音声対話処理部40は、音声認識部5
0、PBレシーバ41、音声出力部42、音声データ蓄
積部43、メッセージ蓄積部44及びこれら各ブロック
を制御する個別制御部45から構成される。
【0029】音声認識部50は、図3の回線インタフェ
ース31から回線INに送られてくる音声を認識する。
PBレシーバ41は、回線インタフェース31から回線
INに送られてくるPB信号を受信する。音声出力部4
2は、個別制御部45の指示で指定された音声データを
音声データ蓄積部43から選択して、回線OUTへ出力
する。
【0030】メッセージ蓄積部44は、音声認識部50
で得られた結果を蓄積する。この蓄積の仕方をより具体
的に説明すると、音声認識部50で得られた結果から個
別制御部45内の認識結果IDとPB対応テーブルから
PBコードに変換し、PBコードでメッセージを蓄積す
る。
【0031】図3の認識制御部32から起動指示が出る
と、個別制御部45内にある対話処理データに基づき利
用者と対話を行う形でページャへ送るメッセージを蓄積
する。対話終了後、認識制御部32へ通知する。また、
個別制御部45は、音声認識部50、PBレシーバ4
1、音声出力部42、音声データ蓄積部43及びメッセ
ージ蓄積部44の各ブロックの動作状態を常時監視し
て、認識制御部32からの各状態の問い合わせに対して
対応できるようになっている。
【0032】なお、上記において、音声データ蓄積部4
3とメッセージ蓄積部44は、音声対話処理部40内に
設ける必要はなく、個別制御部45に通信機能を設けて
外部に置くことも可能である。
【0033】個別制御部45は、対話手順データを持
ち、その手順に従い音声出力部42に指示を出し、認識
装置?から利用者へ発声を促したり、音声認識部50へ
利用者の音声を取り込み認識処理を指示したりする。
【0034】音声データ蓄積部43は、認識装置から利
用者へのガイダンス音声を出力するための音声データを
蓄積している。データの種類は、音声出力部42の音声
出力方式で決まる。例えば、ADPCM(Adapti
ve Differential Pulse Cod
e Modulation)方式を用いた音声出力方式
であれば、蓄積データは、ADPCMで符号化されたデ
ータが蓄積される。音声符号化方式を用いれば、データ
蓄積容量を少なくすることができる。電話交換機で使用
される音声符号化方式を用いれば、μ・law方式で6
4kbit/sのデータ量になる。また、ADPCM方
式を使用する場合には、32kbit/sになり、蓄積
量は、1/2となる。音声出力の方式は、このほかの音
声符号化方式であってもよい。また、規則合成を用いた
方式でも構わない。この場合、音声データ蓄積は、符号
化された音声ではなく、テキスト情報が蓄積される。
【0035】図5は、音声認識部50のブロック構成を
示す。音声認識部50は、仮名文字認識部51と、定型
文章認識部52と、制御用語認識部53とから構成され
る。仮名文字認識部51は、仮名文字の音声を認識す
る。定型文章認識部52は、定型文章の音声を認識す
る。制御用語認識部53は、「訂正」、「完了」等のメ
ッセージ入力の制御を行う音声を認識する。認識方式制
御部54は、上位の個別制御部45からの指示により、
仮名文字認識部51、定型文章認識部52及び制御用語
認識部53の3つの認識部うち、どの認識部を動作させ
るかを決定する。動作させる認識部は、どれか一つであ
っても、複数であってもよい。
【0036】ここで使用される音声認識方式はいくつか
あるが、一つの例として、HMM(Hidden Ma
rkov Model)を用いた音声認識が挙げられ
る。上記3つの認識部は、予め決められた単語又は仮名
文字を認識する。予め決められた単語は、上位の制御部
から送り込まれる。対象になる単語又は仮名文字はテキ
スト情報で送り込まれる。
【0037】次に、以上説明した、音声認識装置と利用
者との対話動作例を説明する。
【0038】まず、図6により、定型文章の入力動作に
ついて説明する。上述したように、音声入力ページャサ
ービスを希望した利用者が発呼し(S611)、公衆網
20を介してページャシステム用音声認識装置30に接
続されると、音声認識装置30では、音声入力を促すガ
イダンス音声S621を出力する(S631)。
【0039】いま、利用者が定型文章でメッセージを音
声入力するものとすると、利用者はその旨を音声S61
2(「定型文書」)で、認識装置30に伝える.認識装
置30では、その音声入力S612(「定型文書」)の
認識、応答処理を行い。定型文章入力モードを設定する
(S632)。文章入力モードの設定が完了すると、定
型文章の入力を促すガイダンス音声S622「定型文章
入力開始」を利用者に送信する。
【0040】利用者が、「大至急 会社に 電話してく
ださい」と言う内容のメッセージを伝えるものとし、メ
ッセージを構成する「大至急」、「会社に」及び「電話
してください」が、全て定型文章語として登録されてい
るものとする。
【0041】まず、利用者が、「大至急」と音声で(又
は「大至急」に対応したPB信号で)入力すると(S6
13)、音声認識装置30では、その認識、応答処理を
行い(S633)、結果内容「大至急」を復唱的に利用
者に聞かせる(S623)。
【0042】利用者は、それを聞いて、「大至急」が正
しく認識されたことが判明するので、次の定型文章語で
ある、「会社に」を音声入力する(S614)。この認
識処理も正しく行われ(S634)、「会社に」が音声
認識装置30から帰ってくると(S624)、利用者
は、次の定型文章語「電話してください」を音声入力す
る(S615)。
【0043】この認識、処理も正しく行われ(S63
5)、「電話してください」が音声認識装置30から帰
ってくると(S625)、利用者は、メッセージが終了
したことを示す定型文章語「終わり」を音声入力する
(S616)。音声認識装置30は、その認識、応答処
理を行うとともに終了処理を行う(S636)。終了処
理では、それまでに、認識処理された定型文章語からな
るメッセージ全文「大至急、会社に、電話してくださ
い」を送出する(S626)。その後、音声認識装置3
0は、回線接続を切断するとともに、ページャシステム
装置1へ発信番号とメッセージを出力する(S63
7)。利用者電話機は、回線切断により待ち受け状態に
復旧する(S617)。
【0044】次に、他の音声入力動作例として、図7に
より、文字単位による非定型文章の入力動作について説
明する。図7の実施例における文字単位の音声入力方法
は、利用者(発信者)は、例えば、「し」(S712)
のように、入力したい文字を発声して、音声認識装置
で、それを認識するのを基本とする最も簡潔な方法を示
すものである。実際の入力方法は、各文字の認識率を高
めるために後述する、図9ないし図14に示される方法
のいずれかを用いるのが好ましい。次に、図7の動作を
さらに詳細に説明する。
【0045】音声入力ページャサービスを希望した利用
者が発呼し(S711)、公衆網20を介してページャ
システム用音声認識装置30に接続されると、音声認識
装置30では、音声入力を促すガイダンス音声S621
を出力する(S731)。
【0046】いま、利用者が非定型文文章メッセージを
仮名文字単位で音声入力するものとすると、利用者はそ
の旨を音声S712(「仮名入力」)で、認識装置30
に伝える.認識装置30では、その音声入力S712
(「仮名入力」)の認識、応答処理を行い。仮名入力モ
ードを設定する(S732)。仮名入力モードの設定が
完了すると、仮名入力を促すガイダンス音声S722
「仮名入力開始」を利用者に送信する。
【0047】利用者が、「しぶや、6じ」と言う内容の
メッセージを伝えるものとする。まず、利用者が、
「し」と音声で入力すると(S713)、音声認識装置
30では、その認識、応答処理を行い(S733)、認
識の結果「し」を利用者に聞かせる(S723)。
【0048】利用者は、それを聞いて、第1字目の
「し」が正しく認識されたことが判明するので、次の仮
名文字である濁音「ぶ」を入力するために、まず清音
「ふ」を音声入力する(S714)。この認識処理が正
しく行われ(S734)、第2字目の「ぶ」の清音
「ふ」が音声認識装置30から帰ってくると(S72
4)、利用者は、この清音「ふ」を、濁音「ぶ」にする
ための音声コマンド「濁点」を音声入力する(S71
5)。音声応答装置で、この認識、処理が行われると、
濁音「ぶ」が利用者に通知される(S735)。
【0049】メッセージの残りの部分「や」、「6」、
「じ」についても、図15に示すように、上記と同様に
入力及び識別が行われる。ここで、 前述したように、
「し」、「ぶ」、「や」、「じ」等の仮名文字の認識率
を高くするために、各入力にあたっては、図9ないし図
14に示すような方法をとるのがよいが、数字文字
「6」については仮名文字ではなく、かつ、2音節なの
で普通に「6」の音声入力で識別できる。また、PB信
号によってもよい。
【0050】以上のようにして、メッセージの最後の文
字である「じ」の入力、認識までが終わると、利用者
は、メッセージが終了したことを示す定型文章語「終わ
り」を音声入力する(S716)。音声認識装置30
は、その認識、応答処理を行うとともに終了処理を行う
(S736)。終了処理では、それまでに、認識処理さ
れた定型文章語からなるメッセージ全文「しぶや、6
じ」を送出する(S725)。その後、音声認識装置3
0は、回線接続を切断するとともに、ページャシステム
装置1へ発信番号とメッセージを出力する(S73
7)。利用者電話機は、回線切断により待ち受け状態に
復旧する(S717)。
【0051】図6及び図7の例は、入力音声の識別が全
て正しく行われた場合を示したが、次に、利用者の音声
入力内容と音声認識の結果とに違いがあった場合の動作
について、図8により説明する。
【0052】図8は、図6及び図7に比べて簡略化した
記述になっており、音声入力、音声認識の部分だけとな
っている。利用者は、「とうきょう」、「ちば」、「さ
いたま」と入力したいものとする。第1語目の音声入力
S811「とうきょう」が、音声認識装置30で、第1
候補として、「きょうと」と誤認識された場合(S82
1)、利用者は、「ていせい」と音声入力して、訂正を
要求する(S812)。音声認識装置30は、第2候補
として認識していた「とうきょう」を出力する(S82
2)。次の音声入力S813「ちば」は、音声認識装置
30で正しく認識されたとすると(S823)、利用者
は、直ちにさらに次の「さいたま」を音声入力する(S
814)。
【0053】以降、上記と同様に、正しく認識されたと
きは、改めて確認の動作は行わず、誤認識があったとき
だけ利用者から訂正要求を出す。
【0054】以上、本発明を基本的な実施の形態及びそ
の動作について説明したが、以下、いくつかの他の実施
の形態を説明する。
【0055】まず、仮名の入力方法の実施の形態につき
説明する。前述したように、仮名の音声入力方法は、利
用者にとっての制約が少なく、音声認識装置での認識率
の高める必要がある。このためには、入力用に多数の単
語を記憶したり検索表を必要とすることなく、また、各
仮名文字毎に装置での認識対象時間を長くすることによ
り認識率を向上する必要がある。この条件を満たすのに
好適な仮名の音声入力方法の実施の形態につき、図9な
いし図14により説明する。
【0056】まず、図9の実施例では、「ししし」(S
913)、「ふふふ」(S914)のように、同じ仮名
を複数回発声し、それを認識する。
【0057】次に、図10の実施例は、「さしすせその
し」(S1013)、「はひふへほのふ」(S101
4)のように、入力したい仮名の属する50音の行を読
み上げてから、入力する仮名を発声し、音声認識装置で
は、それを認識する。
【0058】図11の実施例は、「しぶやのし」(S1
113)、「ふあんのふ」(S1114)のように、入
力したい仮名文字で始まる言葉を認識対象とする。
【0059】図12の実施例は、「し」を入力する場合
は「さし」という発声(S1213)、「ふ」を入力す
る場合は「はひふ」という発声(S1214)のよう
に、入力したい文字が属する50音の行の先頭から入力
したい文字までを対応づけて発声を行うことで、入力す
るものである。
【0060】図13の実施例は、「えすあい」(S13
13)、「えふゆー」(S1314)のように、入力し
たい仮名文字「し」、「ふ」のローマ字つづり「S
I」、「FU」のアルファベットを読み上げることで、
仮名を入力する方法を示したものである。
【0061】図14の実施例は、「えすあいのし」(S
1413)、「えふゆーのふ」(S1414)のよう
に、入力したい仮名文字「し」、「ふ」のローマ字つづ
り「SI」、「FU」のアルファベットを読み上げ、さ
らに入力したい仮名文字「し」、「ふ」の発声を付加す
ることで、仮名を入力する方法を示したものである。
【0062】次に、フリーワード認識からのユーザ用自
作伝言文の登録について、図16により説明する。
【0063】図16は、そのフローを示す。仮名入力を
音声で逐次行い(「た」(S1611)、「ろ」(S1
612)、「う」(S1613))、目的とした文章
「たろう」を作成終了後、着信側の契約者のデータベー
スDBに定型文章として登録する(S1614)(S16
35)(S1615)(S1636)。
【0064】これにより、次回以降、同じ内容のメッセ
ージ「たろう」を送信したい場合には、音声で文章「た
ろう」を発声するだけで、予めシステムに設定してある
定型文章と同じように扱うことができる。登録できる条
件としては、むやみに登録されないため、(S161
5)のように、パスワードを知っている人だけに限定す
ることが望ましい。パスワードは、PB入力による数字
等で入力できるようにする。
【0065】次に、誤認識時に適正な訂正を行い、認識
率の向上を図る実施の形態を、図17ないし図19によ
り説明する。
【0066】図17の実施例は、図7に示す入力方法に
対する誤認識時の訂正方法に関するものである。本実施
例は、「し」の入力(S1711)に対して、第1候補
「ち」、第2候補「ひ」、第3候補「ふ」のように、第
3候補まで認識を行い、訂正が必要なときは、順次出力
することにより、認識率を向上させる例を示す。
【0067】認識結果として、第1候補「ち」が自動的
に出力されるが(S1722)、利用者が入力を希望す
る仮名文字ではないので、訂正を指示するコマンドとし
て、音声入力「訂正」又は*ボタンの押下を行う(S1
712)。このコマンドを受けて音声応答装置は、第2
候補「ひ」を出力するが(S1723)、やはり、利用
者が入力を希望する仮名文字ではないので、音声入力
「訂正」又は*ボタンの押下を行う(S1713)。
【0068】このコマンドを受けて音声応答装置は、第
3候補「ふ」を出力するが(S1724)、なお、利用
者が入力を希望する仮名文字ではないので、音声入力
「訂正」又は「*」ボタンの押下を行う(S171
4)。このコマンドを受けた音声応答装置は、「もう一
度、いって下さい」を出力する(S1725)。これを
聞いて利用者は、再び、「し」を発声する。
【0069】図18の実施例は、入力したい仮名文字
「し」の単字入力(S1811)を、「ち」と誤認識し
たときに(S1822)、図9で説明した、認識率の高
い、「ししし」の、三重仮名文字入力(S1812)に
切り替える例を示すものである。
【0070】同様に、図19の実施例は、入力したい仮
名文字「し」の単字入力(S1911)を、「ち」と誤
認識したときに(S1922)、図10で説明した、認
識率の高い、「さしすせそのし」の50音の行に入力文
字を付加する入力方法(S1912)に切り替える例を
示すものである。
【0071】次に、音声入力による既入力状況の確認と
既入力の全消去機能についての実施例を、図20により
説明する。
【0072】図20において、「ひ」(S2011)、
「た」(S2012)、「ち」(S2013)の入力を
行った時点で、それまでの入力状況を確認したいときに
は、利用者は、音声指示入力「読み上げ」を発声する
(S2014)。音声認識装置は、それまでの入力メッ
セージ「ひたち」を出力する(S2025)。また、既
入力メッセージを全て消去するときには、利用者が、音
声指示入力「すべて取消」を発声すると(S201
7)、音声認識装置はそれを受けて、処理を行い、「全
て取り消しました」を出力する(S2027)。
【0073】以上本発明による文字単位音声入力の実施
に形態を、仮名入力を中心に説明したが、次に、アルフ
ァベット入力の実施例について、図21により説明す
る。
【0074】アルファベット(a、b,c,
d,.....)の各文字入力に関しても、基本的に
は、前述した、本発明による仮名文字入力方法と同様の
手法を適用することにより、認識率を上げることができ
る。図21は、そのいくつかの例を示すものである。
【0075】図21の(a)欄は、「a,a,a」と言
うように、同じアルファベットを3回発声すると、当該
アルファベット「a」を入力する例を示す。同じく
(b)欄は、アルファベット「a」を入力するとき「ア
メリカのa」、アルファベット「i」を入力するときは
「イタリアのi」等と先頭に入力したいアルファベット
の付く単語と一緒に発声することで入力を行う例を示
す。さらに、(c)欄は、アルファベット「a」を入力
するとき、「abcのa」、「abcのb」、「def
のf」等のように入力する。すなわち、アルファベット
の並び順を、ある間隔(例えば3文字毎に)で区切り、グ
ループ化して置き、そのグループの中のアルファベット
を入力したいときは、そのグループとアルファベットを
一緒に発声すると入力ができるようにした例である。
【0076】
【発明の効果】以上述べたように、本発明のページャ用
音声認識装置によれば、仮名文字、定型文章又はそれら
の混在した音声入力により、ページャ端末に対するメッ
セージを、簡便、迅速に、入力、認識、作成できる効果
がある。
【図面の簡単な説明】
【図1】本発明によるページャ用音声認識装置の位置づ
けの一例を示すネットワーク構成図。
【図2】本発明によるページャ用音声認識装置の位置づ
けの他の例を示すネットワーク構成図。
【図3】本発明によるページャ用音声認識装置のブロッ
ク構成図。
【図4】本発明によるページャ用音声認識装置内の音声
対話処理部のブロック構成図。
【図5】本発明によるページャ用音声認識装置内の音声
認識部のブロック構成図。
【図6】本発明によるページャ用音声認識装置と利用者
間の定型文章入力対話動作を示すフローチャート。
【図7】本発明によるページャ用音声認識装置と利用者
間の仮名文字入力対話動作の実施例を示すフローチャー
ト。
【図8】本発明によるページャ用音声認識装置と利用者
間の、訂正ステップのある入力対話動作を示すフローチ
ャート。
【図9】本発明によるページャ用音声認識装置と利用者
間の仮名文字入力対話動作の他の実施例を示すフローチ
ャート。
【図10】本発明によるページャ用音声認識装置と利用
者間の仮名文字入力対話動作のさらに他の実施例を示す
フローチャート。
【図11】本発明によるページャ用音声認識装置と利用
者間の仮名文字入力対話動作のさらに他の実施例を示す
フローチャート。
【図12】本発明によるページャ用音声認識装置と利用
者間の仮名文字入力対話動作のさらに他の実施例を示す
フローチャート。
【図13】本発明によるページャ用音声認識装置と利用
者間の仮名文字入力対話動作のさらの他の実施例を示す
フローチャート。
【図14】本発明によるページャ用音声認識装置と利用
者間の仮名文字入力対話動作のさらに他の実施例を示す
フローチャート。
【図15】図7のページャ用音声認識装置と利用者間の
仮名文字入力対話動作を全入力文字について示したフロ
ーチャート。
【図16】本発明によるページャ用音声認識装置と利用
者間の自作伝言分登録の入力対話動作を示すフローチャ
ート。
【図17】本発明によるページャ用音声認識装置と利用
者間の、訂正ステップのある仮名文字入力対話動作の実
施例を示すフローチャート。
【図18】本発明によるページャ用音声認識装置と利用
者間の、訂正ステップのある仮名文字入力対話動作の他
の実施例を示すフローチャート。
【図19】本発明によるページャ用音声認識装置と利用
者間の、訂正ステップのある仮名文字入力対話動作のさ
らに他の実施例を示すフローチャート。
【図20】本発明によるページャ用音声認識装置と利用
者間の既入力の状況確認及び消去の対話動作を示すフロ
ーチャート。
【図21】本発明によるページャ用音声認識装置と利用
者間のアルファベット文字入力対話動作を示すフローチ
ャート。
【符号の説明】
1…ページャシステム装置、10…ページャ端末、11
…電話機、12…携帯電話、13…PHS、20…公衆
網、30…ページャ用音声認識装置、31…回線インタ
フェース、32…認識制御部、40…音声対話処理部、
41…PBレシーバ、42…音声出力部、43…音声デ
ータ蓄積部、44…メッセージ蓄積部、45…個別制御
部、50…音声認識部、51…仮名文字認識部、52…
定型文章認識部、53…制御用語認識部、54…認識方
式制御部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 中山 卓郎 神奈川県横浜市戸塚区戸塚町216番地 株 式会社日立製作所情報通信事業部内 (72)発明者 小坂 昌宏 神奈川県横浜市戸塚区戸塚町216番地 株 式会社日立製作所情報通信事業部内 (72)発明者 鈴木 利明 神奈川県横浜市戸塚区戸塚町216番地 株 式会社日立製作所情報通信事業部内 (72)発明者 鯨井 俊宏 東京都国分寺市東恋ヶ窪一丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 畑岡 信夫 東京都国分寺市東恋ヶ窪一丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 松橋 聡 神奈川県横浜市戸塚区戸塚町216番地 株 式会社日立製作所情報通信事業部内

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】音声認識が正しく行われることを前提と
    し、認識ミスが発生したときのみ、利用者からの訂正要
    求を受け入力の訂正を行うことを特徴とするページャ用
    音声認識装置。
  2. 【請求項2】適時訂正機能を備え、認識結果が正しくな
    いときに訂正要求を受け入れるが、認識結果が正しい場
    合には、続けて音声入力を行うことを特徴とするページ
    ャ用音声認識装置。
  3. 【請求項3】予め定められた認識対象単語だけでなく、
    文字を文字単位で音声入力可能なフリーワード音声入力
    機能を有することを特徴とするページャ用音声認識装
    置。
  4. 【請求項4】複数の文字について、共通のルールで作成
    できる文字の集合、あるいは、複数の文字について同じ
    情報量増加語を用いて、文字を文字単位で入力可能なフ
    リーワード入力機能を備えたことを特徴とするページャ
    用音声認識装置。
  5. 【請求項5】文字を文字単位で音声入力可能なフリーワ
    ード音声入力機能と、適時訂正機能とを備えたことを特
    徴とするページャ用音声認識装置。
  6. 【請求項6】利用者毎に作成した固有の単語又はメッセ
    ージを、個々のページャではなくて、システム側に登録
    することを特徴とするページャ用音声認識装置。
  7. 【請求項7】利用者側で自作伝言文を登録する手段とし
    て、ページャ所有者に対してシステム側にDBを設けて
    そのDBに登録し、利用者の自作伝言文としてシステム
    側に一度登録したメッセージを送信する場合、定型文と
    同様にして認識できるようにしたことを特徴とするペー
    ジャ用音声認識装置。
  8. 【請求項8】文字情報を入力している最中に、既入力内
    容の確認音声コマンドを発声すると、入力された文字情
    報を、初めから順番に読み上げる手段を備えたことを特
    徴とするページャ用音声認識装置。
  9. 【請求項9】文字情報を入力している最中に、既入力内
    容の確認音声コマンドを発声すると、入力された文字情
    報を、初めから順番に読み上げる手段と、既入力の文字
    情報を消去する手段とを備えたことを特徴とする音声認
    識装置。
JP9242769A 1997-09-08 1997-09-08 ページャ用音声認識装置 Pending JPH1188507A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9242769A JPH1188507A (ja) 1997-09-08 1997-09-08 ページャ用音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9242769A JPH1188507A (ja) 1997-09-08 1997-09-08 ページャ用音声認識装置

Publications (1)

Publication Number Publication Date
JPH1188507A true JPH1188507A (ja) 1999-03-30

Family

ID=17094013

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9242769A Pending JPH1188507A (ja) 1997-09-08 1997-09-08 ページャ用音声認識装置

Country Status (1)

Country Link
JP (1) JPH1188507A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100307320B1 (ko) * 1999-10-15 2001-11-02 이계철 다단계 음성인식 전화정보 서비스 방법
KR100307322B1 (ko) * 1999-09-09 2001-11-07 이계철 전화정보 서비스시 기 입력 정보의 입력정보 선택 변경 방법
JP2007535692A (ja) * 2004-03-09 2007-12-06 ラオ、アシュウィン 任意に話されたキャラクタのコンピュータによる認識及び解釈のためのシステム及び方法
WO2013035293A1 (ja) * 2011-09-09 2013-03-14 旭化成株式会社 音声認識装置
JP2013521735A (ja) * 2010-03-09 2013-06-10 アルカテル−ルーセント ディジットのボイス通信

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100307322B1 (ko) * 1999-09-09 2001-11-07 이계철 전화정보 서비스시 기 입력 정보의 입력정보 선택 변경 방법
KR100307320B1 (ko) * 1999-10-15 2001-11-02 이계철 다단계 음성인식 전화정보 서비스 방법
JP2007535692A (ja) * 2004-03-09 2007-12-06 ラオ、アシュウィン 任意に話されたキャラクタのコンピュータによる認識及び解釈のためのシステム及び方法
JP2013521735A (ja) * 2010-03-09 2013-06-10 アルカテル−ルーセント ディジットのボイス通信
WO2013035293A1 (ja) * 2011-09-09 2013-03-14 旭化成株式会社 音声認識装置
CN103827962A (zh) * 2011-09-09 2014-05-28 旭化成株式会社 声音识别装置
US9437190B2 (en) 2011-09-09 2016-09-06 Asahi Kasei Kabushiki Kaisha Speech recognition apparatus for recognizing user's utterance

Similar Documents

Publication Publication Date Title
US5995590A (en) Method and apparatus for a communication device for use by a hearing impaired/mute or deaf person or in silent environments
US6490343B2 (en) System and method of non-spoken telephone communication
JP3758685B2 (ja) 電話帳内の所望の記録を検索する方法および装置
US8229091B2 (en) Interactive voice response to short message service text messenger
US6687673B2 (en) Speech recognition system
EP1113416B1 (en) User interface for text to speech conversion
US6393304B1 (en) Method for supporting numeric voice dialing
EP1540924B1 (en) Processing of telephone numbers in audio streams
US20040196964A1 (en) Apparatus, system and method for providing silently selectable audible communication
WO2015083741A1 (ja) 中継装置、表示装置および通信システム
US6223161B1 (en) Method for setting terminal specific parameters of a communication terminal
JPH1188507A (ja) ページャ用音声認識装置
US20040015353A1 (en) Voice recognition key input wireless terminal, method, and computer readable recording medium therefor
KR100367481B1 (ko) 발신번호를 이용한 음성인식/합성 전화기 및 그 방법
JP3797497B2 (ja) ページャへのメッセージ作成方式
JP2815971B2 (ja) 音声認識データ蓄積システム
JP2005283797A (ja) 音声認識装置および音声認識方法
JP3278595B2 (ja) 携帯電話
JPS63142950A (ja) 音声ダイヤル電話方式
GB2307822A (en) Text communication systems
KR20000018938A (ko) 휴대용 전화기의 통화 방법
JPS61157053A (ja) 電話装置
KR100228204B1 (ko) 자동음성 안내장치
JPH10164230A (ja) 言語障害サポート通信システム
JP2000010587A (ja) 仮名入力電話音声認識装置