JPH0625988B2 - 日本語情報入力方式 - Google Patents

日本語情報入力方式

Info

Publication number
JPH0625988B2
JPH0625988B2 JP58166480A JP16648083A JPH0625988B2 JP H0625988 B2 JPH0625988 B2 JP H0625988B2 JP 58166480 A JP58166480 A JP 58166480A JP 16648083 A JP16648083 A JP 16648083A JP H0625988 B2 JPH0625988 B2 JP H0625988B2
Authority
JP
Japan
Prior art keywords
kana
input
key
different
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58166480A
Other languages
English (en)
Other versions
JPS6059416A (ja
Inventor
恒雄 新田
洋一 竹林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP58166480A priority Critical patent/JPH0625988B2/ja
Publication of JPS6059416A publication Critical patent/JPS6059416A/ja
Publication of JPH0625988B2 publication Critical patent/JPH0625988B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Input From Keyboards Or The Like (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔発明の技術分野〕 日本語は、漢字・ひらがな・かたかな・英数字・記号を
含む数千字の文字を入力する必要があるため、欧米に比
較して一般ホワイトカラーの文書作成能力はかなり劣る
とされている。一方、近年我国においてもかな・漢字自
動変換方式を組み込んだ日本語のワードプロセッサが登
場した。この装置はかなで文章を入力すれば即時に漢字
かな混じり文を得ることができ、その使用法がこれまで
の漢字入力装置に比べ非常に楽であったため広く普及し
始めている。しかし、この入力に使用されるかな鍵盤の
数は欧文タイプのそれと比べてまだ格段に多い。このた
めキー操作に不慣れな一般の人にとって文書作成は未だ
多大の時間を必要とする作業に滞まっている。
オペレータをかな・キーボードの操作から解放する入力
手段としては、最近、手書き文字読み取り装置あるいは
音声認識装置を用いた方式が注目を集めている。両者と
も初期訓練が要らず、楽な姿勢で気軽に利用できる点で
理想的な方式と言える。しかし、こうしたパターン認識
を利用した方式では、認識結果が常に正しいとは限らな
い。このため文字もしくは音声の認識結果としては、複
数の候補を出力し、文節もしくは文単位にかな−漢字変
換を行うことが考えられている。しかし、このように複
数候補を有する文字列の変換結果は当然一意に決定でき
ない場合を生ずる。例えば、「機械と」を入力する意図
でかな文字列「きかいと」を入力した時、認識装置が
「き(が,か)いと」と文字「か」を(が,か)と第2
候補までを出力した場合を考える。この時、かな一漢字
変換の結果は「危害と,気概と,機会と,機械と,奇怪
と」のように「きがい」と「きかい」という異なり語に
対応した単語を検索して表示することになる。従来、こ
のような場合、オペレータは同音異義語の選択時と同様
に順次候補文字を「次候補キー」と「選択キー」を用い
て選択していた。第1図に表示の変化する様子を示し、
以下に選択の仕方の一例を述べる。同図(a)は、最初の
表示“危害と”を表示している。このとき表示は、例え
ば輝度変調により一段明るい輝度で表示され、複数の候
補が存在していることを示している。次にオペレータが
「次候補キー」を押すことにより、表示は同図(b)の
“気概と”に変わる。同様の操作で同図(c)を経て同図
(d)にいたって初めて意図した“機械と”が表示され、
オペレータが「選択キー」を押すことにより、他の候補
文字列は棄てられ「機械と」のみが文書ファイルに登録
されるとともに、同図(e)のようにこのとき表示は通常
の輝度に戻る。
このように、異なり語がある上に同音異義語を伴なう場
合は、選択のための鍵盤操作回数が増えオペレータにと
って大きな負担となることが明らかになった。
〔発明の目的〕
本発明の目的は、上記の事実に鑑み、異なり語がある上
に同音異義語を伴なうような場合においても、オペレー
タがこれを速やかに、かつ楽に選択できる日本語情報入
力方式を与えることにある。
〔発明の概要〕
本発明は、音声パターンや文字パターンとして入力され
た文字列を単語もしくは文節もしくは文単位毎に別種の
文字列に変換し、この変換文字列に同音異義語と異なり
語が混在する場合、異なり語と同音異義語を別個に選択
する手段を与えたことを特徴とする。また、文字列中の
異なり語の有無を表示する手段も併わせて提供するもの
である。
〔発明の実施例〕
以下、図面を参照して本発明の実施例につき説明する。
第2図は、文節単位に発声された音声パターンを認識
し、逐次的に日本語文章の入力を行う装置の構成を示
す。1はマイクロホン、2は1より得られた信号を増幅
する増幅器である。3は文節単位に発話された音声パタ
ーンを認識する認識部、4は認識結果を記憶する音節候
補系列メモリであり、一文節に対応する複数の音節系列
が信頼性の高い順に記憶されている。5はメモリ4のあ
いまい性のある音節系列の夫々に対して処理を行うカナ
漢字変換部、6はカナ漢字変換文字列を収容するページ
バッファ、7はCRT表示部、8は制御部、9はファン
クションキーボード、10は同音語選択キー、11は異なり
語選択キーである。12は文節の区切りを入力するための
文節キーである。
オペレータはマイクロホン1に対し、文章を文節に分割
して発声する。例えば、「私はうみへ行く」という文章
を第2図の実施例装置で入力する場合、「わたしわ」と
まず発声した後文節キー12を打鍵する。マイクロホン1
より入力される文節音声は増幅器2を介して、認識部3
へ送られる。認識3では始端と終端を検出した後、従来
知られている連絡単音節の認識法や音素認識や音節認識
を基本とした認識法により認識することができる。認識
法については本発明の中心部ではないので、これ以上触
れない。音声認識では100%の認識は困難であり、あ
いまい性が含まれることがあるので認識結果として単数
あるいは複数のカナ文字で表わされた文節が、信頼度の
高い順番に音節候補系列メモリー4に収容される。「わ
たしわ」の入力音声に対応する音節候補系列の例を第3
図に示す。
6種類の音節候補系列は、信頼度の高い順に格納されて
いる。一方、文節キー12の打鍵により制御部8はカナ漢
字変換部5を駆動する。音声入力の場合、通常の日本語
ワードプロセッサにおけるカナ鍵盤入力とは異なり、各
文節に対してあいまい性に対処するため複数の音節系列
を対象として、カナ漢字変換が行われる。このとき、文
法に合致しない音節系列や辞書に含まれない語彙のある
音節系列の変換は行わないようにする。すなわち、音声
認識部3で誤認識があっても、言語の有する冗長性を利
用して言語的な検定を行い、日本語として存在可能な文
節だけが漢字カナ混じり文に変換される。
第2図の例では、2種類の音節系列〔わだちわ〕と〔わ
たしわ〕のみがカナ漢字変換が可能でありこの場合音声
〔わ〕に対しては〔わ〕と「は」の表記があることを考
慮して助詞“は”の処理を行い、2種の音節系列「わだ
ちわ」「わたしわ」のみが文法的に適合し、「轍は」
「私は」「渡しは」がかな漢字変換結果として得られ
る。
制御部8は、このように複数の異なる音節系列に対応す
る候補がある場合、第4図(a)のように第1候補の「轍
は」の横に“*”を付けて変換結果を出力するよう表示
部7に指令する。なお、異なり語の存在を示す表示の方
法としては、従来の同音異義語の存在を示す表示と異な
る表示方法であればよい。この例の如く異なり語を
“*”を付して表示する場合、同音異義語については後
述するように下線をつけて表示することが考えられる。
表示の方法としては、この他輝度変調,網かけ,点滅な
どを組み合わせて使用できる。オペレータは「轍は」は
入力しようとする文節ではないので、ファンクションボ
ード9の異なり語キー11を打鍵して訂正を行う。制御部
8は、ページバッファ6の順序を変更し、表示部7のC
RT上での漢字かな混じり文の表示を変え、上記の例で
は、次候補の音節系列の「わたしわ」のかな漢字変換結
果を表示するよう指令する。このとき、同音異義語「私
は」と「渡しは」が存在するので、制御部8は変換結果
に下線を付加し、「私は」と表示し、オペレータに同音
異義語の存在を知らせる。同音異義語の通知方法として
は、異なり語の表示以外の方法ならば、キー入力の日本
語ワードプロセッサで使用されている他の方法は採用し
てもかまわない。オペレータは、CRT7上の「私は」
という下線表示を見て同音異義語の存在を知るが、「私
は」は入力すべき文節なので次の節「うみえ」と発声
し、文節キー12を打鍵し、音声による日本語入力を続け
る。もし先の同音異義語の「私は」ではなく、「渡し
は」という文節を入力したい場合には、オペレータはフ
ァンクションボード9の同音異義語キー10を打鍵するこ
とにより、同音異義語の選択を行う。このとき制御部8
は、ページバッファ6に格納されている「私は」と「渡
しは」の優先順位を変え、表示部7の漢字かな混じり文
を変える。続いて、次の文節を発声することにより同音
異義語の選択が行われる。
以上述べたように、本実施例装置によれば入力された文
節音声に対して複数の認識候補を許容しかな漢字変換を
行うため、音声認識結実にあいまい性や誤認識が存在す
る場合でも、文章入力の際の再発声の回数を低減するこ
とができる。ところがかな漢字変換の結果には、異種の
音節系列である複数個の異なり語と複数個の同音異義語
を含むようになるため、本実施例装置では、異なり語と
同音異義語の存在を区別して表示してオペレータに通知
することができ、さらにファンクションキーボード中に
同音語キーと異なり語キーの両方を備えており、不確実
なかな漢字変換結果の選択修正処理を効率的に行える。
なお、本実施例装置におけるファンクションキーボード
9中における文節キー12、同音語キー10、異なり語キー
はキー操作ではなく音声認識により行うことも可能であ
り、また、文節キーに無音部の長さを検出して文節音声
の始端・終端を決定することにより除去することができ
る。
さらに、上記実施例装置は文節単位の音声入力ではな
く、1音1音区切る単音節入力やあるいは連続してゆっ
くり発声する連続単音節入力、さらには単語単位の入力
や文章入力に対しても適用可能である。音声入力による
あいまい性は〔新美康永著「音声認識」、共立出版昭和
54年〕に記載されているように、意味・プラグマティッ
クなレベルの言語情報を利用しても完全になくすことは
不可能であり、本発明による日本語入力効率の増加は絶
大である。
本発明による他の実施例として、文節単位に発声された
音声を認識し、先に述べた異なり語と同音語の選択修正
処理を複数の文章音声で入力後に一括して行う日本語入
力装置について述べる。
本実施例装置では、その構成は第2図の逐次選択方式の
装置のファンクションキーボード9の部分が異なってお
り、又制御部8による制御法が異なっている。第5図に
本実施例装置におけるファンクションキーボード13、選
択キー14、同音語キー15、異音語キー16、文節キー17を
示す。本実施例装置では、第1の実施例と同様にオペレ
ータは音声を文節単位で発声し、次に文節キー17を打鍵
し、次々と文章を音声で入力して行く。認識結果は、第
1の実施例装置と同様に複数の音節系列を許容し、それ
らは自動的に文節単位でかな漢字変換され、表示部7の
CRT上に漢字かな混じり文が次々と表示される。この
ときページバッファ中の各文節のかな漢字変換結果に、
同音語あるいは異音語が含まれる場合には、第1の実施
例と同様に何らかの方法でその存在を表示してもよい。
文全体あるいは複数の文章を音声入力した後、オペレー
タが選択キー14を打鍵すると、制御部8はページバッフ
ァ6に格納されている同音語あるいは異音語が含まれる
文節のかな漢字変換結果のところにポインタを移動し、
CRT上に、例えば第6図に示したような方法で表示す
る。オペレータは第1の実施例と同様に、同音語キー15
及び異音語キー16を用いて目的とするかな漢字変換結果
を選択する。そして、次に選択キー14を打鍵すると、制
御8はページバッファ6の中に格納されている複数のか
な漢字変換結果の中から適当な文節を選択し、同様の処
理を繰り返す。このようにオペレータは、複数候補のあ
る文節へのポインタの移動をカーソル等を使用せずに、
選択キーを用いて自動的に行い、さらに複数の文節候補
からの選択を同音語キー15と異音語キー16を用いて能率
的に行えるため、音声による文章の入力速度を飛 的に
増大させることができる。また、第1の実施例装置と同
様に本実施例も単語単位、複数の文節単位、文章単位の
発生による文章入力に対しても適用できる。
上記の一括選択の実施例装置の変形として、第7図に示
すようなファンクションキーボード18を用いて、異音語
の選択と同音語の選択とを分離して行うことができる。
19は異音語の選択キー、20は異音語キー、21は同音語選
択キー、22は異音語キー、22は文節キーである。すなわ
ち第7図のファンクションキーボード18の異音語選択キ
ー19と異音語キー20を用いてまず始めに異音語の選択を
行い、次に同音語選択キー21と異音語キー22を用いて同
音語の選択を行うことができる。何れにせよ本発明によ
れば、種々の同音語と異音語の選択法により、能率のよ
い修正が可能となり、音声による総合的な文章の入力速
度が向上する。
また上記各実施例では、音節系列を用いてかな漢字変換
を行ったが、付加脱落のある音素等の記号系列を単語辞
書と照合し、構文・意味的な検定をして、漢字かな混じ
り文を出力しても良い。何れにしても、本発明では同音
語と異音語の選択を効率良く行うところに特徴がある。
第8図は、オンライン文字認識技術を用いてカナ文字系
列を入力したときの、文字認識個有の処理部を示してお
り、第2図の音声入力の場合のマイクロホン1、増幅器
2、音声認識部3と、タブレット24、前処理部25、文字
認識部26を置き換えることにより、本発明を実施するこ
とができる。誤認識の傾向は音声の場合と異なるが、不
確実性が伴なう点では同一であり、複数のカナ文字列を
認識結果として許容することにより、誤まり訂正の回数
を減少させることができ、同音語・異音語を音声入力の
場合と同様に扱うことにより、総合的な文章入力速度を
増加させることができる。また、カナ文字を書く速度は
漢字を書く速度に比べはるかに速く、またカナ文字はカ
テゴリー数が少く認識が容易であるという利点も有して
いる。さらに、本装置はカナ入力による光学的文字読取
装置にも適用できる。
次に、異なり語と同音異義語が存在する際の他の表示・
選択方法を述べる。第9図は文章を文単位に確認・修正
する場合の表示例を示している。この例では、異なり語
を横に並べ同音異義語を縦に並べて表示しているが、表
示の仕方は他の記号を用いたり、他の並べ方をとっても
よく要は異なり語と同音異義語を分離して表示してあれ
ばよい。オペレータは、画面に対して直接指(この場合
タッチパネルが設けられている)もしくはライトペンで
選択を行なう。(図の例では「機械」を選択)もちろん
正しい文字列が最初の位置にあれば、そのまゝ次の文を
入力すればよい。図の例では「正常」については、選択
する必要はなく次の文章を入力した時点で「清浄」は消
える。以上の表示・選択を実施する手段を第10図に示
す。これまでの実施例と比較して異なるのは、第2図の
ファンクション・キー9の替りに表示部7にタッチパネ
ルが取り付けられ、この座標情報が制御部8に入力さ
れ、指示された単語もしくは文節を選択するようになっ
ていることで、他はこれまでの例と同じである。
【図面の簡単な説明】
第1図は従来技術を説明するための図、第2図は本発明
の一実施例を示すブロック図、第3図及び第4図は本発
明の一実施例の動作を説明するための図、第5図乃至第
10図は本発明の他の実施例を説明するための図であ
る。 1…マイクロホン、3…認識部、4…メモリ、5…かな
漢字変換部、6…ページバッファ、7…表示部、9…フ
ァンクションキーボード。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】カナ文字列を音声パターン又は文字パター
    ンとして順次入力するための入力手段と、この入力手段
    より入力されたパターンを認識する認識手段と、この認
    識手段による認識結果のカナ文字列候補に対し文法的に
    適合するカナ文字列候補のみを漢字に変換するカナ漢字
    変換手段と、このカナ漢字変換手段による変換結果を表
    示するための表示手段と、前記変換結果中に異なり語及
    び同音異義語が含まれている場合前記表示手段に対して
    異なり語の存在及び同音異義語の存在を夫々異なる表示
    方法で通知させる制御手段と、前記表示手段により表示
    された変換結果中の異なり語及び同音異義語を夫々別個
    に選択する手段とを備えたことを特徴とする日本語情報
    入力方式。
JP58166480A 1983-09-12 1983-09-12 日本語情報入力方式 Expired - Lifetime JPH0625988B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58166480A JPH0625988B2 (ja) 1983-09-12 1983-09-12 日本語情報入力方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58166480A JPH0625988B2 (ja) 1983-09-12 1983-09-12 日本語情報入力方式

Publications (2)

Publication Number Publication Date
JPS6059416A JPS6059416A (ja) 1985-04-05
JPH0625988B2 true JPH0625988B2 (ja) 1994-04-06

Family

ID=15832177

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58166480A Expired - Lifetime JPH0625988B2 (ja) 1983-09-12 1983-09-12 日本語情報入力方式

Country Status (1)

Country Link
JP (1) JPH0625988B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2723214B2 (ja) * 1985-11-12 1998-03-09 株式会社東芝 音声文書作成装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54136105A (en) * 1978-04-13 1979-10-23 Toshiba Corp Monosyllable identifying display unit
JPS5549772A (en) * 1978-10-02 1980-04-10 Toshiba Corp Homophone display control system in kana-chinese character conversion
JPS5624669A (en) * 1979-08-08 1981-03-09 Fujitsu Ltd System for converting kana (japanese syllabary) letter row into same sound word row
JPS5725074A (en) * 1980-07-21 1982-02-09 Fujitsu Ltd Character recognition post-processing system
JPS57120153A (en) * 1981-01-19 1982-07-27 Nec Corp Input system of japanese language
JPS5936294B2 (ja) * 1982-07-27 1984-09-03 株式会社東芝 同音異義語選択方式

Also Published As

Publication number Publication date
JPS6059416A (ja) 1985-04-05

Similar Documents

Publication Publication Date Title
US6490563B2 (en) Proofreading with text to speech feedback
JP4829901B2 (ja) マニュアルでエントリされた不確定なテキスト入力を音声入力を使用して確定する方法および装置
KR100656736B1 (ko) 표음 입력 모호성 제거 시스템 및 방법
KR100259407B1 (ko) 중국어 텍스트 입력키보드, 중국어 텍스트 처리 컴퓨터 시스템, 중국어 텍스트 입력장치, 음성 중국어의 음절 및 단어 저장방법
EP1096472B1 (en) Audio playback of a multi-source written document
CN102272827B (zh) 利用语音输入解决模糊的手工输入文本输入的方法和装置
WO2001035249A2 (en) Language input architecture for converting one text form to another text form with modeless entry
KR20120006489A (ko) 입력 방법 편집기
JP3476007B2 (ja) 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体
US5995934A (en) Method for recognizing alpha-numeric strings in a Chinese speech recognition system
US20020152075A1 (en) Composite input method
Wells Computer-coded phonetic transcription
WO2005089215B1 (en) Phonetic and stroke input methods of chinese characters and phrases
JPS634206B2 (ja)
JP3762300B2 (ja) テキスト入力処理装置及び方法並びにプログラム
JPH0625988B2 (ja) 日本語情報入力方式
JPS58123129A (ja) 仮名漢字変換装置
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
KR100268297B1 (ko) 중국어 텍스트 처리 컴퓨터 시스템, 형태 처리에 의한 단어 스트링 처리 방법, 중국어 어구 분석 방법
JPH10143503A (ja) 音声ワードプロセッサ
JPS61139828A (ja) 言語入力装置
JPH06208560A (ja) 曖昧漢字変換装置
Hsu et al. Spoken correction for chinese text entry
JPH06259413A (ja) 日本語入力方式
JPS59123926A (ja) 音声入力日本語処理方式