JPS6355085B2

JPS6355085B2 -

Info

Publication number: JPS6355085B2
Application number: JP15529885A
Authority: JP
Inventors: Jooji Kooru Aran; Harorudo Riikaato Robaato
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1984-10-30
Filing date: 1985-07-16
Publication date: 1988-11-01
Also published as: CA1222321A; DE3585384D1; EP0180047B1; US4914704A; EP0180047A2; JPS61107430A; EP0180047A3

Description

【発明の詳細な説明】

以下の順でこの発明を説明する。産業上の利用分野開示の概要従来の技術発明が解決しようとする問題点問題点を解決するための手段実施例システムの原理と構成要素（第１図〜第６図）情報の記憶（第７図）編集システムの動作（第８図および第９図）スピーチ編集装置の付加的な特徴発明の効果〔産業上の利用分野〕本発明は総じて言えば文章の認識に係り、より
特定して言えば音声情報の認識に関する。本発明
の良好な実施例は音声情報編集システム、即ちス
ピーチ編集システムに向けられており、その編集
システムでは、発声言語、即ち音声ワードは、認
識された後に表示され、且つ音声入力又はユーザ
が制御しうる手操作入力装置を使つて編集するこ
とが出来る。〔開示の概要〕文章編集装置は表示装置のスクリーンを使つて
音声で入力した文章を良好に編集するため、スピ
ーチ認識装置へ接続される。認識出来、且つ辞書
に記憶されている文章ワード（数字を含んで）及
び区切り符号（punctuation mark）のために、
トークン（token）が記憶される。トークンは文
字カウントの情報、大文字化（capitalization）
するための情報、関連する項目の左側連結（left
concatenation）及び右側連結に関する情報、及
び文章の前後関係の状態を表示する領域を与える
ための情報を保持する。音声言語による文章を認
識するセグメント、又はエンテイテイ（entity）
のために、関連した文字ストリング及び関連した
トークンが編集装置中のストレージへ転送され、
必要ならスペースを入れること及び大文字にする
ことを含んで、文章を自動的に様式化し且つ正し
く表示させ、又は印字させる。例えば、文章の始
めにおける修正や連結（concatenation）の際の
修正を反映するため、トークンは編集動作中に更
新される。ワードを認識することが出来ない場合
か、又は綴り、即ちスペル（spell）することが
必要な場合には、単一の綴り文章を入力するため
に、スペルモードへの切り換えが行われる。〔従来の技術〕コンピユータで制御された編集システムは公知
である。それ等のシステムは、入力手段として通
常キーボードを有し、そして、編集されるべき情
報又は文章は順次の打鍵操作により入力される。
然し乍ら、タツチ・スクリーン、ジヨイステイツ
ク、所謂、マウス、グラフイツク・タブレツトな
どを含んで、制御情報を入力する他の装置もま
た、知られている。いつたん、情報が記憶されると、情報は表示す
ることが出来、そして付加的な文字を挿入するこ
とにより、又は文字を置き換えることにより、又
は文字を削除することによつて編集することが出
来る。適当に同定することが出来れば、文章の一
部分全体を除去、即ち削除することも出来る。デイスプレー上の特定の文字を強調する、即ち
ハイライトするためのカーソルは多くの編集装置
では標準仕様である。カーソルは、挿入、置換又
は削除が行われる位置をマークする。或る部分全
体を削除する場合を除いて、編集は文字単位で行
われるため、カーソルはまた、通常、１個の文字
位置に対して有効であり、そしてその基本的な動
きは右方向又は左方向の１文字分の移動である。ワード毎に誤つた綴り、即ちスペルをチエツク
することが出来、次に、間違い又は不明であると
されたワードの全体をハイライトする、或る種の
ワードプロセツシング・システムが知られてい
る。然し乍ら、そのような移動及びハイライトの
制御は、オペレータの打鍵により入力されねばな
らないワードの間に、境界標識（スペースなど
の）を必要とする。ワード全体に対する基本的な
編集操作（例えば削除のような）は、或る種のワ
ードプロセツシング・システムで僅かばかり与え
られているが、殆どの編集操作（例えば入力や挿
入など）は文字毎に行われている。処理システム中へ文章を入力するため文字キー
を打鍵すること、そしてその文章を編集するため
文字キーを打鍵すること以外のテクニツクが要求
されている。換言すれば、すべての人がキーボー
ドの操作に堪能ではなく、そして多くの人達はキ
ーボードの操作を好まない。更にまた、キーボー
ド操作は時間を浪費する。文通を行う通常の方法
では、１人が手紙又は報告書を口述し、他の人、
即ち秘書が録音されたスピーチを聴き、そしてタ
イプライタのキーボードを使つてそれを転記す
る。従つて、スピーチ、即ち音声言語で制御され
た文章（text）入力及び編集を導入することが望
まれる。例えば下記の文献又は米国特許により幾つかの
スピーチ認識システムが知られている。それら
は、バール（L.Bahl）等の文献、「5000語の語彙
の事務通信からの孤立ワードの文章の認識」
（Recognition of Isolated−Word Sentences
fron ａ 5000−Word Vocabulary Office
Correspondence Task）と題する音響、スピー
チ及び信号処理に関する1983年の国際会議（1983
年４月ボストンに於いて）の会報1065乃至1067
頁、ジエリネク（F.Jelinek）等の文献、「連続し
たスピーチを認識するための語学的統計デコーダ
の設計」（Design of ａ Linguistic Statistical
Decorder for the Recognition of Continuous
Speech）と題する、1975年５月の情報理論会報
（Transactious on Information Theory）
Vol.21、No.３の250〜256頁、そして米国特許第
4181821号及び同第4277644号である。既知のシステムの殆どは区切つて発音するワー
ドのみを認識するものであるけれども、幾つかの
システムは連続したスピーチの入力を判別し、且
つ同定するよう設計されている。スピーチ認識シ
ステムは、例えば音声による命令語の限られたセ
ツトにより機械を直接に制御すること、計算機シ
ステム中に数値を入力すること、供給センターか
ら商品を受注すること、人名簿を検索すること、
発声者が同一人物であるか否かを同定することの
ような或る種の適用業務に対して使用され又は提
案されて来た。然し乍ら、それ等は直ちに表示す
ることと、編集することとを含んでいない。更にまた、従来のスピーチ認識システムは音声
入力により、或る通常のキーボード入力のような
手操作入力により開始されうる編集を行なつては
いなかつた。〔発明が解決しようとする問題点〕本発明は、情報が音声の形で良好に入力するこ
との出来る編集装置を提供することを目的とす
る。本発明の他の目的は、ワードとワードの間に自
動的にスペースを入れ、且つ文の始めの大文字化
を正しく行う、スピーチ入力編集システムであつ
て、入力された文章を、標準的な様式で直ちに表
示することの出来るスピーチ入力編集システムを
提供することにある。本発明の他の目的は、音声で認識された文中の
ワードに対して、音声による区切り（spoken
punctuation）符号が正しく連結され、又はスペ
ースを開けられるような態様で、音声により入力
した文章を編集する方法を提供することにある。本発明の更に他の目的は、通常はワードを基本
として動作するけれども、必要に応じて、単一の
文字をスペルするモードへ容易に切り換えること
の出来るスピーチ入力編集システムを提供するこ
とにある。〔問題点を解決するための手段〕本発明はワードや区切り符号のような認識され
る音声エンテイテイに関連するトークンを具えた
スピーチ認識及びスピーチ入力編集システムによ
つて上記の目的を達成する。音声による入力を表
示又はプリントするために、上記のトークンは音
声による文章の入力を正しい文書様式にするのに
必要な情報を含んでいる。これ等のトークンは記
憶されており、そして例えば、２個のワードが併
合される時とか、文の最初のワードが削除される
時とかのように、編集動作の間で文章が変更され
る時、これ等のトークンは更新することが出来
る。トーンに与えられている連結に関する情報は、
ワード及び区切り符号を明瞭に発音するだけで他
の別の制御情報を入力することなく、ワードとワ
ードの間にスペースを自動的に挿入し、又は正し
い通常の様式で区切り符号をワードに連結する。本発明に従つた編集システムは、口述録音通信
（dictating correspondence）の代表的な形式で
スピーチ入力を受け取ることが出来、且つ口述者
又は他のユーザにより見ることが出来る（又はス
ピーチ合成器を使えば聞くことが出来る）最終的
に様式化されたフオームの文章を与えることが出
来る。このシステムはまた、明確に認識されなか
つたワード、又は意図されなかつた文章出力のワ
ードの修正を迅速に且つ容易に行う。本発明はスピーチ入力以外の装置を持つ文章認
識システムへも適用されうることは注意されるべ
きである。例えば、本発明の教示は、相次いで並
んでいるワードの間のスペースを打鍵することな
く文章を入力しうるキーボード入力システムにも
適用することが出来る。本発明はスピーチ入力と
共に、トークンの形で連結情報を与える。つま
り、スピーチなしで連続的にタイプされたワード
は、認識装置で認識され、そして連結標識を含む
トークンを割り当てる検索メモリへ、コード同定
標識として差し向けられる。若し必要なら、スピ
ーチ入力と共に、大文字化の情報、文字カウン
ト、その他の情報をトークン中に含ませうる。ス
ピーチ入力を具えた本発明の場合、音声命令ワー
ド及び区切り符号入力の具備を必要とすることは
言うまでもない。〔実施例〕 (A) システムの原理と構成要素 (1) システムの全体像以上の項で説明するシステムは音声で入力
する文章（text）及び音声による命令を認識
し、そしてシステムのルール及び与えられた
命令に従つて、入力文章をスクリーン上に表
示する。キーボード及び他の手操作装置によ
る命令の入力も与えられる。スクリーン（又
はバツフアストレージ）にある文章は付加的
な命令により、或は、付加的な音声ワード又
は音声文字により編集することが出来る。第１図は本発明が使われている、スピーチ
入力及び編集システム１０のブロツク図であ
る。スピーチ認識装置１１はその入力点にお
いて、スピーチを表わす信号を受取る。その
スピーチを表わす信号は、区切つて発音され
たワードでもよいし、音声命令でもよいし、
個々の文字（綴り読みの場合）でもよく、ま
た連続したスピーチであつてもよい。与えら
れた語彙中の各ワード、個々の文字又は符号
（文字、数字、区切り符号など−以下文字と
いう）及び与えられた命令リスト中の各命令
ワードはコード同定標識の与えられたセツト
の中のコード同定標識によつて表示される。
文章中の用語、即ち文章ワード、区切りワー
ド（punctuation word）、命令ワードは以
下、「エンテイテイ」（entity）と称する。コ
ード同定標識はｎビツト、例えば16ビツトで
構成されてよく、従つて2ⁿ、例えば64000個
以上の異なつたエンテイテイを同定する。音声入力がワードとして認識された時、ス
ピーチ認識装置１１はその出力線１３上に認
識したコード同定標識を供給する。スピーチ
認識装置１１の他の出力線１５において、状
態信号が同時に発生され、認識が成効であつ
た（明確に認識した）か、又は認識に疑問が
あつた（認識が多分誤りらしかつたので、最
も可能性が高い出力を選んだ）か、又は全く
認識することが出来なかつたかを表示する。
最後の場合には、夫々の「空白」コードワー
ド（アスタリスク）が出力線１３に発生され
る。３つのありうる状態が出力線１５上にビ
ツト対により表示されうる。特定のこれ等３
つの場合の個々の信号の代りに、他の信号、
例えば、認識の正確性を表わす確率の値を与
えることも出来る。音声入力のために、使用可能な命令のリス
トは第１表に示されており、起りうる区切り
符号及びそれ等の区切り機能のリストが第２
表に与えられている。既に述べたように、スピーチ認識装置１１
は本発明の編集装置１２の一部分ではない。
然し乍ら、それは、第１図の他のブロツク及
び相互接続により示されている全スクリーン
編集装置１２のための良好な入力装置であ
る。装置１１としても使いうる単一ワードの
スピーチ認識装置が上述のバール等の文献、
及び上述の米国特許に記載されている。通常、そのような認識装置は完成したワー
ド即ち、語彙中のワード又は命令の認識を行
い、そしてワードに対応する数字又は標記
（label）のような同定標識によつて各ワード
を表示する。本発明のシステムは音声による
区切り符号及び数字をも認識することが出来
る。個々の綴り文字（spelled charcter）を
認識するための装置を基本的なスピーチ認識
装置へ部分１１Ａとして付加することによ
り、認識語彙の中には存在しないワードの入
力を許容するようにしてもよい。認識された
文字は、従つて、夫々のコード同定標識によ
り文字コード出力線１３Ａ上に表示される。編集システムは辞書・検索メモリ装置１７
を含み、メモリ装置１７は関連するワード、
区切り符号又は命令を表わす各コード同定標
識を受取る。文章コードを表わす各コード同
定標識に応答して、メモリ装置１７の辞書部
分は出力線１９上に、関連する文章ワードの
文字ストリングの形式で認識コードを発生す
る。認識コードはアスキ（ASCII）、エブク
デイツク（EBCDIC）或は他の文字表示コー
ドであつてもよい。与えられた文字、数字又
は区切り符号の各文字ストリングはアスキ・
コードで表示されるのが好ましい。同時に、
文章ワードの文字カウント（character
count）及び文章の他の情報を含む「トーク
ン」が検索メモリ部分により、出力線２１上
に発生される。辞書／検索メモリ１７は、読
み取り専用メモリも使用しうるけれども、ラ
ンダムアクセスメモリを含むのが好ましい。
トークンのより詳細は後述する。各々の音声編集命令入力に応答して、辞書
部分は関連するコード化命令ワードを出力線
２３上に発生する。命令及び命令ワード表示
についての詳細な説明は後に行う。付加的な辞書部１７Ａが単一の文字のため
に与えられている。それはその入力に、認識
された各綴り文字のコード同定標識を受け取
り、そしてそのコード同定標識に応答して、
出力線２５に１個の単一のコードワードを発
生すると同時に、出力線２７に、個々の文字
に関連した他の制御情報を発生する。この制
御情報に関する詳細な説明は後で行う。記憶及び様式化部２９は出力線１９乃至２
７からのすべての情報を受け取り、そしてビ
デオ情報を準備するためそれ等の情報を処理
して、表示スクリーン３１上に正しく様式化
された情報を表示する。ビデオ信号発生器３
３はコード化されたビデオ情報を表示装置の
ための実際の電気制御信号に変換するために
備えられている。記憶及び様式化部２９はまた、それが受け
取つた文章コード、区切り符号及び命令に基
づいて、編集される文章の前後関係の状態を
決定する。文章の前後関係の状態とは、例え
ば、「文章の開始」、「スペルモード
（spellmode）」の如きものである。文章の起
りうる前後関係の異なつた状態のリストが第
３表に示されている。この状態のコード表示
は線３５により辞書／検索部１７へ戻される
ので、辞書／検索部は、現在の状態（例え
ば、次のトークン中の「文章の開始」ビツト
を１にセツトする）に基づいて、それが発生
するトークンを更新する。夫々の更新の手続
は後述する。他の付加的な入力装置が記憶及び様式化部
２９に任意に与えうる。キーボード３７が、
既に説明したような編集システム中に命令
（及び文字）を入力し、更にライトペン、図
形タブレツト、「マウス」或は他の同様な装
置の如き手操作選択装置又は手操作指示器も
また編集システムに使用しうる。これ等の既
知の装置は、音声形成ではない命令を与える
ために、そして位置情報を入力するために、
指示機能を与えるために、或は打鍵以外にカ
ーソルを移動するために有用である。 (2) 連結（concatenation）及びクランクの挿
入本発明の編集システムの重要な特徴は文章
ワードをエンテイテイとして処理すること、
即ちシステムは表示装置にワード全体を供給
し、そしてワードとワードの間にブランクを
自動的に挿入することにある。更にまた、本
システムでは、所望の位置、即ち操作位置を
マークするカーソルは、通常１個のワード全
体に有効であり、若しカーソルを動かすと、
ワード全体を飛び越えることになる。カーソ
ルの幅はワードの長さに対して自動的に調整
されている。スピーチ認識システムはワード
全体を認識し且つ発生するので、このことは
操作を単純化する。然し乍ら、既に触れ、更に以下に細述され
るように、本発明のシステムは、認識されな
かつたワードを綴り読みする必要がある場
合、単一の文字のみを処理する動作モードを
与える。そのような文字が表示装置に加えら
れると、ワードの最初の文字又はワードの最
後の文字にブランクが添付されている場合を
除いて、そのような文字（ワードとして取り
扱われた）の間には自動的にブランクは加え
られない。また、カーソルは１個の文字だけ
をマークし、そしてこのモードにおいては、
１個の文字の歩進幅だけの前方又は後方に移
動する。音声化区切り符号は、表示された時、特別
な態様で処理される。例えば、コロンはブラ
ンクなしでワードの後に続くが、それ自身は
ブランクを従える。同じことが、終り括弧
（end parenthesis）にも当嵌るが、始め括弧
はコロンと反対の条件になる。（始め括弧の
前にはブランクがあり、その後にはブランク
を持たない。）連結又は挿入ブランクのための異なつた条
件が第２図に示される。通常のワードは、第
２Ａ図において、ワードのシンボルの両端の
２個の凸部で示されているように、ワード前
及び後にブランクを必要とする。反対に、ブ
ランクは第２Ｂ図に示されるように、ワード
のどちら側にも直接に連結しうるけれども、
図示のように、ブランクのシンボルの両端の
２つの凹部のため、他のブランクとは決して
連結しない。第２Ｃ図に示されたように、開
始括弧、即ち左側括弧又は同じようなシンボ
ル（例えば開始引用符）（start quotation）
はそのシンボルの前にブランクを必要とし、
そしてそのシンボルに続くワードへ連結され
る。左側凹部及び右側凸部のシンボルとして
第２Ｄ図に示されているように、コロン、ピ
リオド、疑問符などの如き区切り符号及び右
側括弧或はそれと類似のシンボル（終了引用
符）はそれ等のシンボルに先行するワードに
連結するが、然し、その後にブランクを必要
とする。ブランク挿入及び連結は本発明の全
−スクリーン編集装置によつて自動的に行わ
れる。本明細書中の４つの範疇に使われている記
号は以下の通りである。即ち、LRは左側及
び右側がブランク、LOは左側がブランクで
右側が連結、ORは左側が連結そして右側が
ブランク、OOは両側が連結を表わす記号で
ある。「Ｘ」は、ブランク挿入又は連結が文
章の前後関係に従属することを表わし、前も
つて決めることは出来ない。文章と文章の間に２つのスペースを置くと
いう文書形式は共通な慣習である。この編集
システムは随時、その文書形式に順応するこ
とが出来る。第２図は、各文章が１個のスペ
ースで終了する形式を示している。 (3) トークン命令及び単一の綴り文字を除く、文章コー
ド、数字又は区切り符号に対応する認識され
たエンテイテイのために、編集装置は「トー
クン」を与える。トークン全体は夫々のエン
テイテイのための文字カウントと、その連結
条件と、表示装置で編集するのに重要な他の
制御情報を表示する。トークンのフオーマツ
トは第３図に示されている。例えば、文字カ
ウントは、ワードの最大長さを32文字と仮定
して５ビツトで構成されている。必要に応じ
て、この領域に任意のビツト数を与えうる。
各数字及び区切り符号に対する文字カウント
は勿論１である。次の２個の１ビツト領域は、夫々のエンテ
イテイが先行するエンテイテイ又は後続する
エンテイテイに連結されるべきか否かを表示
する。通常のワードに対して通常のワードは
何れの側でも連結されることがないから、両
方のビツトはゼロである。次の領域もまた１
ビツトのみであり、ワードの最初の文字が常
に大文字化されるべきか否かを（Johnや
Englishのように）表示する。今まで述べた８個のビツト、即ち２本線の
領域線までのビツトは、各エンテイテイ（ワ
ード、区切り符号、数字、等）に対して予め
決められうる制御情報を構成している。然し
乍ら、トークンは様式処理及び編集処理の間
に入力されるその他の制御情報のための領域
を有している。夫々の制御ビツトを以下に説
明する。最初の可変制御ビツトは、夫々のエンテイ
テイが明瞭に認識されたかどうか、即ちその
選択が疑問であつたか否かを表示する。次の
制御ビツト領域は関連するワードが文章の始
めにあるか否か、従つて最初の文字が大文字
化されねばならないか否かを表示する。３番
目の可変制御ビツトは、夫々のエンテイテイ
が文章の条件付き終了であるか否かを表示す
る。ここで、文章の条件付き終了とは、例え
ば右側引用符号（”）のような区切り符号で
あつて、通常は文章の終りで記されることは
ないが、或る場合は文章の終りで記されるこ
とがありうる符号で文章が終了することを意
味する。次の可変制御ビツトは、関連するワ
ードが文章とは無関係にワードの文字全部を
大文字化（この条件は上段ケース命令即ち
UPRCASE命令で入力する）されねばなら
ないか否かを表示する。残りの４個の可変制
御ビツト（R1、R2、R3、R4）は、特定の
システム中で任意の意味に割り当てることが
出来る予備として備えられている。既に説明したように、編集処理の間で、与
えられた命令又は与えられた文章に基づい
て、可変制御情報領域中に８個のビツトが決
められた。これ等がどのように用いられるか
については後述する。ワード／文字ストリング様式を示す第４図
において、辞書中に記憶されるワードの文字
ストリングの形式が示されている。各ワード
はＮ個の文字Ｃ１〜CNから成り、各文字は
８ビツト（１バイト）で表示される。ワード
の長さは最大32個の文字まで可変長である。
１７Ａの辞書部中の１個の文字（スペルモー
ド動作で）は１バイトのみで構成される。各
ワードの最初の文字は、例えば文字判別のた
めには使われない１ビツトをセツトすること
によつてマークされる。最初の文字が開始マ
ークを有することを第４図のＣ１に付した星
印で表わしている。 (4) 音声命令の概観本発明の編集システムは異なつた編集動作
モードを持つている。異なつたモード間に切
換は命令により行われる。更に、次の動作に
対してのみ影響する命令がある。システムの
モード又は動作状態に影響する種々の命令が
第１表に示されており、これについては後述
する。更にまた、システムは現在のワード又は文
字を示すカーソルを有するものと仮定する。
このシステムでは、カーソルは通常、ワード
全体に有効なので、カーソルは以後「カーソ
ルボツクス」又は「現在ボツクス」、即ち
「カレントボツクス」と称する。ただ１個の
文字、又は区切り符号の場合、ボツクスは１
文字分の長さだけであることは言うまでもな
い。第１の命令「挿入」が挿入モードを開始
し、そのモードで音声情報はカーソルボツク
スの前に挿入される。現在の入力の間、カー
ソルは常に、存在するテキストの終端にある
ので、新しい入力はその終端に付加される。
編集者が脱落した或る情報を挿入したいとす
ると、編集者は編集システムで通常行われる
ように、関連する位置へカーソルを移動し、
そして存在するテキスト内に挿入される訂正
を発音すると、新しいテキストのための空間
を作る挿入部分を従えたテキストの自動シフ
トが行われる。第２の命令「置換」は置換モードを開始
し、置換モードにおいて、発音したワード又
は文字は存在するワード又は文字の上で重ね
書きされる。勿論、置換は現在のカーソル位
置で開始する。従つて若し、置換モードで３
個のワードが発音されたとすると、それ等は
３個の相次ぐワードを置換し、且つカーソル
ボツクスは各置換後、次に後続するワードに
移動する。同じことが、編集システムで良く
知られているように、個々の文字にも当て嵌
る。第３の命令「削除」は現在のカーソル位置
にあるワード全体、又は独立した文字を削除
する（現在のモードに依存して）。第４の命令「新しいパラグラフ（NEW
PAR）」は現在のカーソルボツクス位置にあ
る新しいパラグラフを開始する。この命令の
実行は新しいライン即ち行を開始させて、新
しいパラグラフを形成する。（後述する。）第５の命令「新しいライン
（NEWLINE）」は現在のカーソルボツクス
位置で新しい出力ラインを強制する。新しい
ラインが開始され、関連する入力がラインス
トリング・ヘツダにも作られる。（上述した
ように、新しいパラグラフにおいて）第６の命令「大文字化（CAPITAL）」は
発声された次の文字又は次のワードが大文字
化される（第１文字のみ）ことを表示する。
含まれたトークン中の関連する制御ビツトは
それに従つてセツトされる。第７の命令「上段ケース（UPRCASE）」
は、発音され又はスペルされた次のワードが
全文字とも上段ケースへ変換されることを表
示する。関連するトークン中の上段ケース制
御は「上段ケース」命令に従つて調整され
る。第８の命令「スペルモード
（SPELLMODE）」は、個々の文字だけが有
効になるスペルモードを開始する。通常の語
彙ワードはこのモードでは認識されず若しく
は受け付けられない。第９の命令「スペルモードの終り（END
−SPELLMODE）」はスペルモードを終了
させて、数千の通常の語彙ワード（命令語、
区切り符号及び数字を含めて）のみが認識さ
れ受け付けられる通常のモードへ復帰する。上述したように、これ等の命令は、以下で
説明する第１図及び第６図に示されたキーボ
ード３５の入力キーを介しても与えることが
出来る。システムの動作の結果は音声命令の
それと同じである。 (5) 音声による区切り符号の検査第２表は音声の様式で入力しうる区切り符
号（数字を含む）のリストを示す。各符号の
右側に示された音声様式は自明である。第２
表はまた、連結の範疇に属する記号が示され
ている。４個の連結範疇が示されている第２
Ａ図乃至第２Ｄ図をも参照するとよい。編集システムの基本様式において、区切り
符号及び数字（及び命令語に使つたワードも
含んで）、間違つた命令又は区切りを避ける
ため、通常の文章ワードとして使つてはなら
ないことは注意を要する。然し乍ら、この問
題を解くための幾つかの方法があるので、区
切りワード及び命令語は通常の音声の文章の
中で使うことが出来る。 (a) スピーチ認識処理に使われる言語モデル
は、文脈を使つて、そのワードが通常の文
章ワードか又は区切りワードかを判別しう
るよう定義することが出来る。 (b) 区切り符号及び数字（及び命令）のため
の音声ワードは接頭辞、例えばパン−コロ
ン（PUN−colon）、パン−疑問符（PUN
−question mark）、デイグ−５（DIG−
five）、デイグ−ゼロ（DIG−zero）等に
よつて、特定して判別しうるようにするこ
とが出来る。 (c) 区切り符号、数字、命令などを表わすワ
ードを発音する前に、スペルモードへ切換
えることも可能である。この場合、「終止
符（period）」又は「５（five）」のような
ワードは、辞書部１７及び１７Ａに違つた
意味で入れられる。 (6) キーボード及び手操作での入力装置のキーキーボード３７は任意のタイプライタのよ
うに通常の文字部分を含むが、第５図に示さ
れたような制御キー部分をも有する。それは
第(4)項で音声命令として既に説明したような
９個の命令ワードのキーを含むのが好まし
い。挿入／置換とかスペルモード／スペルモ
ード終了とかの命令ワード対のために、１個
のトグルスイツチがキーボード上に与えられ
ている。加えて、他の３個の命令、即ち、上
段ケース（UPRCASE）から下段ケース
（LWRCASE）へワード全体を変換するため
の下段ケース、ストレージへスクリーンの内
容を転送するためのSTORE（記憶）、印字出
力へスクリーンの内容を転送するためのプリ
ント（PRINT）命令が備えられる。幾つか
のキーＦ１乃至Ｆ４は、必要に応じて付加的
な命令のために使われる。第５図に示された
アスタリスクは音声命令としても使用可能で
あることを示す。手操作の選択器即ちポインタ装置３９が第
６図に示される。それはカーソルを４つの座
標方向に移動するための４個のキーを持つ。
４個のカーソルキーの代りに、ジヨイステイ
ツクを備えてもよい。他の可能性として、底
面で位置感知手段を持たせて、手操作選択装
置を「マウス」として使うことが出来る。更
に３個のキーが設けられ、第１のキーはスペ
ルモードとワードモードとの間を変換する
（スペルモードの終了を意味する）トグルス
イツチＷ／Ｓである。第２のキー、EXECキ
ーは動作の実行に使われる。動作の実行とは
音声形式で既に入力された（即ち予備選択さ
れた）命令、又はキーを打鍵することにより
入力された命令を実行することを意味する。
前もつて入力されたすべての命令はスクリー
ンに表示されるので、EXECキーを打鍵する
ことにより命令が実際に遂行される前に、オ
ペレータは命令をチエツクすることが出来
る。「F5」のキーはメニユーを表示される付
加的機能を制御する。 (B) 情報の記憶 (1) 辞書中の配列既に述べたように、綴り文字を除き、スピ
ーチ認識装置によつて認識しうるエンテイテ
イ（即ち、ワード、単一の数字、区切り符
号）夫々のために、文字ストリング及び関連
するトークンが辞書部１７中に記憶されてい
る。トークンのフオーマツトについては既に
(A)(3)項で述べた。コード同定標識が線１３を
介して辞書部１７へ供給されると、それは関
連するエンテイテイに対する文字ストリング
とトークンを発生する。図示された良好な実
施例では、文字ストリングとトークンは並列
で且つ同時に伝送される。スペルモードであ
る単一の文字に対しては、唯１個のアバトが
辞書部１７Ａに記憶され、又は辞書部１７Ａ
により供給される。辞書はまた、５個のアス
タリスクのストリング（＊＊＊＊＊）及びト
ークンと、１個のアスタリスク（＊）とを記
憶している。これ等は、音声入力がワードモ
ードでもスペルモードでも認識出来ない時に
発生される。 (2) 実行ストレージ中の活動している情報の配
列編集したフアイルの内容は（フアイルのす
べてか、又は一部がスクリーンに表示されて
いる）実行ストレージに保持される。図示の
実施例では、実行ストレージは記憶及び様式
化部２９に含まれている。文字ストリング及
びそれ等に関連したトークンが本システムの
実行ストレージ中に記憶されている特定の態
様を第７図に示す。第７Ａ図はラインストリ
ング・ストレージを、第７Ｂ図はトークンリ
スト・ストレージを、第７Ｃ図はラインポイ
ンタ・レジスタを、第７Ｄ図はラインストリ
ング・バツフアを、第７Ｅ図はトークンポイ
ンタ・レジスタを、第７Ｆ図はカーソルレジ
スタを夫々示し、第７図は実行ストレージを
示すため上記各図の関係を説明する図であ
る。現在編集するフアイル、即ち文書の各ライ
ンのために、別個の要素としてラインストリ
ング・ストレージ素子７１があり、それは関
連する文字ストリングを保持する。ライン文
字ストリングはワード文字ストリングと連結
する。ラインストリング・ストレージ７１中
の各ワードの文字ストリングに対して、トー
クンがあり、それはトークンリスト・ストレ
ージ７２中に別個に記憶される。以下に説明
されるように、このトークンは連鎖状のリス
ト構成で配列されている。特定のラインが編集されており、カーソル
がスクリーン上のそのライン上に置かれた
時、ラインを同定するポインタは活動してい
るラインポインタ・レジスタ（第７Ｃ図）に
記憶される。関連するラインの文字ストリン
グはラインストリング・バツフア（第７Ｄ
図）へロードされる。第７Ｄ図は目的とする対象のラインのため
のラインストリング・フオーマツトが示され
る。ラインストリングは次の３つの領域を含
むヘツダが先頭を占める。第１の領域はトー
クンリスト・ストレージ７２のトークンポイ
ンタであり、それは活動しているラインの最
初のワードに関連するトークンのストレージ
位置を同定する。ヘツダの他の２つの領域は
夫々１個のビツトであつて、新しいライン、
又は新しいパラグラフが対象のラインで開始
するか否かを表示する。ラインストリングの
残りの領域はそのラインを構成するすべての
ワードのワードストリングとブランクとを含
む。例えば、ワードＷ１はＣ１１，Ｃ１２，
Ｃ１３，Ｃ１４；ブランクＣ１５から成り、
ワードＷ２はＣ２１，Ｃ２２；ブランクＣ２
３から成るなどの如くである。異なるワード
の境界は１個のアスタリスク符号（＊）で認
識され、１個のアスタリスクが、ワードが実
行ストレージに転送された時に各ワードの最
初の文字に入れられる。第７Ｅ図は現在活動中のワード、即ちカー
ソルを持つワードのトークンのポインタを有
するトークンポインタ・レジスタを示す。既
に述べたように、ラインストリング・ストレ
ージ中にあるすべてのワードのトークンは連
鎖状のリストの形でトークンリスト・ストレ
ージ７２の中に分離して記憶されている。ラ
インストリングに属する一組のトークンの最
初のトークンのアドレスはラインストリング
（第７Ｄ図）のヘツダの中に与えられる。こ
の最初のトークンはトークンリスト・ストレ
ージ７２のラインストリングに添加されてお
り、第２のトークンのアドレス（即ち、ライ
ンの第２のワードに属するトークン）は同様
にストレージ７２のラインストリングに添加
されており、以下のトークンアドレスもまた
同様である。ラインの最後のトークンは関連
する終了表示をラインストリングに添加して
いる。従つて、第７Ｅ図に示されたトークン
ポインタ・レジスタは、トークンリスト・ス
トレージ７２中に記憶されている（そのフオ
ロワアドレスと一緒に）実際のトークン（第
３図のフオーマツトに対応する）のポインタ
を保持する。ラインストリング・バツフアが付勢された
時、ラインストリングがラインストリング・
ストレージからラインストリング・バツフア
へ転送されたとすると、最初のトークン（ラ
インストリング・ヘツダ中で同定される）の
ポインタはラインストリング・バツフア（第
７Ｄ図）からトークンポインタ・レジスタへ
移動される。ラインの編集動作の間で、カー
ソルがワードからワードへ動いた時、「フオ
ロワ」アドレス（即ち、次のトークンポイン
タ）を用いて、トークンポインタを１個づつ
トークンポインタ・レジスタへ転送する。若
し、編集動作の間で、ワードの状態に何かし
らの変更が生じたならば、（例えばあるワー
ドが文章の最初の位置に移動した場合）、ト
ークンリステ・ストレージ中に更新されたト
ークンを容易にアクセスしうるように、関連
するトークンは実際のトークンポインタを使
つて更新することが出来る。実行ストレージ中の付加的なレジスタは第
７Ｆ図に示したカーソルレジスタである。そ
れは、ラインストリング・バツフア中の現在
活動中のワードの開始位置のアドレス（例え
ば、１ライン中の128文字の１つを同定する
ための７ビツト）と、ワード及びカーソルの
長さ表示とを記憶する。長さ表示はトークン
から取り出され且つ現在活動中のワードの長
さを同定する５ビツトが好ましい。カーソル
が移動されると、システムはライン中の次の
マークされた開始文字を探し、そしてカーソ
ルレジスタ中にそれを入れる。加えて、次の
トークンポインタはフオロワアドレスを使つ
てトークンポインタ・レジスタへ取り出さ
れ、そして長さ表示は新規に活動したトーク
ンからカーソルレジスタの第２の部分へコピ
ーされる。 (C) 編集システムの動作 (1) 実験の例の説明この編集システムの動作を説明するため、
第８図に１例が示される。第８図は、入力さ
れたばかりの文章が表示されたスクリーンを
示している。所望の文章は「This is ａ
SAMPLE test（only for the purpose of
demonstration）．」である。この文章を入力
する発声の順序は「this is ａ
UPPERCASE sample test OPEN−
PAREN only for the purpose of
demonstration CLOSE−PAREN
PERIOD」であつた。発声の順序中のアツ
パケース（UPPERCASE）で示されたワー
ドは命令、又は区切り符号である。第８図から理解されるように、ワード
「sample」は大文字で表示されているので、
アツパケース、即ち上段ケース命令は正しく
実行されていたのが分る。ワード「for」は
「four」と不正確に認識されたが、システム
はこの認識は疑問であつたことを表示し、そ
して、編集者がこの状態に気付き且つ綴りを
チエツクすることが出来るように、このワー
ドは枠を付して注意を喚起している。ワード
「purpose」は全く認識されなかつた。それ
故、システムは５個の並んだアスタリスクを
入れた。この例は更に、システムは文章ワー
ドの間にスペースを正確に与えたが、左側括
弧の後のスペースと、右側括弧及び終止符即
ちピリオドの前のスペースは与えられていな
いことを示している。すべての文章が入力され、且つカーソルが
最後に入力されたエンテイテイとしての終止
符、即ちピリオドの次に来た後に、ユーザが
「demonstration」を「illustration」に置き
換えたいと望んだとする。これを達成するた
めに、カーソルは３つのエンテイテイだけ後
退されて、ワード「demonstration」をポイ
ントする。命令REPLACE（置換）がスピー
チで発声され（又はキーボード入力で）、結
果として、ワード「demonstration」をマー
クする。最後に与えられた命令REPLACEは
スクリーンの左下隅に表示される。然し乍
ら、それを実際に遂行するために、既に述べ
たように、オペレータはEXECUTEキーを
押さなければならない。右下隅にシステムの
現在の有効状態が示されており、それらは
INSERT（新しい文章を入力すること−命令
REPLACEは未だ有効でない）及びWORD
（綴り文字を必要としなければ通常のモード）
である。第８図の例を参照して、文章を入れたり編
集を行うための他の動作を以下に述べる。 (2) 編集動作第１図及び第９Ａ乃至第９Ｃ図を参照し
て、この編集システムにおいて遂行される操
作即ち動作の詳細を以下に述べる。 (2a) 基本動作（第１図）入力されるワード又は命令を遂行する動
作は以下のステツプを含む。 ※認識するエンテイテイのコード同定標識
をスピーチ認識装置１１から辞書／検索
メモリ１７へ転送する。 ※文字ストリング及び関連するトークンを
読し出し、且つ文章の前後関係情報に従
つてトークンを更新する。又は命令コードを読み出す。 ※文字ストリング及びトークンを記憶及び
様式化部（Ｓ＆Ｆ）２９へ転送する。又は命令ワードコードをＳ＆Ｆ部２９へ転
送する。又は命令をキーボード３７又は手操作選択
装置３９からＳ＆Ｆ部２９へ転送する。 ※新しい文章の前後関係情報を評価し、Ｓ
＆Ｆ部２９中に記憶されている文章の前
後関係情報を更新し、そして新しい文章
の前後関係情報の一部を辞書／検索メモ
リ１７へ返還する。 ※Ｓ＆Ｆ部２９のストレージの中へ文字ス
トリング及びトークンを挿入する。 ※カーソルの位置及び長さを更新する。 ※トークン情報を更新する。 ※Ｓ＆Ｆ部２９の中の更新された新しい情
報でスクリーン３１上の表示を更新す
る。 (2b) 辞書／検索メモリ１７中のトークンを更
新するための詳細な動作辞書／検索メモリ１７はトークンを更新
するため、下記の情報を受け取る。 (イ) 状態信号線１５を介して、スピーチ認
識装置１１から：「ワードは多分正し
い」、(ロ)「ワードは疑問である（多分間
違い）」、又は(ハ)「ワードは認識しえな
い」であつて、最後の(ハ)の項の場合はダ
ミーワードストリング「＊＊＊＊＊」を
発生する。 (ロ) Ｓ＆Ｆ部２９から：「文章の開始、大
文字化されるべき次の文章ワード」−「最
後のエンテイテイは数字であつた、若し
数字が左側連結であれば次のエンテイテ
イ」−「最後の命令はUPPERCASEであ
つた。すべて上段ケースにあるべき次の
文章ワード」（Ｓ＆Ｆ部２９から辞書／
検索メモリ１７へ転送される、文章の前
後関係状態のリストは−第３表を参照の
こと）を発生する。辞書／検索メモリ１７は、発生されたエ
ンテイテイが文章ワードであるか数字であ
るかを決定し、そして情報を更新する受け
取つたトークンに従つて、Ｓ＆Ｆ部２９へ
トークンを転送する前に関連する制御ビツ
ト（疑問−文章の開始−左連結−上段ケー
ス）を“１”にセツトする。 (2c) Ｓ＆Ｆ部２９における文字ストリング及
びトークンストレージの詳細な動作新しい情報を記憶するために、次のステ
ツプが実行される。 ※新しい文字ストリング及びトークンをバ
ツフア中に記憶する。 ※モードを決定する。（挿入／置換） ※若し置換さらば：＃ラインストリング・バツフア中の現
在のワードを新しいワードで置き換え
る。＃連鎖状のリスト中の現在のトークン
を新しいトークンで置換し、フオロワア
ドレスを置換されたトークンから新しい
トークンへ挿入する。＃次のトークンポインタ（フオロワア
ドレス）をトークンリスト・ストレージ
からトークンポインタ・レジスタへ転送
する。 ※若し、挿入なら＃ラインストリング・バツフア中の現
在のワードの前に新しいワードを挿入す
るか、又はバツフア中のラインストリン
グの終端に新しいワードを挿入する。＃連鎖状リスト中に新しいトークンを
挿入する。連鎖状リスト中の新しいトー
クンのフオロワアドレス及び前のトーク
ンのフオロワアドレスを更新する。 ※編集制御動作を実行する（下記の（2d）
項に記載されたように）。 ※若し現在のラインがオーバフローしたな
らば、リフロー（reflow）の行即ちラ
インへ移行する。（付加的機能） ※カーソルの位置及び長さを更新する。 ※スクリーン上の表示を更新する。 (2d) 編集制御の詳細な動作（第９Ｂ図）編集制御は下記の３つの範疇の情報によ
つて決定される。 (イ) システムの現在のモード（置換／挿入
−ワードモード／スペルモード）。 (ロ) 現在の文章の前後関係（第３表に示さ
れる）。 (ハ) 最後に与えられた命令（ありうる音声
命令は第１表に掲げられており、ありう
る付加的な打ち込み命令は上述の(A)(6)項
に記載されている）。編集制御を示す第９Ｂ図に代表的な範疇
の編集動作のみを示し、すべての編集動作
に関するより詳細なリストは第４表に示し
てある。以下に述べる項目は、上述の３つの範疇
からの情報のありうる組み合せに対して、
本編集システムにより実行される動作を掲
げたものである。削除（DELETE）：ワードモードにおい
て、編集者がカーソルボツクスで表示され
たワード全体を削除したい場合。スペルモ
ードにおいて、編集者がカーソル位置にあ
る単一の文字のみを削除したい場合。既に
述べたように、浮遊ワードを削除する場
合。 (イ) 若し、削除したワードが最後の区切り
符号であるならば次のワード（若しあれ
ば）は最早や文章の始めではなく、そし
て、下段ケースへ変更される。（“John”
又は“Mary”のように通常大文字で始
まるワードでなければ） (ロ) 若し、削除したワードが文章の最初の
ワードであるならば、次のワードは文章
の新しい始まりになり、大文字化されね
ばならない。 (ハ) 若し削除されたワード又は文字が区切
り符号であれば、残りの項目のスペース
が影響されるかも知れない。例えば、若
し、節「and／or」の中の「／」が削除
されるならば、通常のスペースを有する
２個のワードが残り、「andor」でなく
「and or」として表示されるだろう。文字逆送（CHARACTER
BACKSPACE）：キーボードを有する編
集装置又はワードプロセツサの普通の使用
法において、大文字化はシフトキーを押す
ことにより極めて容易に入力される。然し
乍ら、音声入力の場合、大文字化は通常、
自動的に検出することが出来ない。この問
題は色々と論じられているように、文章の
最初のワードの頭文字を自動的に大文字化
する問題や、大文字の通常の通い方（例え
ば「John」や「USA」に従つてワードの
大文字化が行われない問題や、大文字化の
これ等の不履行を矯正するための大文字化
命令を確立する問題に提言されている。こ
れらの確立された命令は、 (イ) 次の文字を大文字化せよ（Capitalize
next word）。発声された次のワードの
大文字化を行う。例えば、「capital
example（大文字化例）」と発声すると出
力（Example）を発生する。 (ロ) 現在のワードを大文字化せよ
（Capitalizecurrent word）。カーソルで
表示された現在のワード又は文字を大文
字化する。（ワードモード又はスペルモ
ード夫々において） (ハ) 現在のワードを下段ケースへ変更せよ
（Change current word to lower
case）。現在のワード（又はスペルモー
ドにおける現在の文字）を下段ケースへ
変更する。 (ニ) 現在のワードを上段ケースへ変更せよ
（Change current word to upper
case）。現在のワード（スペルモードに
おいては現在の文字）を上段ケースへ変
更する。３個の相次ぐワード「John is
here」についてこの命令を使うと、結果
として、「JoHN IS HERE」を生ずる。大文字化の不履行の結果又は与えられた
大文字化命令の結果は各ワードのトークン
に影響する。（「最初の大文字」及び「上段
ケース」の２個のビツト中で、−第３図を
参照）様式化（FORMATTING）：「新しいラ
イン」及び「新しいパラグラフ」などの命
令が通常のテキスト処理システムと共通に
使われ、現在のラインが一杯でなくとも新
しいラインへ強制的に移動され、新しいパ
ラグラフがカーソルによつて表示された位
置で開始する。本編集システム内でのこれ
等の命令はまた、次のワードは文章の初め
にあるのか否か、若しそうなら大文字化さ
れるべきか否かを考慮させる付加的な機能
を持つ。巻き戻し（SCROLLING）：他の編集装
置と同様に、文書の始めの部分又は終りの
部分を観察するための命令が与えられる。
加えて、本編集システムは認識に疑問があ
る次のワードへカーソルを迅速に移動する
特別の命令が備えられており、移動したカ
ーソルの位置で、発声者はそのワードを訂
正するか、又は若し正しければそのまま残
す。（勿論、「疑問」である旨の表示は削除
する。）これは誤りを調べるため、文書の
初期のプルーフリード（保証読み）を容易
にする。モード選択（MODE SELECTION）：
多くの編集装置は動作モードを持つてお
り、異なつた動作モードの間で切換えるた
めの命令を有する。ここで記載される編集
装置は特別の可能性、即ちワードモード又
はスペルモードを有することにおいて異な
つている。既に述べたように、ワードモー
ドは、入力装置がすべてワードで構成され
ている場合、音声入力を行うのに適してい
る。スペルモード（又は文字モード）は認
識装置の語彙にないワードを綴りによつて
入力する場合とか、キーボードを使つて入
力する場合に適している。所望のモードを
選択するための命令が与えられており、こ
れは上述したように、他の多くの命令の動
作に影響する。マイクロフオン制御（MICROPHONE
CONTROL）：未だ説明されていなかつた
けれども、時によつて、オペレータの何ら
かの事情によつて、スピーチ認識装置のマ
イクロフオンをオフにしたい場合がある。
これは最も単純にはマイクロフオン自身の
スイツチによつて行うことが出来るが、本
認識システムのように、マイクロフオンを
オン又はオフにするための別個の命令を与
えてもよい。この後者の方法はマイクロフ
オン制御を含んですべての所望の機能を達
成するために、均一な命令インターフエー
スを許容することにより、多くの別個の制
御及びスイツチの必要をなくす。辞書のパーソナル化（DICTIONARY
PERSONALIZATION）：現在のスピー
チ認識システムは最大5000〜20000ワード
の限られた語彙を持つているので、しばし
ば用いるワードがその語彙に含まれていな
い事態に遭遇する。或る認識装置は正規の
語彙に新しいワードを付加することが出来
る（多分、同時に使用頻度の小さいワード
は抹消する）。これを達成するための方法
それ自体は本発明の一部ではなく、スピー
チ認識装置それ自身の一部である。然し乍
ら、本編集システムは、若しスピーチ認識
装置がその語彙の中に新しいワードを加え
る能力を有するなら、所望のワードを辞書
（第１図の１７）へ加えるための命令を備
えている。上述の事項は編集動作の完全な目録では
ない。何故ならば、編集装置の音声入力の
性質に関連しない動作については、ここで
は詳細に述べていないからである。スピー
チ入力に直接関係ない動作は以下の動作を
含む。 −文章の一部分（area）をマークし又は
マークしない。マークした部分を他の場
所へ移動し、コピーする。マークした部
分を削除する。 −表示したワード又は文字の順序を検索す
る。そのような順序の１つを他の順序と
置き換える。 −前方向又は逆方向へ、又は上段から下段
へ文書の内容を巻き戻す。 −挿入モード又は置換モードに選択する。 −存在する文書を訂正し、又は新しい文書
を創作し、文書内容をプリントし、文書
を記憶する。上記リストの制御動作が実行された時に
のみ、関連する状態に適用して、(C)、（2c）
項で掲げられた３つのステツプが行われる
（即ち補助的なリフロー、カーソルの更新
及び表示装置の更新）。 (2e) 単一の文字の記憶又は挿入のための詳細
な動作（第９Ｃ図）既に述べたように、スペルモードにおい
て、単一の文字はスクリーン上に編集する
文章中に挿入又は置換することが出来る。
単一の文字は、発声された時、スピーチ認
識装置によつて認識され、且つ関連するコ
ード同定標識が発生される。第１図を参照
すると、このコード同定標識はスピーチ認
識部１１Ａにより線１３Ａを介して辞書部
１７Ａへ供給される。辞書部１７Ａは関連
する文字を表示する単一のバイトを線２７
を介して記憶及び様式化部（Ｓ＆Ｆ）２９
へ発生する。このモードではトークンは発
生されない。（トークンが各ワードに対し
て発生されるワードモードとは対照的であ
る。）スペルモードにおいて、Ｓ＆Ｆ部２９は
また、キーボード３７から個々の文字を表
示する単一のバイトを受け取るかもしれな
い。（通常はそうであるように、若しシス
テムが通常のタイプライタのキーを装備し
ているならば）ワードモードからスペルモードへ変化す
ると、カーソルはただ１個の文字幅に調節
され、且つカーソルは、モードが変化した
時、現在のワードであつたワードの最初の
文字に置かれる。その後、カーソルは単一
の文字位置の量で移動する。カーソルレジ
スタ７３の内容は第１の領域中の実際のカ
ーソル位置であり、第２領域には“１”が
ある。単一文字を表示するバイトを受け取つた
後、Ｓ＆Ｆ部２９の中で下記のステツプが
取られる。 ※新しいバイトをバツフアに入れる。 ※特別の命令なしでモード（挿入／置換）
を決定する。即ち若しカーソルが文字の
上にあれば置換であり、そして若しカー
ソルがスペースの上にあれば挿入であ
る。 ※若し置換であれば、＃ラインストリング・バツフア中の現
在の文字バイトを新しい文字バイトで置
換する。若し置換される文字がワードの
最初の文字であつたならば、新しい文字
バイトは開始ワードであることを表わす
ようマークされる。 ※若し挿入ならば、＃ラインストリング・バツフア中の現
在の文字バイトの前に新しい文字バイト
を挿入する。（新しい文字の右のライン
部分を１文字分だけ右へシフトする） ※影響されたワードのトークンを再分析す
る。 ※カーソル位置を更新する。（カーソルは
置換及び挿入モードにおいて、１位置だ
け右へ移動する。） ※Ｓ＆Ｆ部２９中の更新された新しい情報
をスクリーン３１に表示する。スペルモード終了命令が与えられた時、
カーソルは現在活動している文字を含むワ
ードに留まるが、ワード全体を被う長さで
ある。カーソルの位置及び長さは前に述べ
たように、カーソルレジスタ中に入れられ
る。スペルモードの間で、カーソルがワー
ドの境界を越えて移動した時、トークンポ
インタ・レジスタ中のポインタは、カーソ
ルの移動方向に依存して、次の、又は前の
フオロワアドレスによつて置き換えられる
ことは注意されるべきである。上掲のステツプ「影響されたワードのト
ークンの再分析」は下記の状態を処置す
る。 −若し付加的な文字が挿入され、又は文字
が削除されたならば、文字カウントを更
新する。 −「文章の条件付終了」ビツトをセツトす
る。（後述する。） −若し新しい文字がｊ欄でブランクであれ
ば連結を更新する。＃若し位置ｊ＋１にブランクでない文
字があるなら、トークンはｊ＋１欄で開
始することが決められる。それは連結タ
イプLRが与えられる。例：ワード「worth white」中の
「while」の前に若しブランクが挿入さ
れると、その結果は「worth」と
「while」とのための２個のトークンが
生じて、「worth while」と印字される。＃若しトークンがｊ−１欄で開始する
と、それは連結タイプLRが与えられる。例：「２」のトークンが連結タイプLO
を持ち、且つ「３」のトークンが連結タ
イプORを持つ場合（文章の前後関係の
ため）、「23カウント」の中の「２」の前
に若しブランクが挿入されると、「２」
及び「３」のトークンは通常のLRタイ
プとして再マークされ、そしてストリン
グは「２３カウント」となる。 −若しｊ欄の新しい文字がブランクでなけ
れば、連結を更新する。＃若しｊ−１即ち前の文字がブランク
であれば、新しいトークンはｊ欄で始ま
る。＃若しエンテイテイ（例えばワード）
が開始するｊ−１欄に文字があれば、関
連するトークンは連結タイプLRが与え
られる。例：連結タイプLOを持つ「（」の後に
若し「）」が挿入されると、連結タイプ
LRを有する１個のトークンで「（）」を
生ずる。＃ワードの開始であり、且つアルフア
ベツト又は数字である文字が若しｊ＋１
欄にあるならば、そのワードの古いトー
クンは新しいトークンに“のみ込まれ
る”ので、単一のトークンがｊ欄で始ま
る。例：ワード「take」の前に若し「ｓ」
が挿入されると、結果のステーキ即ち
「stake」は単一のワードとして取り扱わ
れる。然し乍ら、若し「ｓ」が「：」の
ような区切り符号の前に挿入されると、
結果の「ｓ：」は２個のトークンを有す
る２個の別個のエンテイテイとして取り
扱われる。 (2f) 第８図の見本文に挿入を行い、且つ編集
するのに必要な動作の簡単な考察先ず最初は、左上隅にあるカーソルを除
き、スクリーンは何も映つていない。命令
なしで、システムは挿入モード及びワード
モードにある。ラインストリング・ストレ
ージ、トークンリスト・ストレージ、ライ
ンストリング・バツフア及びトークンポイ
ンタ・レジスタは空である。ラインポイン
タ・レジスタ（第７Ｃ図）は最初のライン
のためのラインストリング・ストレージ中
の利用可能なスペースのアドレスを含む。
利用可能な最初のトークンの位置のアドレ
スがラインストリング・バツフアの「トー
クンポインタ」中に挿入され、そして「新
しいライン」ビツト及び「新しいパラグラ
フ」ビツトは“１”にセツトされる。ライ
ンストリング・バツフアＣ１１（第７図）
中の最初の利用可能な領域の始めの位置ア
ドレスがカーソルレジスタ中に挿入され、
そして長さ表示“１”が与えられる。トー
クンリスト・ストレージ中の次の位置のア
ドレス（フオロワアドレス）は最初の利用
可能のトークン位置に関連する領域に挿入
される。最初のワード「this」が発声された時、
文字ストリング及びトークンが辞書部から
発生され、トークンの「文章の開始」ビツ
トをセツトする。（Ｓ＆Ｆ部２９からの関
連するフイードバツク情報によつて）文字
ストリングはラインバツフアＣ１１乃至Ｃ
１４（第７Ｄ図）に入れられて、「ワード
開始」として第１のバイトをマークする。
トークンは、フオロワアドレスと共に、ト
ークンバツフア中の利用可能であつたトー
クンリスト・ストレージ中に入れられる。カーソルの位置は新しいワードの後に位
置にある文字位置Ｃ１５のアドレスへ変更
され、その長さを“１”にする。表示装置
は更新され、第１のワードが「文章の開
始」とマークされているので、大文字
「Ｔ」で最初のワードを表示し、そしてカ
ーソルはワードの直後の位置に現われる。次のワード「is」を発声すると、その文
字ストリング及びトークンが（「文章の開
始」ビツトをセツトすることなく）辞書／
検索部１７の辞書部分から発生される。Ｓ
＆Ｆ部２９はラインストリング・バツフア
の位置Ｃ１５にスペースを自動的に挿入
し、且つ新しい文字ストリングを後続する
位置Ｃ２１及びＣ２２に自動的に挿入す
る。Ｃ２１はワードの始めなので、マーク
を入れる。トークンは古いトークンに利用
可能であつたフオロワアドレスのトークン
リスト・ストレージに挿入される。新しい
フオロワアドレスはトークンリスト・スト
レージ中の新しいトークンへ添加される。
カーソルは位置Ｃ２３をポイントするため
に更新され、そして表示は第２のワード
と、第２のワードの次に１文字の長さのカ
ーソルとを表示するため更新される。以下に述べる修正動作を除いて、同様な
手続が後続する音声ワードの夫々に行われ
る。音声の上段ケース命令はワード
「sample」のために、トークンに「上段ケ
ースのセツト」ビツトを発生させて、その
ワードをすべて大文字により表示する。ワ
ード「only」がラインストリング・バツフ
アに入力された時、「（」のトークンは
“右”連結を表示するから、スペースは
「（」の文字バイトの後に自動的に挿入され
ない。文字ストリング「four」が発生され
た時、そのトークンは、スピーチ認識装置
１１からの関連する信号のため、「疑問」
ビツトのセツトを持つ。これはワード
「four」をハイライト（枠で囲む）するこ
とになる。ワード「purpose」が発声され
た後、５個のアスタリスクを表示する文字
ストリングがラインストリング・バツフア
に入力されると同時に、文字カウント５を
有する通常のワードのトークンがその中に
記憶される。勿論、スペースは、アスタリ
スクの順序が通常のワードのトークンを持
つているので、先行する「the」の後に挿
入される。ワード「demonstration」の後
の右側括弧の入力は、そのトークン表示が
「左側連結」だからスペースの自動挿入は
起らない。ピリオドがラインストリングへ
入力される時にも同じことがピリオドにも
当て嵌る。文章及び区切り符号がすべて発声された
後、それ等は表示装置３１上に現われ、且
つカーソルはピリオドの後に現われる。カ
ーソルが手操作選択装置３９により後退さ
れた時、カーソルは先ずピリオドの下に現
われ、次に右側括弧の下に現われ、そして
次にワード「demonstration」全体がカー
ソルによりアンダラインされる。カーソル
レジスタは文字「ｄ」のアドレスと長さ表
示“13”とを含む。トークンレジスタは、
正しいトークンのポインタ、即ちアンダラ
インされたワードに属するトークンのポイ
ンタを含む。ワード「demonstration」を
ワード「illustration」に置き換えるのに
２つの可能性がある。第１の方法は置換命令を与え、実行
（EXEC）のボタンを押して、置換動作を
付勢し、それからワード「illustration」
全体を発声する。これは、
「demonstration」の文字ストリング及び
トークン全体を置換するため、辞書部１７
からＳ＆Ｆ２９へ関連する文字ストリング
及びトークンを供給することになる。右側
括弧及びピリオドは１段左へ移動し、そし
てカーソルは右側括弧にシフトする。第２の方法は新しいワードの綴りを発声
することによつて古いワードと置き換える
ことである。然し乍らこれは、ワード
「illustration」が認識語彙（これは辞書部
に記憶されている）に含まれていない場合
にのみ行われる。命令スペルモードが与え
られるが、置換命令は特には与えられな
い。何故ならば若しカーソルが実際の文字
上にあれば、システムは自動的に置換モー
ドに入るからである。カーソルは従つて、
文字「ｄ」のみにアンダラインを置く。ワ
ード「illustration」は１文字毎に発声さ
れ、新しい各文字（辞書部から供給された
時）が古いワードの文字の１つと置き換え
られ、カーソルは右へ１位置移動する。然
し乍ら、トークンは変更されない。置換操
作の終りで、カーソルは古いワードの
“ｎ”に置かれている。ここで、新しいワ
ードは古いワードに比べて１文字だけ短い
ので、古いワードのこの文字を除去しなけ
ればならない。消去命令が与えられた時、
ただ１個の文字が消去される。右側括弧及
びピリオドは１位置だけ左へ移動し、そし
てカーソルは括弧上に留まる。（これはま
た、括孤がワード開始マークを持つので、
括弧のトークンのポインタはトークンポイ
ンタ・レジスタ中にあることを意味する。）
若し、スペルモード終了命令が与えられれ
ば、システムは、トークンの文字カウンタ
を13から12へ変更することによつて、前の
ワード（それは今では「illustration」で
ある。）のトークンを更新する。誤つたワード「four」を正しくワード
「for」に置き換えるため、そしてアスタリ
スクのストリングを正しいワード
（purpose」に置き換えるため同じ手段を
使うことが出来る。第８図に示した例は幾つかのラインを占
めているけれども、編集動作の間でライン
を変更することについては説明しなかつ
た。ラインの変更は、カーソルが１つのラ
インから他のラインへ移動された時、或
は、文章の入力動作の間でラインの終了マ
ージンに到達した時、或は、「新しいライ
ン」命令又は「新しいパラグラフ」命令が
与えられた時に起る。ラインが変更されるたび毎に、ラインス
トリング・バツフアの現在の内容はライン
ストリング・バツフア７１へ移転され、そ
して所望の新しいライン（又は次の空白ラ
イン）のストリングアドレスはラインポイ
ンタ・レジスタ（第７Ｃ図）へ入力され、
ラインストリング・バツハア（第７Ｄ図）
から新しいラインが取り出され、そして最
初のトークンのポインタはトークンポイン
タ・レジスタ（第７Ｅ図）に挿入される。
空のヘツダを有する空白ラインの場合、ト
ークンリスト・バツフア中の次の利用しう
るトークンのアドレスはラインストリン
グ・バツフアのトークンポインタ領域と、
トークンポインタ・レジスタへ挿入され
る。このように、ラインの変更があれば必
ずラインバツフア中の文字ストリングが変
更されるばかりでなく、他のトークンチエ
インも付勢される。 (2g) 文章の終りでの特別の条件与えられた例においては、文章が条件付
きで終了することは生じなかつた。従つ
て、これを簡単に述べることとする。通
常、ピリオドやコロンは文の終りを定義す
る。（その結果は次のワードを大文字化す
る。）然し乍ら、時折、文が完了する前に、
或る文字がピリオドに続くことがある。１
例として、文章全体が引用符、即ちクオー
テーシヨンマークで与えられている場合
（“He said：Yes.”）の如きものがある。
このような状況は編集システムにより文脈
−分析され、そして右側の引用符が現われ
た後に、ピリオドに最初に割り当てられた
条件付きの「文章の終了」がピリオドを取
り去つて、その代りに引用符を割り当て
る。（夫々対応する制御ビツトに“１”を
セツトすることによつて行う。）これを
「条件付きの文章の終了」と言う。 (D) スピーチ編集装置の付加的な特徴 (1) 他の編集機能上述の記載においては、本発明に関連する
特徴のみについて詳細に説明した。勿論、編
集システムについての他の多くの機能を本発
明に組み合せることが出来る。そのような機
能は文章のいくつかの部分をコピーしたり、
移動したりすることを含む。（第４表で示し、
(C)(2)項で説明したように） (2) メニユー駆動部編集システムの他の既知の要素もまた、上
述の編集装置に組み入れることが出来る。１
個又は数個のメニユーを音声命令により、又
は関連するキーを押すことにより呼び出すこ
とが出来る。手操作選択器を使つて、所望の
動作を同定するメニユー位置へカーソルを動
かすことによつて、他の命令又は条件を選択
することが出来る。（実行キー、即ちEXEC
キーを押すことによつて実行する。）このよ
うなメニユー駆動動作の細部の説明は不必要
である。然し、メニユー（及び他の既知の編
集機能）で使われた時、本発明のすべての利
点、即ちワード全体のベースで、編集するこ
と、文脈を評価すること、個別のエンテイテ
イのためにトークンを使うことが出来るのは
注意する必要がある。 (3) 新しいワードを辞書部中に入力すること既に述べたように、辞書１７は一定数のワ
ード（及び区切り符号及び数字）、即ちスピ
ーチ認識装置で同定しうるものを記憶してい
る。辞書部にないワードをスピーチ認識装置
は知らないから、それ等のワードは同定しえ
ない。それ等のワードが発声された時、それ
等はダミー文字ストリングを挿入させて、同
定されたワードを綴り読みすることによつて
容易に置換することが出来る。スピーチ認識
装置は付加的ワードを認識するよう教育する
ことが出来る。辞書部にないワードがひとた
び同定されると、関連するコード同定標識は
辞書部に割り当てられる。各新しいワードに
関連する文字ストリング及びトークンが発生
され、そしていちどきに行われる更新動作に
おいてそれらは辞書部１７へ入力される。全
スクリーン編集装置はその他の変更を必要と
しない。本明細書で開示した装置に対して説明した変
更、修正に加えて、幾多の変更、修正はこの道の
専門家には自明であるから、本発明は説明した実
施例に限定されるものではない。例えば、文字ストリングは関連するトークンと
並列であるよう示されているが、与えられたスト
リングに続く、関連するトークン部分を直列に持
つ２つの情報区分（２つの区分は後に分離され
る）を与えることもまた本発明の範囲にある。以下の付表は種々のトークン関連機能を遂行す
るプログラムリストのサンプルを含んでいる。

【表】

〔発明の効果〕

以上説明してきたように、本発明はワードをエ
ンテイテイとして処理し、トークンを使用するこ
とにより、音声による文章の入力を容易にし、そ
れを正しい文書様式に変換して直ちに表示した
り、プリントすることを極めて容易にするばかり
でなく、ワード間のスペースとか、区切り符号を
自動的に当て嵌めることが出来、更に、音声によ
る入力、キーボード等による入力との両立を達成
し、打鍵操作を軽減することが出来、従来のワー
ドプロセツサに比べ、顕著な作用効果を奏する。

【図面の簡単な説明】

第１図は本発明に従つたスピーチ入力編集シス
テムをブロツク線図で説明する図、第２Ａ図、第
２Ｂ図、第２Ｃ図および第２Ｄ図はトークンで表
示される、文章編集動作中で生ずる連結の種々の
タイプを示す模式図、第３図は文字カウント、連
結表示及び他の制御情報を表示するトークンのオ
フマツトを示す図、第４図はワードの文字ストリ
ングを説明する図、第５図は音声形式でも入力し
うる、命令を入力するキーボードの制御部を示す
図（図中の英語表示はキーボードの外観の一部、
すなわち模様であり、日本語への翻訳は不可能で
ある）、第６図はカーソル位置及び他の基本的な
命令を入力するための手操作選択装置のキー配列
を示す図、第７図は第７Ａ図〜第７Ｆ図の組み合
わせ図、第７Ａ図〜第７Ｆ図は第１図の記憶及び
様式化部の動作ストレージの主要部を示す線図、
第８図はスピーチ編集装置の幾つかの機能を説明
するための見本の文章を表示する表示スクリーン
の図（英語仕様の見本のため日本語への翻訳は不
可能である）、第９図は第９Ａ図〜第９Ｃ図の組
み合わせ図、第９Ａ図、第９Ｃ図は本発明のスピ
ーチ入力文章編集装置で遂行される様式化及び編
集動作のブロツク線図である。１１……スピーチ認識装置、１７……辞書／検
索メモリ装置、２９……記憶及び様式化部（Ｓ＆
Ｆ部）、３１……表示装置、３７……キーボード、
３９……手操作選択装置。

Claims

【特許請求の範囲】１文章を構成する文章ワードを表わすスピーチ
セグメント及びピリオド、カンマ等の区切り符号
を指示するワードを表わすスピーチセグメントを
連続的に受け取つて認識するとともに、上記スピ
ーチセグメントが上記文章ワードを表わすのか上
記区切り符号ワードを表わすのかを判別し、上記
文章ワードが認識されたときには当該文章ワード
に対応するコード識別標識を生成し、上記区切り
符号ワードが認識されたときには当該区切り符号
に対応するコード識別標識を生成するスピーチ認
識装置を有し、このスピーチ認識装置からの情報
を編集するためのシステムにおいて、上記コード同定標識に応答して、関連する文字
ストリングと、文字カウント及び連結標識を含む
関連した制御情報を供給する辞書／検索装置と、上記辞書／検索装置により供給された文字スト
リング及び制御情報の流れに応答して、正しいス
ペース及び大文字化を含む様式化されたデータを
発生する編集装置と、上記様式化されたデータに応答して、標準的な
文章様式を持つた音声情報を表示するための表示
装置とから成る音声情報の編集装置。