JP2000010971A - 表記文字列変換装置および表記文字列変換方法 - Google Patents

表記文字列変換装置および表記文字列変換方法

Info

Publication number
JP2000010971A
JP2000010971A JP10175644A JP17564498A JP2000010971A JP 2000010971 A JP2000010971 A JP 2000010971A JP 10175644 A JP10175644 A JP 10175644A JP 17564498 A JP17564498 A JP 17564498A JP 2000010971 A JP2000010971 A JP 2000010971A
Authority
JP
Japan
Prior art keywords
character string
conversion
notation
command
notation character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10175644A
Other languages
English (en)
Other versions
JP3071760B2 (ja
Inventor
Kazunobu Ukikawa
和宣 浮川
Hidekazu Shinomiya
英一 四宮
Kazunori Yuge
和徳 弓削
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP10175644A priority Critical patent/JP3071760B2/ja
Publication of JP2000010971A publication Critical patent/JP2000010971A/ja
Application granted granted Critical
Publication of JP3071760B2 publication Critical patent/JP3071760B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 音声認識をより正確に行う。 【解決手段】 データ変換手段5から出力された表記文
字列は、未確定文字列記憶手段12に未確定状態で記憶
され、読み文字列は読み文字列記憶手段11に記憶され
る。出力手段18は、未確定文字列記憶手段12に記憶
された表記文字列が未確定状態で表示手段19に表示さ
れるように、表示制御命令を出力する。手動変換手段1
3は、未確定文字列記憶手段12に記憶された表記文字
列の注目部分について、変換命令が与えられると、この
命令に基づいた変換を行う。認識された操作者の変換命
令に基づいて変更することにより、正確な認識ができ
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、音声認識技術に
関し、特に表記文字列の変換精度向上に関する。
【0002】
【従来技術およびその課題】今日、コンピュータに文字
列を入力するのに、図9に示すような音声入力型の日本
語入力システムが知られている。音声変換辞書には音声
データの特徴量と、この特徴量に対応する表記文字列が
テーブルとしてあらかじめ登録されている。マイク61
から音声が入力されると、音声変換部63は、入力され
た音声から所定の特徴量を抽出し、音声変換辞書65に
登録されている各表記文字列の特徴量とのマッチングを
演算し、一致度のもっとも高いものを表記文字列として
出力する。音声入力で日本語入力ができるので、キーボ
ード入力になれていない操作者であっても、日本語入力
をすることができる。
【0003】しかし、上記音声入力システムにおいて
は、以下のような問題があった。一旦変換後にその変換
された表記文字列を変更するには、再度音声入力をする
必要があった。また、操作者は、場合によって、表記方
法を変更したい場合がある。たとえば、漢字をひらがな
表記したり、また、大文字を小文字表記する等である。
このような場合に、自由に表記方法を選択可能とするた
めに、候補リストに挙げておき、選択可能とすることも
考えられるが、その都度、画面上に候補リスト選択のダ
イアログが表示されると煩雑である。
【0004】この発明は上記問題を解決し、日本語入力
の表記を簡易に変換することができる表記文字列変換装
置またはその方法を提供する。
【0005】
【課題を解決するための手段および発明の効果】本発明
にかかる表記文字列変換装置または表記文字列変換方法
においては、操作者が入力した音声データから特徴量を
抽出して表記文字列に変換して出力する音声データ変換
手段から表記文字列が与えられると、これを未確定状態
で表示手段に表示させ、前記表示させた表記文字列の注
目部分について、変換命令が与えられると、この命令に
基づいた変換を行う。このように、前記表記文字列は変
換命令で変換可能であるので、前記音声データ変換手段
の変換が操作者の望む変換でない場合に、容易にこれを
変換することができる。また、前記表記文字列は未確定
状態で記憶しているので、その修正が容易である。
【0006】本発明にかかる表記文字列変換装置におい
ては、前記手動変換手段は、変換命令割当キーに機能別
に変換命令を割り当てておき、この変換命令割当キーを
操作者が選択すると、選択された変換命令割当キーに割
り当てられた変換命令に基づいて、前記未確定文字列記
憶手段に記憶された前記注目部分の未確定文字列を変換
する。したがって、操作者は機能別に割り当てられた変
更命令割当キーさえ覚えておけば、所望の変換を行うこ
とができる。
【0007】本発明にかかる表記文字列変換装置におい
ては、前記変換命令は、前記注目部分の未確定文字列の
表記を変更する命令である。したがって、操作者は機能
別に割り当てられた変更命令割当キーさえ覚えておけ
ば、所望の表記に変換することができる。
【0008】本発明にかかる表記文字列変換装置におい
ては、前記手動変換手段は、注目部分を特定する特定命
令が与えられると、これを特定して、前記変換を行う。
したがって、未確定文字列が複数ある場合にも、所望の
未確定文字列を変換することかできる。
【0009】本発明にかかる表記文字列変換装置におい
ては、自動変換手段は、前記未確定文字列記憶手段に記
憶された複数の表記文字列のうち特定の表記文字列の関
係を言語規則に基づき判断して、表記文字列間の関係が
前記言語規則に合致していないと判断した場合には、前
記未確定状態の表記文字列が前記言語規則に合致するよ
うに変更する。したがって、言語規則に合致していない
表記文字列を自動的に変更することができる。すなわ
ち、操作者は自動変換後の表記文字列について、所望の
変換が行われているかを判断すればよいので、操作の煩
雑性を防止できる。
【0010】本発明にかかる表記文字列変換装置におい
ては、前記音声データ変換手段は、出力する表記文字列
に対応する読み文字列を併せて出力し、この読み文字列
は読み文字列記憶手段で記憶される。前記表記変更手段
は、前記読み文字列記憶手段に記憶された読み文字列に
基づいて、前記変換を行う。したがって、読み文字列が
なければできない変換も可能となる。
【0011】本発明にかかる表記文字列変換装置におい
ては、未確定文字列記憶手段は、音声データ変換手段か
ら与えられた表記文字列を未確定状態で記憶する。出力
手段は、前記未確定文字列記憶手段に記憶された表記文
字列について注目部分が判別可能に表示手段に表示され
るように、表示制御命令を出力する。これにより、前記
表示文字列が表示される。手動変更手段は、与えられた
表記変更命令に基づいて、前記未確定文字列記憶手段に
記憶された前記注目部分の未確定文字列を変更する。こ
のように、前記表記文字列は変換命令で変更可能である
ので、前記音声データ変換手段の変換が操作者の望む変
換でない場合に、容易にこれを変換することができる。
また、前記表記文字列は未確定状態で記憶しているの
で、その修正が容易である。
【0012】本発明にかかる表記文字列変換装置におい
ては、音声データ変換手段は、操作者が入力した音声デ
ータから特徴量を抽出して表記文字列に変換する。未確
定文字列記憶手段は、前記音声データ変換手段で変換さ
れた表記文字列を未確定状態で記憶する。表示手段は、
前記未確定文字列記憶手段に記憶された表記文字列を表
示する。操作者によって、変換命令が機能別に割り当て
られた前記変換命令割当キーのいずれかが選択される
と、手動変換手段は、選択されたキーに割り当てられて
いる変換命令に基づいた変換を行う。これにより、前記
音声データ変換手段の変換が操作者の望む変換でない場
合に、容易にこれを変換することができる。また、前記
表記文字列は未確定状態で記憶しているので、その修正
が容易である。
【0013】以下、特許請求の範囲で用いていた用語と
実施形態の対応について説明する。
【0014】「自動変換手段」:実施形態においては、
CPU23のステップST11の処理に該当する。ま
た、実施形態においては、読みバッファ27bの読み文
字列を参照せずに、かな漢字変換規則に合致するか否か
の判断を行ったが、読み文字列を参照するようにしても
よい。
【0015】「手動変換手段」:実施形態では、操作者
のキー操作の種類に応じてCPU23が行うステップS
T17、ステップST21、ステップST25、ステッ
プST27、ステップST29、ステップST31、ス
テップST33の処理に該当する。
【0016】「表記文字列の注目部分」:実施形態では
注目文節に該当するが、文節以外に単語であってもよ
い。
【0017】「変換命令割当キー」:実施形態では、カ
タカナキー、ひらがなキー等の表記文字列を他の表記に
変換するキーをいう。なお、本実施形態においては、キ
ーボード上に配置されている場合について説明したが、
ポインティングデバイスであるマウス31で画面上のア
イコンをクリックするようにしてもよい。
【0018】「出力手段」:CPU23の図7ステップ
ST7,ステップST11の処理が該当する。
【0019】
【発明の実施の形態】1.機能ブロック図の説明 本発明の一実施形態を図面に基づいて説明する。図1
に、表記文字列変換装置10の機能ブロック図を示す。
表記文字列変換装置10は、操作者が入力した音声デー
タから特徴量を抽出して表記文字列に変換して出力する
音声データ変換手段から与えられた表記文字列を操作者
の変換命令に基づいて変換する表記文字列変換装置であ
って、未確定文字列記憶手段12、手動変換手段13、
言語規則記憶手段17、自動変換手段15および出力手
段14を備えている。
【0020】まず、表記文字列変換装置10に表記文字
列を与える音声データ変換手段5について説明する。音
声入力手段3に操作者がデータを入力すると、音声変換
手段6はこの音声データから所定の特徴量を抽出する。
音声変換辞書7にはあらかじめ複数の変換候補が記憶さ
れている。各変換候補は、特徴量、その表記文字列およ
びその読み文字列で構成されている。音声変換手段6
は、抽出した特徴量と、前記各変換候補との特徴量との
一致度を判断し、最も一致した候補の表記文字列および
読み文字列を出力する。
【0021】音声データ変換手段5から出力された表記
文字列は、未確定文字列記憶手段12に未確定状態で記
憶され、読み文字列は読み文字列記憶手段11に記憶さ
れる。 言語規則記憶手段17は、言語規則を記憶す
る。本実施形態においては、言語規則として、かな漢字
変換の変換辞書を採用した。より具体的にいうと、共起
関係にある表記文字列およびその読み文字列から構成さ
れた共起情報を採用した。
【0022】自動変換手段15は、未確定文字列記憶手
段12に記憶された複数の表記文字列のうち特定の表記
文字列の関係を、言語規則記憶手段17の言語規則に基
づき判断して、表記文字列間の関係が前記言語規則に合
致していないと判断した場合には、前記未確定状態の表
記文字列が前記言語規則に合致するように変更する。
【0023】本実施形態においては、自動変換手段15
は、読み文字列記憶手段11に記憶された読み文字列を
考慮して、前記判断及び変更を行う。
【0024】出力手段18は、未確定文字列記憶手段1
2に記憶された表記文字列が未確定状態で表示手段19
に表示されるように、表示制御命令を出力する。
【0025】手動変換手段13は、未確定文字列記憶手
段12に記憶された表記文字列の注目部分について、変
換命令が与えられると、この命令に基づいた変換を行
う。具体的には、変換命令を機能別に割り当てた変換命
令割当キーを操作者が選択すると、選択された変換命令
割当キーに割り当てられた変換命令に基づいて、未確定
文字列記憶手段12に記憶された前記注目部分の未確定
文字列を変換する。この変換命令は、たとえば、前記注
目部分の未確定文字列の表記を変更する命令がある。ま
た、手動変換手段13は、注目部分を特定する特定命令
が与えられると、これを特定して、前記変換を行う。
【0026】2.ハードウェア構成 (2.1)概略 図2に、音声変換装置および表示文字列変換装置を組み
込んだかな漢字変換装置40を示す。かな漢字変換装置
40は、入力装置41、制御装置43、表示装置45お
よび記憶装置47を備えている。入力装置41は、文字
列、変換命令または選択命令等を、音声入力またはキー
入力可能である。記憶装置47には、音声変換用の辞
書、およびかな漢字変換用の辞書が格納されている。
【0027】操作者は、入力装置41から音声データ入
力する。制御装置43は、前記入力された音声データを
表記文字列に前記音声変換用辞書を用いて変換して表示
するとともに、表示された表記文字列を、操作者の変換
命令に基づいて変換する。表示装置45には、変換され
た表記文字列が表示される。
【0028】(2.2)詳細 図3に、図2に示すかな漢字変換装置40を、CPUを
用いて実現したハードウェア構成の一例を示す。
【0029】かな漢字変換装置40は、CPU23、メ
モリ27、ハードディスク26、CRT30、FDD2
5、キーボード28、マウス31、インターフェイス3
3、マイク34およびバスライン29を備えている。
【0030】マイク34には音声データが入力される。
入力された音声データはインターフェイス33でデジタ
ル変換され、メモリ27の作業バッファ(図示せず)に
一時記憶される。
【0031】ハードディスク26には、音声変換プログ
ラム26a,音声変換辞書26b、かな漢字変換プログ
ラム26c,かな漢字変換辞書26dおよびアプリケー
ションプログラム26pが記憶されている。音声変換辞
書26bのデータ構造を図4に示す。このように、音声
データ毎に表記文字列及びその読み文字列が記憶されて
いる。なお、音声変換辞書26bには単語がどのように
連接するかを示す単語間連接データも記憶されている
(図示せず)。かな漢字変換辞書26dに記憶されてい
る共起辞書の一例を図5に示す。共起関係にある表記文
字列が対応づけられて記憶されている。音声変換プログ
ラム26aおよびかな漢字変換プログラム26cについ
て、後述する。アプリケーションプログラム26pは、
かな漢字変換プログラム26cから表記文字列を受け取
って、CRT30へ出力する。
【0032】図3に示すCPU23は、ハードディスク
26に記憶された前記2つのプログラムにしたがいバス
ライン29を介して、各部を制御する。これらプログラ
ムは、FDD25を介して、プログラムが記憶されたフ
レキシブルディスク25aから読み出されてハードディ
スク26にインストールされたものである。なお、フレ
キシブルディスク以外に、CD−ROM、ICカード等
のプログラムを実体的に一体化したコンピュータ可読の
記憶媒体から、ハードディスクにインストールさせるよ
うにしてもよい。さらに、通信回線を用いてダウンロー
ドするようにしてもよい。
【0033】本実施形態においては、プログラムをフレ
キシブルディスクからハードディスク26にインストー
ルさせることにより、フレキシブルディスクに記憶させ
たプログラムを間接的にコンピュータに実行させるよう
にしている。しかし、これに限定されることなく、フレ
キシブルディスクに記憶させたプログラムをFDD25
から直接的に実行するようにしてもよい。なお、コンピ
ュータによって、実行可能なプログラムとしては、その
ままのインストールするだけで直接実行可能なものはも
ちろん、一旦他の形態等に変換が必要なもの(例えば、
データ圧縮されているものを、解凍する等)、さらに
は、他のモジュール部分と組合して実行可能なものも含
む。
【0034】メモリ27には、音声データバッファ27
a、特徴量バッファ27f、変換後バッファ27e、読
みバッファ27b,半確定バッファ27c、確定バッフ
ァ27dを有する。
【0035】音声データバッファ27a、特徴量バッフ
ァ27fおよび変換後バッファ27eは、音声変換プロ
グラム用のバッファである。音声データバッファ27a
には入力された音声データをデジタル変換されたデジタ
ル音声データが記憶される。特徴量バッファ27fに
は、音声変換プログラム26aによって抽出された音声
特徴量が記憶される。変換後バッファ27eには、音声
変換プログラム26aによって特定された表記文字列お
よびその読み文字列が記憶される。
【0036】読みバッファ27b,半確定バッファ27
c、確定バッファ27dは、かな漢字変換プログラム用
のバッファである。読みバッファ27bには、変換後バ
ッファ27eに記憶された読み文字列が順次記憶され
る。半確定バッファ27cには、変換後バッファ27e
に記憶された表記文字列が順次記憶される。確定バッフ
ァ27dには、キーボード28から与えられる確定命令
によって確定された表記文字列が記憶される。なお、メ
モリ27にはその他、各種の演算結果等が記憶される。
【0037】CRT30には、未確定状態の表記文字列
または確定状態の表記文字列が表示される。キーボード
28は各種の変換命令割当キーが配置されている。
【0038】3.フローチャート つぎに、ハードディスク26に記憶されているプログラ
ムについて、図6〜図8を用いて説明する。この実施形
態においては、アプリケーションプログラム26pは、
文字列入力可能状態で音声変換プログラム26aおよび
かな漢字変換プログラム26bを呼び出し、かな漢字文
字列が入力される。音声変換プログラム26aは表記文
字列を特定し(図6ステップST0〜ステップST
3)、この表記文字列をかな漢字変換プログラム26b
は未確定状態でアプリケーションプログラム26pに渡
す。アプリケーションプログラム26pは表記文字列を
未確定状態で表示する。
【0039】かな漢字変換プログラム26bは、操作者
の変換命令に基づいて表記文字列を変換する(図7ステ
ップST4〜図8ステップST33)。変換された表記
文字列は、アプリケーションプログラム26pに渡され
る。本実施形態においては、かな漢字変換プログラム2
6bとして、IME(input method editor)の1つで
ある株式会社ジャストシステム製の「ATOK11」
(商標)を用い、アプリケーションプログラム26pと
して、同社製の「一太郎8」(商標)を採用した。
【0040】まず、アプリケーションプログラム26p
について説明する。アプリケーションプログラム26p
は、日本語文書作成プログラムであり、起動することに
より、文字列入力可能画面がCRT30に表示される
(図示せず)。
【0041】この状態で、音声変換プログラム26aが
呼び出される。音声変換プログラム26aによって以下
の処理が実行される。操作者は、図3に示すマイク34
から音声データを入力する。CPU23は、マイク34
より音声入力があるか否かを判断しており(図6ステッ
プST0)、音声入力があれば音声データバッファ27
aにインターフェイス33にてデジタル変換されたデジ
タル音声データを記憶する(ステップST1)。たとえ
ば、「さんせいとあるかりせいのすいようえき」と発声
されると、デジタル変換されたデータが音声データバッ
ファ27aに記憶される。
【0042】CPU23は、音声データバッファ27a
に記憶されたデジタル音声データから特徴量を抽出する
(ステップST2)。つぎに、図3に示す音声変換辞書
26bに登録された音声データ、単語間連接データと照
合し、最も一致度の高い文字列を得て、変換後バッファ
27eに記憶する(ステップST3)。例えば、この場
合、「さんせい/と/あるかりせい/の/すいようえき
/」と単語単位に区切られ、各単語毎に変換候補が特定
され、変換後バッファ27eには、表記文字列「賛成/
と/アルカリ性/の/水溶液」および読み文字列「さん
せい/と/あるかりせい/の/すいようえき」が記憶さ
れる。
【0043】なお、図6ステップST0にて、音声入力
がなければ音声変換プログラムは終了する。
【0044】つぎに、かな漢字変換プログラム26bが
呼び出される。かな漢字変換プログラム26bによって
以下の処理が実行される。CPU23は、変換後バッフ
ァ27eに新たに文字列が記憶されたか否かを判断して
おり(図7ステップST4)、新たに文字列が記憶され
た場合には、かな漢字変換プログラムの変換単位(文
節)に区切りを修正し、その表記文字列を未確定バッフ
ァ27cに、その読み文字列を読みバッファ27bに記
憶する(図7ステップST5)。上記の場合であれば、
たとえば、表記文字列「賛成と/アルカリ性の/水溶
液」が半確定バッファ27cに、読み「さんせいと/あ
るかりせいの/すいようえき」が読みバッファ27bに
記憶される。
【0045】つぎに、CPU23は、半確定バッファ2
7cに記憶された表記文字列「賛成とアルカリ性の水溶
液」を、アプリケーションプログラム26pに半確定状
態であるとの条件をつけて渡す(図7ステップST
7)。アプリケーションプログラム26pは、置換され
た表記文字列を半確定状態でCRT30に表示する。
【0046】つぎに、CPU23は、半確定バッファ2
7cに記憶された文字列が、かな漢字変換規則に合致し
ているか否かを判断する(図7ステップST9)。この
例では、図5に示す共起辞書に基づいて、前記判断が行
われる。この場合、表記文字列「アルカリ性」と共起関
係にあるのは表記文字列「賛成」ではなく表記文字列
「酸性」であることがわかる。
【0047】したがって、CPU23は、半確定バッフ
ァ27cに記憶された文字列がかな漢字変換規則に合致
していないと判断し、半確定バッファ27cに記憶され
た表記文字列をかな漢字変換規則に基づき、変換する
(図7ステップST11)。具体的には、「賛成」が
「酸性」に置換され、半確定バッファ27cに「賛成と
アルカリ性の水溶液」と記憶される。
【0048】つぎに、CPU23は、半確定バッファ2
7cに記憶された表記文字列「酸性とアルカリ性の水溶
液」を、アプリケーションプログラム26pに半確定状
態で渡す(図7ステップST13)。アプリケーション
プログラム26pは、置換された表記文字列を半確定状
態でCRT30に表示する。
【0049】なお、ステップST9にて合致していると
判断した場合には、ステップST11、13の処理は行
わない。
【0050】つぎに、CPU23は、キー操作があるか
否かが判断される(ステップST14)。キー操作がな
ければ、かな漢字変換プログラムを終了し、図6に示す
音声変換プログラムを実行する。
【0051】一方、ステップST14にて、キー操作が
あれば、ステップST15に進み、キーの種類を判断す
る。
【0052】キーの種類が確定キーであれば、図8ステ
ップST17に進み、確定バッファ27dに半確定バッ
ファ27cのデータを記憶する。そして、確定状態の条
件付きでアプリケーションプログラム26pに渡す。ア
プリケーションプログラム26pは、確定バッファ27
dに記憶された表記文字列「酸性とアルカリ性の水溶
液」を、CRT30に確定状態で表示させる。
【0053】また、ステップST14にて、キーの種類
が取消キーであれば、半確定バッファ27c、読みバッ
ファ27bのデータをクリアする(図8ステップST2
5)。そして、処理を終了する。
【0054】なお、図7ステップST4にて、変換後バ
ッファ27eに文字列が追加記憶されなかった場合に
は、ステップST14に進み、キー操作がされたか否か
を判断する。
【0055】かな漢字変換プログラムによる処理と音声
変換プログラムとによる処理は順次繰り返される。
【0056】なお、操作者は入力した音声から所望の表
記文字列に変換されていない場合には、ステップST1
4にて、希望の変換を行うキーを操作すればよい。たと
えば、漢字で「太鼓はその箱の中に・・」と表記されて
いる場合に、「太鼓」の部分をかたかな表記したけれ
ば、つぎのように操作すればよい。半確定状態のまま、
注目文節変更キーを操作して、カーソルを「太鼓」の部
分へ移動させる。これにより、CPU23は、図8ステ
ップST31に進み、注目文節を変更する。そして、カ
タカナキーを操作すれば、ステップST14からステッ
プST27に進み、半確定バッファ27cの注目文節の
表記文字列が読みバッファ27bの読み文字列を参照し
てカタカナに変換される。
【0057】このように、注目部分である注目文節が判
別可能に表示されるように、表示制御命令を出力し、与
えられた表記変更命令に基づいて表記文字列を変更して
いる。これにより、表記文字列の変更が容易に行える。
【0058】他の変換についても同様である。たとえ
ば、ひらがな変換したければ、ひらがな変換キーを操作
すればよい。CPU23は、キーの種類がひらがなキー
であると判断し、半確定バッファ27cの注目文節をひ
らがな変換する(図8ステップST29)。
【0059】キーの種類が半角変換キーであれば、半確
定バッファ27cの注目文節を半角変換する(図8ステ
ップST35)。そして、ステップST14に戻り、キ
ー操作がされたかを判断する。
【0060】なお、キーの種類が区切り位置変更キーで
あれば、読みバッファ27bの区切り位置変更を行い
(図8ステップST21)、区切り位置変更された読み
文字列をアプリケーションプログラム26pに渡す(ス
テップST23)。そして、ステップST14に戻り、
キー操作があったかを判断する。
【0061】このように本実施形態においては、音声変
換プログラムによって変換された表記文字列を未確定状
態でIMEであるかな漢字変換プログラムで受け取っ
て、CRT30に未確定状態で表示させ、操作者のキー
操作に基づいて、表記文字列を変換している。したがっ
て、より効率的な文字列入力が可能となる。また、操作
者の慣れ親しんだかな漢字変換プログラムと同じ操作性
で変換ができるので、操作を別途覚える必要がなくな
る。
【0062】また、本実施形態においては、音声変換プ
ログラムによって変換された表記文字列をかな漢字変換
プログラムで検査し、適切な表記文字列でない場合に
は、かな漢字変換プログラムの変換規則に基づいて再変
換するようにしている。これにより、学習させていない
音声変換プログラムであっても、すでにその操作者が蓄
積しているかな漢字変換規則を活用して適切なかな漢字
変換を行うことができる。
【0063】上記実施形態においては、ひらがな変換、
カタカナ変換、文節区切り位置変更、半角変換、確定、
取り消し等の命令の場合について説明したが、他の機
能、たとえば、カーソルの操作、カーソル前の1音削
除、カーソルを左へ移動、カーソルを右へ移動等につい
ても同様に適用することができる。
【0064】4.その他の実施形態 なお、本実施形態においては、かな漢字変換規則とし
て、共起情報を用いた場合について説明したが、これ以
外の規則、例えば学習情報等を採用してもよい。また、
日本語へのかな漢字変換だけでなく、言語規則であれば
どのようなものであってもよい。例えば、他の言語であ
る英語、中国語等の音声入力についても同様に適用する
ことかできる。
【0065】また、同音異議語がある場合、本実施形態
のように共起情報を用いることにより、操作者の操作な
しで音声入力されたデータから適切な表記文字列を得る
ことができる。これに対して、音声変換プログラムの音
声変換辞書に登録されていない読みの音声データ(専門
用語等)については、正しく変換することができない。
なぜなら、音声変換プログラムは、その読みによく似た
読みを有する表記文字列に変換してしまうからである。
例えば、特許という用語がない場合、よく似た東京など
に変換され、その読みも「とうきょう」と変換されるわ
けである。一般に、かな漢字変換プログラムは、音声変
換プログラムから与えられた表記文字列または読みを参
照して、変換候補を検索する。したがって、このような
場合でも、正確に変換できるように、かな漢字変換プロ
グラムにかな漢字変換規則として、類似の読みを有する
表記文字列を記憶するようにしてもよい。このように、
類似語読みデータを記憶しておき、正しい読みまで予想
することにより、少しずれた読みが、音声変換プログラ
ムから与えられても、適切な表記文字列を得ることがで
きる。
【0066】また、和製英語となっているような単語、
例えば、「システム」等については、表記文字列とし
て、そのスペル「system」を記憶しておき、これ
に変換するようにしてもよい。
【0067】なお、本実施形態においては、音声変換プ
ログラムとして、日本アイ・ビー・エム株式会社製のV
iaVoice(商標)を採用したが、これに限定され
ず、他の音声認識プログラムについても同様に適用でき
る。このように、市販の音声変換プログラムを音声入力
エンジンとして用いた場合に、変換対象の分野等によ
り、その変換率がそれほどよくない場合でも、いままで
操作者が蓄えたかな漢字変換の変換規則を用いて所望の
表記文字列を得ることができる。
【0068】また、音声変換プログラムについてはソフ
トウェアで実現した場合について説明したが、ハードウ
ェアで実現させてもよい。すなわち、音声データ変換手
段とは、音声データ変換装置を含む概念である。
【0069】また、本実施形態においては、アプリケー
ションプログラム26pに半確定状態であるとの条件を
つけて渡して、アプリケーションプログラム26pに半
確定状態でCRT30に表示させるようにした。すなわ
ち、かな漢字変換プログラムは、未確定バッファに記憶
された表記文字列が未確定状態で表示されるように、表
示制御命令を出力している。しかし、未確定状態での表
示については、このようにアプリケーションプログラム
26pが実行するだけでなく、アプリケーションプログ
ラム26pから表示しなかったという返答指令を、かな
漢字変換プログラムが受けて、これを表示するようにし
てもよい。また、かかる表示については、オペレーティ
ングシステム(OS)と分担して、実現するようにして
もよい。
【0070】なお、本実施形態においては、図1に示す
機能を実現する為に、CPU23を用い、ソフトウェア
によってこれを実現している。しかし、その一部もしく
は全てを、ロジック回路等のハードウェアによって実現
してもよい。
【図面の簡単な説明】
【図1】本発明にかかる表記文字列変換装置10の機能
ブロック図である。
【図2】図1に示す表記文字列変換装置10のハードウ
エア構成の一例を示す図である。
【図3】図2に示す表記文字列変換装置10を、CPU
23を用いて実現したハードウエア構成の一例を示す図
である。
【図4】音声変換辞書のデータ構造を示す。
【図5】かな漢字変換辞書のデータ構造を示す。
【図6】音声変換処理のフローチャートである。
【図7】かな漢字変換処理のフローチャートである。
【図8】かな漢字変換処理のフローチャートである。
【図9】従来の音声変換システムの機能ブロック図であ
る。
【符号の説明】
3・・・・・音声入力手段 5・・・・・音声データ変換手段 6・・・・・音声変換手段 7・・・・・変換変換辞書 10・・・・表記文字列変換装置 11・・・・読み文字列記憶手段 12・・・・未確定文字列記憶手段 13・・・・手動変換手段 14・・・・出力手段 15・・・・自動変換手段 17・・・・言語規則記憶手段 23・・・CPU 27・・・メモリ
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成11年9月13日(1999.9.1
3)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】特許請求の範囲
【補正方法】変更
【補正内容】
【特許請求の範囲】
【請求項】操作者が入力した音声データから特徴量を
抽出して表記文字列およびその読み文字列に変換して出
力する音声データ変換手段から与えられた表記文字列を
操作者の変換命令に基づいて変換する表記文字列変換装
置であって、 前記音声データ変換手段から与えられた表記文字列を未
確定状態で記憶する未確定文字列記憶手段、前記音声データ変換手段から与えられた読み文字列を記
憶する読み文字列記憶手段、 前記未確定文字列記憶手段に記憶された表記文字列につ
いて注目部分が判別可能に表示手段に表示されるよう
に、表示制御命令を出力する出力手段、前記注目部分の未確定文字列を変換する表記変更命令が
与えられると、前記読み文字列記憶手段に記憶された読
み文字列を参照して前記変換命令に基づいた表 記文字列
に変更する 手動変更手段、 を備えた表記文字列変換装置。
【請求項】操作者が入力した音声データから特徴量を
抽出して表記文字列およびその読み文字列に変換する音
声データ変換手段、 前記音声データ変換手段で変換された表記文字列を未確
定状態で記憶する未確定文字列記憶手段、前記音声データ変換手段から与えられた読み文字列を記
憶する読み文字列記憶手段、 前記未確定文字列記憶手段に記憶された表記文字列を表
示する表示手段、 変換命令が機能別に割り当てられた変換命令割当キー、 操作者によって前記変換命令割当キーのいずれかが選択
されると、この変換命令割り当てキーに割り当てられた
変換命令に基づいて前記読み文字列記憶手段に 記憶され
た読み文字列を変換し、これにより前記未確定文字列記
憶手段の表記文字列を変更する手動変換手段、 を備えた表記文字列変換装置。
【請求項】操作者が入力した音声データから特徴量を
抽出して表記文字列およびその読み文字列に変換して出
力する音声データ変換手段から表記文字列を受け取っ
て、操作者の変換命令に基づいて前記表記文字列を変換
する表記文字列変換方法であって、 前記音声データ変換手段から表記文字列およびその読み
文字列が与えられると、この表記文字列を未確定状態で
表示手段に表示させ、前記注目部分の未確定文字列を変換する表記変更命令が
与えられると、前記注目部分の表記文字列に対応する読
み文字列を前記表記変更命令に基づいて変換し 、前記注
目部分に表示すること 、 を特徴とする表記文字列変換方法。
【請求項】入力装置、制御装置、出力装置および記憶
装置を備えたコンピュータを、請求項1〜請求項7のい
ずれかの表記文字列変換装置として機能させるための
ログラムを記憶した記憶媒体。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0005
【補正方法】変更
【補正内容】
【0005】
【課題を解決するための手段および発明の効果】1)本
発明にかかる表記文字列変換装置においては、1)前記音
声データ変換手段から与えられた表記文字列を未確定状
態で記憶する未確定文字列記憶手段、2)前記音声データ
変換手段から与えられた読み文字列を記憶する読み文字
列記憶手段、3)前記未確定文字列記憶手段に記憶された
表記文字列が未確定状態で表示されるように、表示制御
命令を出力する出力手段、4)前記未確定文字列記憶手段
に記憶された表記文字列の注目部分について、表記変換
命令が与えられると、前記読み文字列記憶手段に記憶さ
れた読み文字列を参照して前記変換命令に基づいた表記
文字列に変更する手動変換手段を備えている。したがっ
て、前記音声データ変換手段から表記文字列およびその
読み文字列が与えられると、この表記文字列を未確定状
態で表示手段に表示される。前記注目部分の未確定文字
列を変換する表記変更命令が与えられると、前記注目部
分の表記文字列に対応する読み文字列を前記表記変更命
令に基づいて変換がなされ、前記注目部分に表示され
る。このように、前記表記文字列は変換命令で変換可能
であるので、前記音声データ変換手段の変換が操作者の
望む変換でない場合に、前記読み文字列に基づいて容易
にこれを変換することができる。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0006
【補正方法】変更
【補正内容】
【0006】2)本発明にかかる表記文字列変換装置に
おいては、前記手動変換手段は、変換命令割当キーに機
能別に変換命令を割り当てておき、この変換命令割当キ
ーを操作者が選択すると、選択された変換命令割当キー
に割り当てられた変換命令に基づいて、前記未確定文字
列記憶手段に記憶された前記注目部分の未確定文字列を
変更する。したがって、操作者は機能別に割り当てられ
た変更命令割当キーさえ覚えておけば、所望の変換を行
うことができる。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0007
【補正方法】変更
【補正内容】
【0007】3)本発明にかかる表記文字列変換装置に
おいては、前記表記変換命令は、前記注目部分の未確定
文字列の表記を変更する命令である。したがって、操作
者は機能別に割り当てられた変更命令割当キーさえ覚え
ておけば、所望の表記に変換することができる。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0008
【補正方法】変更
【補正内容】
【0008】4)本発明にかかる表記文字列変換装置に
おいては、前記手動変換手段は、注目部分を特定する特
定命令が与えられると、これを特定して、前記変換を行
う。したがって、未確定文字列が複数ある場合にも、所
望の未確定文字列を変換することかできる。
【手続補正6】
【補正対象書類名】明細書
【補正対象項目名】0009
【補正方法】変更
【補正内容】
【0009】5)本発明にかかる表記文字列変換装置に
おいては、自動変換手段は、前記未確定文字列記憶手段
に記憶された複数の表記文字列のうち特定の表記文字列
の関係を言語規則に基づき判断して、表記文字列間の関
係が前記言語規則に合致していないと判断した場合に
は、前記未確定状態の表記文字列が前記言語規則に合致
するように変更する。したがって、言語規則に合致して
いない表記文字列を自動的に変更することができる。す
なわち、操作者は自動変換後の表記文字列について、所
望の変換が行われているかを判断すればよいので、操作
の煩雑性を防止できる。
【手続補正7】
【補正対象書類名】明細書
【補正対象項目名】0010
【補正方法】変更
【補正内容】
【0010】6)本発明にかかる表記文字列変換装置に
おいては、1)前記音声データ変換手段から与えられた表
記文字列を未確定状態で記憶する未確定文字列記憶手
段、2)前記音声データ変換手段から与えられた読み文字
列を記憶する読み文字列記憶手段、3)前記未確定文字列
記憶手段に記憶された表記文字列について注目部分が判
別可能に表示手段に表示されるように、表示制御命令を
出力する出力手段、4)前記注目部分の未確定文字列を変
換する表記変更命令が与えられると、前記読み文字列記
憶手段に記憶された読み文字列を参照して前記変換命令
に基づいた表記文字列に変更する手動変更手段を備えて
いる。このように、前記表記文字列は変換命令で変更可
能であるので、前記音声データ変換手段の変換が操作者
の望む変換でない場合に、前記読み文字列に基づいて
れを変換することができる
【手続補正8】
【補正対象書類名】明細書
【補正対象項目名】0011
【補正方法】変更
【補正内容】
【0011】7)本発明にかかる表記文字列変換装置に
おいては、1)操作者が入力した音声データから特徴量を
抽出して表記文字列およびその読み文字列に変換する音
声データ変換手段、2)前記音声データ変換手段で変換さ
れた表記文字列を未確定状態で記憶する未確定文字列記
憶手段、3)前記音声データ変換手段から与えられた読み
文字列を記憶する読み文字列記憶手段、4)前記未確定文
字列記憶手段に記憶された表記文字列を表示する表示手
段、5)変換命令が機能別に割り当てられた変換命令割当
キー、6)操作者によって前記変換命令割当キーのいずれ
かが選択されると、この変換命令割り当てキーに割り当
てられた変換命令に基づいて前記読み文字列記憶手段に
記憶された読み文字列を変換し、これにより前記未確定
文字列記憶手段の表記文字列を変更する手動変換手段を
備えている。したがって、前記音声データ変換手段の変
換が操作者の望む変換でない場合に、前記読み文字列に
基づいて容易にこれを変換することができる
【手続補正9】
【補正対象書類名】明細書
【補正対象項目名】0012
【補正方法】変更
【補正内容】
【0012】8)本発明にかかる表記文字列変換方法に
おいては、前記音声データ変換手段から表記文字列およ
びその読み文字列が与えられると、この表記文字列を未
確定状態で表示手段に表示させ、前記注目部分の未確定
文字列を変換する表記変更命令が与えられると、前記注
目部分の表記文字列に対応する読み文字列を前記表記変
更命令に基づいて変換し、前記注目部分に表示する。
のように、前記表記文字列は変換命令で変換可能である
ので、前記音声データ変換手段の変換が操作者の望む変
換でない場合に、容易にこれを変換することができる
フロントページの続き (72)発明者 弓削 和徳 徳島県徳島市川内町平石若松108番4号 株式会社ジャストシステム内 Fターム(参考) 5B009 KB00 5D015 KK02 LL05 LL07

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】操作者が入力した音声データから特徴量を
    抽出して表記文字列に変換して出力する音声データ変換
    手段から与えられた表記文字列を操作者の変換命令に基
    づいて変換する表記文字列変換装置であって、 前記音声データ変換手段から与えられた表記文字列を未
    確定状態で記憶する未確定文字列記憶手段、 前記未確定文字列記憶手段に記憶された表記文字列が未
    確定状態で表示されるように、表示制御命令を出力する
    出力手段、 前記未確定文字列記憶手段に記憶された表記文字列の注
    目部分について、変換命令が与えられると、この命令に
    基づいた変換を行う手動変換手段、を備えた表記文字列
    変換装置。
  2. 【請求項2】請求項1の表記文字列変換装置において、 前記手動変換手段は、変換命令割当キーを操作者が選択
    すると、選択された変換命令割当キーに割り当てられた
    変換命令に基づいて、前記未確定文字列記憶手段に記憶
    された前記注目部分の未確定文字列を変換することを特
    徴とするもの。
  3. 【請求項3】請求項1の表記文字列変換装置において、 前記変換命令は、前記注目部分の未確定文字列の表記を
    変更する命令であることを特徴とするもの。
  4. 【請求項4】請求項1の表記文字列変換装置において、 前記手動変換手段は、注目部分を特定する特定命令が与
    えられると、これを特定して、前記変換を行うことを特
    徴とするもの。
  5. 【請求項5】請求項1の表記文字列変換装置において、 言語規則を記憶する言語規則記憶手段、 前記未確定文字列記憶手段に記憶された複数の表記文字
    列のうち特定の表記文字列の関係を前記言語規則に基づ
    き判断して、表記文字列間の関係が前記言語規則に合致
    していないと判断した場合には、前記未確定状態の表記
    文字列が前記言語規則に合致するように変更する自動変
    換手段、 を備えたことを特徴とするもの。
  6. 【請求項6】請求項1の表記文字列変換装置において、 前記音声データ変換手段は、出力する表記文字列に対応
    する読み文字列を併せて出力し、 前記音声データ変換手段から与えられた読み文字列を記
    憶する読み文字列記憶手段を備え、 前記表記変更手段は、前記読み文字列記憶手段に記憶さ
    れた読み文字列に基づいて、前記変換を行うことを特徴
    とするもの。
  7. 【請求項7】操作者が入力した音声データから特徴量を
    抽出して表記文字列に変換して出力する音声データ変換
    手段から与えられた表記文字列を操作者の変換命令に基
    づいて変換する表記文字列変換装置であって、 前記音声データ変換手段から与えられた表記文字列を未
    確定状態で記憶する未確定文字列記憶手段、 前記未確定文字列記憶手段に記憶された表記文字列につ
    いて注目部分が判別可能に表示手段に表示されるよう
    に、表示制御命令を出力する出力手段、 与えられた表記変更命令に基づいて、前記未確定文字列
    記憶手段に記憶された前記注目部分の未確定文字列を変
    更する手動変更手段、 を備えた表記文字列変換装置。
  8. 【請求項8】操作者が入力した音声データから特徴量を
    抽出して表記文字列に変換する音声データ変換手段、 前記音声データ変換手段で変換された表記文字列を未確
    定状態で記憶する未確定文字列記憶手段、 前記未確定文字列記憶手段に記憶された表記文字列を表
    示する表示手段、 変換命令が機能別に割り当てられた変換命令割当キー、 操作者によって前記変換命令割当キーのいずれかが選択
    されると、選択されたキーに割り当てられている変換命
    令に基づいた変換を行う手動変換手段、 を備えた表記文字列変換装置。
  9. 【請求項9】操作者が入力した音声データから特徴量を
    抽出して表記文字列に変換して出力する音声データ変換
    手段から表記文字列を受け取って、操作者の変換命令に
    基づいて前記表記文字列を変換する表記文字列変換方法
    であって、 前記音声データ変換手段から表記文字列が与えられる
    と、これを未確定状態で表示手段に表示させ、 前記表示させた表記文字列の注目部分について、変換命
    令が与えられると、この命令に基づいた変換を行うこ
    と、 を備えた表記文字列変換方法。
  10. 【請求項10】入力装置、制御装置、出力装置および記
    憶装置を備えたコンピュータを、操作者が入力した音声
    データから特徴量を抽出して表記文字列に変換して出力
    する音声データ変換手段から与えられた表記文字列を操
    作者の変換命令に基づいて変換する表記文字列変換装置
    として機能させるプログラムを記憶した記憶媒体におい
    て、 前記プログラムは、前記コンピュータを、以下の手段を
    備えた装置として機能させること、 前記音声データ変換手段から与えられた表記文字列を未
    確定状態で記憶する未確定文字列記憶手段、 前記未確定文字列記憶手段に記憶された表記文字列が未
    確定状態で表示手段に表示されるように、表示制御命令
    を出力する出力手段、 前記未確定文字列記憶手段に記憶された表記文字列の注
    目部分について、変換命令が与えられると、この命令に
    基づいた変換を行う手動変換手段、 を特徴とするプログラムを記憶した記憶媒体。
JP10175644A 1998-06-23 1998-06-23 表記文字列変換装置および表記文字列変換方法 Expired - Fee Related JP3071760B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10175644A JP3071760B2 (ja) 1998-06-23 1998-06-23 表記文字列変換装置および表記文字列変換方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10175644A JP3071760B2 (ja) 1998-06-23 1998-06-23 表記文字列変換装置および表記文字列変換方法

Publications (2)

Publication Number Publication Date
JP2000010971A true JP2000010971A (ja) 2000-01-14
JP3071760B2 JP3071760B2 (ja) 2000-07-31

Family

ID=15999703

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10175644A Expired - Fee Related JP3071760B2 (ja) 1998-06-23 1998-06-23 表記文字列変換装置および表記文字列変換方法

Country Status (1)

Country Link
JP (1) JP3071760B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MXPA03005006A (es) 2001-01-29 2003-09-25 Fumakilla Ltd Aparato difusor de compuestos quimicos del tipo de ventilador.

Also Published As

Publication number Publication date
JP3071760B2 (ja) 2000-07-31

Similar Documents

Publication Publication Date Title
US5835924A (en) Language processing apparatus and method
JP4829901B2 (ja) マニュアルでエントリされた不確定なテキスト入力を音声入力を使用して確定する方法および装置
US5214583A (en) Machine language translation system which produces consistent translated words
US7165019B1 (en) Language input architecture for converting one text form to another text form with modeless entry
US7802184B1 (en) Method and apparatus for processing text and character data
JP2002117026A (ja) 確率的入力方法によって生成された候補リストからフィルタリングおよび選択を行うための方法およびシステム
US8756058B2 (en) Speech recognition system, speech recognition result output method, and speech recognition result output program
JPH03224055A (ja) 同時通訳向き音声認識システムおよびその音声認識方法
JP2003513389A (ja) 言語入力ユーザインタフェース
WO2001035250A2 (en) Language input architecture for converting one text form to another text form with tolerance to spelling, typographical, and conversion errors
JP3476007B2 (ja) 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体
US7418387B2 (en) Generic spelling mnemonics
JP3795692B2 (ja) 文字処理装置および方法
WO2003032191A1 (fr) Systeme de traduction
JP3071760B2 (ja) 表記文字列変換装置および表記文字列変換方法
JP3102636B2 (ja) 表記文字列変換装置および表記文字列変換方法
JP3762300B2 (ja) テキスト入力処理装置及び方法並びにプログラム
EP0720105A2 (en) System and method to review the processing of data according to user entered corrections
JPH08212216A (ja) 自然言語処理装置および自然言語処理方法
JP3069532B2 (ja) かな漢字変換方法およびその装置並びにかな漢字変換方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3814000B2 (ja) 文字列変換装置および文字列変換方法
JP2006309469A (ja) 検索装置、検索方法、プログラム、及びコンピュータ読み取り可能な記録媒体
JPH10143503A (ja) 音声ワードプロセッサ
JPH10198678A (ja) かな漢字変換装置およびかな漢字変換方法
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120526

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees