JP3071760B2 - Notation string conversion device and notation string conversion method - Google Patents
Notation string conversion device and notation string conversion methodInfo
- Publication number
- JP3071760B2 JP3071760B2 JP10175644A JP17564498A JP3071760B2 JP 3071760 B2 JP3071760 B2 JP 3071760B2 JP 10175644 A JP10175644 A JP 10175644A JP 17564498 A JP17564498 A JP 17564498A JP 3071760 B2 JP3071760 B2 JP 3071760B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- conversion
- notation
- reading
- stored
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Document Processing Apparatus (AREA)
Description
【0001】[0001]
【発明の属する技術分野】この発明は、音声認識技術に
関し、特に表記文字列の変換精度向上に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech recognition technology, and more particularly, to an improvement in the accuracy of conversion of a written character string.
【0002】[0002]
【従来技術およびその課題】今日、コンピュータに文字
列を入力するのに、図9に示すような音声入力型の日本
語入力システムが知られている。音声変換辞書には音声
データの特徴量と、この特徴量に対応する表記文字列が
テーブルとしてあらかじめ登録されている。マイク61
から音声が入力されると、音声変換部63は、入力され
た音声から所定の特徴量を抽出し、音声変換辞書65に
登録されている各表記文字列の特徴量とのマッチングを
演算し、一致度のもっとも高いものを表記文字列として
出力する。音声入力で日本語入力ができるので、キーボ
ード入力になれていない操作者であっても、日本語入力
をすることができる。2. Description of the Related Art Today, there is known a voice input type Japanese input system as shown in FIG. 9 for inputting a character string into a computer. In the speech conversion dictionary, a feature amount of speech data and a notation character string corresponding to the feature amount are registered in advance as a table. Microphone 61
When the voice is input from the voice conversion unit 63, the voice conversion unit 63 extracts a predetermined feature amount from the input voice, calculates a matching with the feature amount of each written character string registered in the voice conversion dictionary 65, The one with the highest degree of matching is output as the notation character string. Since Japanese input can be performed by voice input, even an operator who is not used to keyboard input can input Japanese.
【0003】しかし、上記音声入力システムにおいて
は、以下のような問題があった。一旦変換後にその変換
された表記文字列を変更するには、再度音声入力をする
必要があった。また、操作者は、場合によって、表記方
法を変更したい場合がある。たとえば、漢字をひらがな
表記したり、また、大文字を小文字表記する等である。
このような場合に、自由に表記方法を選択可能とするた
めに、候補リストに挙げておき、選択可能とすることも
考えられるが、その都度、画面上に候補リスト選択のダ
イアログが表示されると煩雑である。However, the above-mentioned voice input system has the following problems. To change the converted notation character string after the conversion once, it was necessary to perform voice input again. In some cases, the operator may want to change the notation method. For example, kanji is written in hiragana, and uppercase letters are written in lowercase letters.
In such a case, in order to be able to freely select the notation method, it is conceivable that the notation method is listed in the candidate list and can be selected, but each time, a dialog for selecting the candidate list is displayed on the screen. It is complicated.
【0004】この発明は上記問題を解決し、日本語入力
の表記を簡易に変換することができる表記文字列変換装
置またはその方法を提供する。[0004] The present invention solves the above problem and provides a notation character string conversion device or method capable of easily converting notation of Japanese input.
【0005】[0005]
【課題を解決するための手段および発明の効果】1)本
発明にかかる表記文字列変換装置においては、1)前記音
声データ変換手段から与えられた表記文字列を未確定状
態で記憶する未確定文字列記憶手段、2)前記音声データ
変換手段から与えられた読み文字列を記憶する読み文字
列記憶手段、3)前記未確定文字列記憶手段に記憶された
表記文字列が未確定状態で表示されるように、表示制御
命令を出力する出力手段、4)前記未確定文字列記憶手段
に記憶された表記文字列の注目部分について、表記変換
命令が与えられると、前記読み文字列記憶手段に記憶さ
れた読み文字列を参照して前記変換命令に基づいた表記
文字列に変更する手動変換手段を備えている。したがっ
て、前記音声データ変換手段から表記文字列およびその
読み文字列が与えられると、この表記文字列を未確定状
態で表示手段に表示される。前記注目部分の未確定文字
列を変換する表記変更命令が与えられると、前記注目部
分の表記文字列に対応する読み文字列を前記表記変更命
令に基づいて変換がなされ、前記注目部分に表示され
る。このように、前記表記文字列は変換命令で変換可能
であるので、前記音声データ変換手段の変換が操作者の
望む変換でない場合に、前記読み文字列に基づいて容易
にこれを変換することができる。In 1) writing character string converting apparatus according to the present invention the effect of the means and the invention for solving the above-mentioned object, 1) the sound
Notation character string given from voice data conversion means
Undetermined character string storage means for storing in a state, 2) the voice data
A reading character that stores the reading character string given by the conversion means
Column storage means, 3) stored in the undetermined character string storage means
Display control so that the notation string is displayed in an undetermined state
Output means for outputting a command, 4) said undetermined character string storage means
Notation conversion for the notable part of the notation character string stored in
When the instruction is given, the instruction is stored in the read character string storage means.
Notation based on the conversion instruction with reference to the read character string
A manual conversion unit for changing to a character string is provided. Accordingly
The notation character string and its
Given a reading string, this notation string is
It is displayed on the display means in a state. Undetermined character of the noted part
When a notation change instruction for converting a column is given,
The reading character string corresponding to the notation character string
Is converted based on the order and displayed in the noted area
You. As described above, since the notation character string can be converted by the conversion command, if the conversion of the voice data conversion means is not the conversion desired by the operator, it can be easily converted based on the read character string. it can.
【0006】2)本発明にかかる表記文字列変換装置に
おいては、前記手動変換手段は、変換命令割当キーに機
能別に変換命令を割り当てておき、この変換命令割当キ
ーを操作者が選択すると、選択された変換命令割当キー
に割り当てられた変換命令に基づいて、前記未確定文字
列記憶手段に記憶された前記注目部分の未確定文字列を
変更する。したがって、操作者は機能別に割り当てられ
た変更命令割当キーさえ覚えておけば、所望の変換を行
うことができる。[0006] 2) In the character string conversion device according to the present invention, the manual conversion means assigns a conversion command to a conversion command assignment key for each function, and when the operator selects the conversion command assignment key, the operator selects the conversion command assignment key. Based on the conversion command assigned to the assigned conversion command assignment key, the unconfirmed character string of the noted portion stored in the unconfirmed character string storage unit is
Change . Therefore, the operator can perform a desired conversion only by remembering the change command assignment key assigned to each function.
【0007】3)本発明にかかる表記文字列変換装置に
おいては、前記表記変換命令は、前記注目部分の未確定
文字列の表記を変更する命令である。したがって、操作
者は機能別に割り当てられた変更命令割当キーさえ覚え
ておけば、所望の表記に変換することができる。[0007] 3) In the writing character string converting apparatus according to the present invention, the notation conversion instruction is an instruction to change the representation of undetermined character array of the target portion. Therefore, the operator can convert to a desired notation only by remembering the change command assignment key assigned for each function.
【0008】4)本発明にかかる表記文字列変換装置に
おいては、前記手動変換手段は、注目部分を特定する特
定命令が与えられると、これを特定して、前記変換を行
う。したがって、未確定文字列が複数ある場合にも、所
望の未確定文字列を変換することかできる。[0008] 4) In the notation character string conversion device according to the present invention, when a specific instruction for specifying a target portion is given, the manual conversion means specifies the instruction and performs the conversion. Therefore, even when there are a plurality of undetermined character strings, a desired undetermined character string can be converted.
【0009】5)本発明にかかる表記文字列変換装置に
おいては、自動変換手段は、前記未確定文字列記憶手段
に記憶された複数の表記文字列のうち特定の表記文字列
の関係を言語規則に基づき判断して、表記文字列間の関
係が前記言語規則に合致していないと判断した場合に
は、前記未確定状態の表記文字列が前記言語規則に合致
するように変更する。したがって、言語規則に合致して
いない表記文字列を自動的に変更することができる。す
なわち、操作者は自動変換後の表記文字列について、所
望の変換が行われているかを判断すればよいので、操作
の煩雑性を防止できる。[0009] 5) In the written character string conversion device according to the present invention, the automatic conversion means determines a relation of a specific written character string among a plurality of written character strings stored in the undetermined character string storage means according to language rules. If it is determined that the relationship between the notation character strings does not match the language rule, the notation state of the notation character string is changed to match the language rule. Therefore, the notation character string which does not match the language rule can be automatically changed. That is, the operator only has to determine whether or not the desired conversion has been performed on the notation character string after the automatic conversion, so that the complexity of the operation can be prevented.
【0010】6)本発明にかかる表記文字列変換装置に
おいては、1)前記音声データ変換手段から与えられた表
記文字列を未確定状態で記憶する未確定文字列記憶手
段、2)前記音声データ変換手段から与えられた読み文字
列を記憶する読み文字列記憶手段、3)前記未確定文字列
記憶手段に記憶された表記文字列について注目部分が判
別可能に表示手段に表示されるように、表示制御命令を
出力する出力手段、4)前記注目部分の未確定文字列を変
換する表記変更命令が与えられると、前記読み文字列記
憶手段に記憶された読み文字列を参照して前記変換命令
に基づいた表記文字列に変更する手動変更手段を備えて
いる。このように、前記表記文字列は変換命令で変更可
能であるので、前記音声データ変換手段の変換が操作者
の望む変換でない場合に、前記読み文字列に基づいてこ
れを変換することができる。 6) The notation character string conversion apparatus according to the present invention includes: 1) a table provided from the voice data conversion means;
An undetermined character string storage method that stores a character string in an undetermined state
(2) Reading characters given from the voice data conversion means
Reading character string storage means for storing a string, 3) the undetermined character string
The notable part of the written character string stored in the storage means is determined.
A display control command is issued so that the display means can be displayed separately.
Output means for outputting, 4) changing the undetermined character string of the noted portion
When a notation change command to be replaced is given,
The conversion instruction with reference to the read character string stored in the storage means;
With manual change means to change to a notation string based on
I have. As described above, since the notation character string can be changed by the conversion command, if the conversion of the voice data conversion means is not the conversion desired by the operator, the conversion is performed based on the read character string. Can be done .
【0011】7)本発明にかかる表記文字列変換装置に
おいては、1)操作者が入力した音声データから特徴量を
抽出して表記文字列およびその読み文字列に変換する音
声データ変換手段、2)前記音声データ変換手段で変換さ
れた表記文字列を未確定状態で記憶する未確定文字列記
憶手段、3)前記音声データ変換手段から与えられた読み
文字列を記憶する読み文字列記憶手段、4)前記未確定文
字列記憶手段に記憶された表記文字列を表示する表示手
段、5)変換命令が機能別に割り当てられた変換命令割当
キー、6)操作者によって前記変換命令割当キーのいずれ
かが選択されると、この変換命令割り当てキーに割り当
てられた変換命令に基づいて前記読み文字列記憶手段に
記憶された読み文字列を変換し、これにより前記未確定
文字列記憶手段の表記文字列を変更する手動変換手段を
備えている。したがって、前記音声データ変換手段の変
換が操作者の望む変換でない場合に、前記読み文字列に
基づいて容易にこれを変換することができる。 7) In the character string conversion device according to the present invention, 1) a feature amount is determined from voice data input by an operator.
The sound to be extracted and converted to the notation character string and its reading character string
Voice data conversion means, 2) converted by the voice data conversion means.
Undetermined character string that stores the written text string in an undetermined state
Storage means, 3) reading given from the audio data conversion means.
Reading character string storage means for storing a character string, 4) the undecided sentence
Display means for displaying the notation character string stored in the character string storage means
Stage, 5) Conversion command assignment in which conversion commands are assigned by function
Key, 6) Any one of the conversion command assignment keys by the operator
Is selected, the conversion instruction assignment key is assigned.
Based on the given conversion command,
Convert the stored reading character string, and thereby
Manual conversion means for changing the notation character string in the character string storage means
Have. Therefore, if the conversion by the voice data conversion means is not the conversion desired by the operator, it can be easily converted based on the read character string .
【0012】8)本発明にかかる表記文字列変換方法に
おいては、前記音声データ変換手段から表記文字列およ
びその読み文字列が与えられると、この表記文字列を未
確定状態で表示手段に表示させ、前記注目部分の未確定
文字列を変換する表記変更命令が与えられると、前記注
目部分の表記文字列に対応する読み文字列を前記表記変
更命令に基づいて変換し、前記注目部分に表示する。こ
のように、前記表記文字列は変換命令で変換可能である
ので、前記音声データ変換手段の変換が操作者の望む変
換でない場合に、容易にこれを変換することができる。 8) In the method for converting a notation character string according to the present invention, a notation character string and a
And the reading character string are given, the notation character string is displayed on the display means in an undetermined state, and the undetermined
When a notation change command that converts a character string is given,
Change the reading character string corresponding to the notation character string
Is converted based on the renewal command, and is displayed in the noted portion. As described above, since the notation character string can be converted by the conversion command, if the conversion by the voice data conversion means is not the conversion desired by the operator, it can be easily converted .
【0013】以下、特許請求の範囲で用いていた用語と
実施形態の対応について説明する。Hereinafter, the correspondence between the terms used in the claims and the embodiments will be described.
【0014】「自動変換手段」:実施形態においては、
CPU23のステップST11の処理に該当する。ま
た、実施形態においては、読みバッファ27bの読み文
字列を参照せずに、かな漢字変換規則に合致するか否か
の判断を行ったが、読み文字列を参照するようにしても
よい。"Automatic conversion means": In the embodiment,
This corresponds to the process of step ST11 of the CPU 23. Further, in the embodiment, it is determined whether or not the character string matches the Kana-Kanji conversion rule without referring to the reading character string in the reading buffer 27b. However, the reading character string may be referred to.
【0015】「手動変換手段」:実施形態では、操作者
のキー操作の種類に応じてCPU23が行うステップS
T17、ステップST21、ステップST25、ステッ
プST27、ステップST29、ステップST31、ス
テップST33の処理に該当する。"Manual conversion means": In the embodiment, a step S performed by the CPU 23 according to the type of key operation by the operator.
This corresponds to the processing of T17, step ST21, step ST25, step ST27, step ST29, step ST31, and step ST33.
【0016】「表記文字列の注目部分」:実施形態では
注目文節に該当するが、文節以外に単語であってもよ
い。"Notable part of written character string": In the embodiment, this corresponds to a notable phrase, but may be a word other than a phrase.
【0017】「変換命令割当キー」:実施形態では、カ
タカナキー、ひらがなキー等の表記文字列を他の表記に
変換するキーをいう。なお、本実施形態においては、キ
ーボード上に配置されている場合について説明したが、
ポインティングデバイスであるマウス31で画面上のア
イコンをクリックするようにしてもよい。"Conversion command assignment key": In the embodiment, a key for converting a notation character string such as a katakana key or a hiragana key into another notation. In addition, in this embodiment, the case where it is arranged on the keyboard has been described,
You may make it click the icon on a screen with the mouse | mouth 31 which is a pointing device.
【0018】「出力手段」:CPU23の図7ステップ
ST7,ステップST11の処理が該当する。"Output means": corresponds to the processing of step ST7 and step ST11 in FIG.
【0019】[0019]
【発明の実施の形態】1.機能ブロック図の説明 本発明の一実施形態を図面に基づいて説明する。図1
に、表記文字列変換装置10の機能ブロック図を示す。
表記文字列変換装置10は、操作者が入力した音声デー
タから特徴量を抽出して表記文字列に変換して出力する
音声データ変換手段から与えられた表記文字列を操作者
の変換命令に基づいて変換する表記文字列変換装置であ
って、未確定文字列記憶手段12、手動変換手段13、
言語規則記憶手段17、自動変換手段15および出力手
段14を備えている。BEST MODE FOR CARRYING OUT THE INVENTION Description of Functional Block Diagram One embodiment of the present invention will be described with reference to the drawings. FIG.
2 shows a functional block diagram of the notation character string conversion device 10.
The notation character string conversion device 10 converts a notation character string given from a sound data conversion unit that extracts a feature amount from audio data input by an operator, converts the characteristic amount into a notation character string, and outputs the character string, based on a conversion command from the operator. A notation character string storage device, a manual conversion device 13,
A language rule storage unit 17, an automatic conversion unit 15 and an output unit 14 are provided.
【0020】まず、表記文字列変換装置10に表記文字
列を与える音声データ変換手段5について説明する。音
声入力手段3に操作者がデータを入力すると、音声変換
手段6はこの音声データから所定の特徴量を抽出する。
音声変換辞書7にはあらかじめ複数の変換候補が記憶さ
れている。各変換候補は、特徴量、その表記文字列およ
びその読み文字列で構成されている。音声変換手段6
は、抽出した特徴量と、前記各変換候補との特徴量との
一致度を判断し、最も一致した候補の表記文字列および
読み文字列を出力する。First, a description will be given of the voice data conversion means 5 for providing a notation character string to the notation character string conversion device 10. When the operator inputs data to the voice input unit 3, the voice conversion unit 6 extracts a predetermined feature amount from the voice data.
A plurality of conversion candidates are stored in the voice conversion dictionary 7 in advance. Each conversion candidate is composed of a feature amount, its notation character string, and its reading character string. Voice conversion means 6
Determines the degree of coincidence between the extracted feature value and the feature value of each of the conversion candidates, and outputs the notation character string and the read character string of the best matching candidate.
【0021】音声データ変換手段5から出力された表記
文字列は、未確定文字列記憶手段12に未確定状態で記
憶され、読み文字列は読み文字列記憶手段11に記憶さ
れる。 言語規則記憶手段17は、言語規則を記憶す
る。本実施形態においては、言語規則として、かな漢字
変換の変換辞書を採用した。より具体的にいうと、共起
関係にある表記文字列およびその読み文字列から構成さ
れた共起情報を採用した。The written character string output from the voice data conversion means 5 is stored in an undetermined character string storage means 12 in an undetermined state, and the read character string is stored in a read character string storage means 11. The language rule storage means 17 stores a language rule. In the present embodiment, a conversion dictionary for kana-kanji conversion is adopted as a language rule. More specifically, co-occurrence information composed of a notation character string having a co-occurrence relation and a reading character string thereof is employed.
【0022】自動変換手段15は、未確定文字列記憶手
段12に記憶された複数の表記文字列のうち特定の表記
文字列の関係を、言語規則記憶手段17の言語規則に基
づき判断して、表記文字列間の関係が前記言語規則に合
致していないと判断した場合には、前記未確定状態の表
記文字列が前記言語規則に合致するように変更する。The automatic conversion means 15 determines the relation of a specific notation character string among the plurality of notation character strings stored in the unconfirmed character string storage means 12 based on the language rules of the language rule storage means 17, If it is determined that the relationship between the notation character strings does not match the language rule, the notation state of the notation character string is changed to match the language rule.
【0023】本実施形態においては、自動変換手段15
は、読み文字列記憶手段11に記憶された読み文字列を
考慮して、前記判断及び変更を行う。In this embodiment, the automatic conversion means 15
Performs the above determination and change in consideration of the read character string stored in the read character string storage unit 11.
【0024】出力手段18は、未確定文字列記憶手段1
2に記憶された表記文字列が未確定状態で表示手段19
に表示されるように、表示制御命令を出力する。The output means 18 is an undetermined character string storage means 1
The display character string stored in the display means 19 is in an undetermined state.
The display control command is output so as to be displayed in.
【0025】手動変換手段13は、未確定文字列記憶手
段12に記憶された表記文字列の注目部分について、変
換命令が与えられると、この命令に基づいた変換を行
う。具体的には、変換命令を機能別に割り当てた変換命
令割当キーを操作者が選択すると、選択された変換命令
割当キーに割り当てられた変換命令に基づいて、未確定
文字列記憶手段12に記憶された前記注目部分の未確定
文字列を変換する。この変換命令は、たとえば、前記注
目部分の未確定文字列の表記を変更する命令がある。ま
た、手動変換手段13は、注目部分を特定する特定命令
が与えられると、これを特定して、前記変換を行う。When a conversion instruction is given to the noted portion of the written character string stored in the undetermined character string storage means 12, the manual conversion means 13 performs conversion based on this instruction. Specifically, when the operator selects a conversion command assignment key in which the conversion commands are assigned by function, the conversion command is stored in the undetermined character string storage unit 12 based on the conversion command assigned to the selected conversion command assignment key. The undetermined character string of the noted portion is converted. This conversion instruction is, for example, an instruction to change the notation of the undetermined character string of the noted portion. Further, when given a specific command for specifying the target portion, the manual conversion unit 13 specifies the command and performs the conversion.
【0026】2.ハードウェア構成 (2.1)概略 図2に、音声変換装置および表示文字列変換装置を組み
込んだかな漢字変換装置40を示す。かな漢字変換装置
40は、入力装置41、制御装置43、表示装置45お
よび記憶装置47を備えている。入力装置41は、文字
列、変換命令または選択命令等を、音声入力またはキー
入力可能である。記憶装置47には、音声変換用の辞
書、およびかな漢字変換用の辞書が格納されている。2. 2. Hardware Configuration (2.1) Outline FIG. 2 shows a kana-kanji conversion device 40 incorporating a voice conversion device and a display character string conversion device. The kana-kanji conversion device 40 includes an input device 41, a control device 43, a display device 45, and a storage device 47. The input device 41 is capable of voice input or key input of a character string, a conversion command, a selection command, and the like. The storage device 47 stores a dictionary for voice conversion and a dictionary for kana-kanji conversion.
【0027】操作者は、入力装置41から音声データ入
力する。制御装置43は、前記入力された音声データを
表記文字列に前記音声変換用辞書を用いて変換して表示
するとともに、表示された表記文字列を、操作者の変換
命令に基づいて変換する。表示装置45には、変換され
た表記文字列が表示される。The operator inputs voice data from the input device 41. The control device 43 converts the input speech data into a notation character string using the speech conversion dictionary and displays the same, and converts the displayed notation character string based on a conversion command from the operator. The display device 45 displays the converted notation character string.
【0028】(2.2)詳細 図3に、図2に示すかな漢字変換装置40を、CPUを
用いて実現したハードウェア構成の一例を示す。(2.2) Details FIG. 3 shows an example of a hardware configuration in which the kana-kanji conversion device 40 shown in FIG. 2 is realized using a CPU.
【0029】かな漢字変換装置40は、CPU23、メ
モリ27、ハードディスク26、CRT30、FDD2
5、キーボード28、マウス31、インターフェイス3
3、マイク34およびバスライン29を備えている。The kana-kanji conversion device 40 includes a CPU 23, a memory 27, a hard disk 26, a CRT 30, and an FDD 2.
5, keyboard 28, mouse 31, interface 3
3, a microphone 34 and a bus line 29.
【0030】マイク34には音声データが入力される。
入力された音声データはインターフェイス33でデジタ
ル変換され、メモリ27の作業バッファ(図示せず)に
一時記憶される。Audio data is input to the microphone 34.
The input audio data is digitally converted by the interface 33 and temporarily stored in a work buffer (not shown) of the memory 27.
【0031】ハードディスク26には、音声変換プログ
ラム26a,音声変換辞書26b、かな漢字変換プログ
ラム26c,かな漢字変換辞書26dおよびアプリケー
ションプログラム26pが記憶されている。音声変換辞
書26bのデータ構造を図4に示す。このように、音声
データ毎に表記文字列及びその読み文字列が記憶されて
いる。なお、音声変換辞書26bには単語がどのように
連接するかを示す単語間連接データも記憶されている
(図示せず)。かな漢字変換辞書26dに記憶されてい
る共起辞書の一例を図5に示す。共起関係にある表記文
字列が対応づけられて記憶されている。音声変換プログ
ラム26aおよびかな漢字変換プログラム26cについ
て、後述する。アプリケーションプログラム26pは、
かな漢字変換プログラム26cから表記文字列を受け取
って、CRT30へ出力する。The hard disk 26 stores a voice conversion program 26a, a voice conversion dictionary 26b, a kana-kanji conversion program 26c, a kana-kanji conversion dictionary 26d, and an application program 26p. FIG. 4 shows the data structure of the voice conversion dictionary 26b. As described above, the written character string and its read character string are stored for each voice data. The speech conversion dictionary 26b also stores inter-word connection data indicating how words are connected (not shown). FIG. 5 shows an example of the co-occurrence dictionary stored in the kana-kanji conversion dictionary 26d. Notation character strings having a co-occurrence relationship are stored in association with each other. The voice conversion program 26a and the kana-kanji conversion program 26c will be described later. The application program 26p
The notation character string is received from the kana-kanji conversion program 26c and output to the CRT 30.
【0032】図3に示すCPU23は、ハードディスク
26に記憶された前記2つのプログラムにしたがいバス
ライン29を介して、各部を制御する。これらプログラ
ムは、FDD25を介して、プログラムが記憶されたフ
レキシブルディスク25aから読み出されてハードディ
スク26にインストールされたものである。なお、フレ
キシブルディスク以外に、CD−ROM、ICカード等
のプログラムを実体的に一体化したコンピュータ可読の
記憶媒体から、ハードディスクにインストールさせるよ
うにしてもよい。さらに、通信回線を用いてダウンロー
ドするようにしてもよい。The CPU 23 shown in FIG. 3 controls each section via the bus line 29 according to the two programs stored in the hard disk 26. These programs are read from the flexible disk 25a in which the programs are stored via the FDD 25 and installed on the hard disk 26. In addition to the flexible disk, a hard disk may be installed from a computer-readable storage medium in which a program such as a CD-ROM or an IC card is substantially integrated. Furthermore, you may make it download using a communication line.
【0033】本実施形態においては、プログラムをフレ
キシブルディスクからハードディスク26にインストー
ルさせることにより、フレキシブルディスクに記憶させ
たプログラムを間接的にコンピュータに実行させるよう
にしている。しかし、これに限定されることなく、フレ
キシブルディスクに記憶させたプログラムをFDD25
から直接的に実行するようにしてもよい。なお、コンピ
ュータによって、実行可能なプログラムとしては、その
ままのインストールするだけで直接実行可能なものはも
ちろん、一旦他の形態等に変換が必要なもの(例えば、
データ圧縮されているものを、解凍する等)、さらに
は、他のモジュール部分と組合して実行可能なものも含
む。In the present embodiment, the program is installed on the hard disk 26 from the flexible disk, so that the computer indirectly executes the program stored on the flexible disk. However, without being limited to this, the program stored in the flexible disk is stored in the FDD25.
Alternatively, it may be executed directly from. Note that, as a program executable by a computer, not only a program that can be directly executed by simply installing it as it is, but also a program that needs to be temporarily converted into another form (for example,
Decompression of data that has been compressed, etc.), and also includes those that can be executed in combination with other module parts.
【0034】メモリ27には、音声データバッファ27
a、特徴量バッファ27f、変換後バッファ27e、読
みバッファ27b,半確定バッファ27c、確定バッフ
ァ27dを有する。The memory 27 has an audio data buffer 27
a, a feature buffer 27f, a post-conversion buffer 27e, a reading buffer 27b, a semi-determined buffer 27c, and a defined buffer 27d.
【0035】音声データバッファ27a、特徴量バッフ
ァ27fおよび変換後バッファ27eは、音声変換プロ
グラム用のバッファである。音声データバッファ27a
には入力された音声データをデジタル変換されたデジタ
ル音声データが記憶される。特徴量バッファ27fに
は、音声変換プログラム26aによって抽出された音声
特徴量が記憶される。変換後バッファ27eには、音声
変換プログラム26aによって特定された表記文字列お
よびその読み文字列が記憶される。The audio data buffer 27a, the feature buffer 27f and the post-conversion buffer 27e are buffers for an audio conversion program. Audio data buffer 27a
Stores digital audio data obtained by digitally converting input audio data. The voice feature extracted by the voice conversion program 26a is stored in the feature buffer 27f. The post-conversion buffer 27e stores the written character string specified by the voice conversion program 26a and its read character string.
【0036】読みバッファ27b,半確定バッファ27
c、確定バッファ27dは、かな漢字変換プログラム用
のバッファである。読みバッファ27bには、変換後バ
ッファ27eに記憶された読み文字列が順次記憶され
る。半確定バッファ27cには、変換後バッファ27e
に記憶された表記文字列が順次記憶される。確定バッフ
ァ27dには、キーボード28から与えられる確定命令
によって確定された表記文字列が記憶される。なお、メ
モリ27にはその他、各種の演算結果等が記憶される。Reading buffer 27b, semi-determining buffer 27
c, the determination buffer 27d is a buffer for a kana-kanji conversion program. The reading character strings stored in the converted buffer 27e are sequentially stored in the reading buffer 27b. The semi-determined buffer 27c includes a post-conversion buffer 27e.
Are sequentially stored. The notation character string determined by the determination command given from the keyboard 28 is stored in the determination buffer 27d. The memory 27 also stores various calculation results and the like.
【0037】CRT30には、未確定状態の表記文字列
または確定状態の表記文字列が表示される。キーボード
28は各種の変換命令割当キーが配置されている。On the CRT 30, a notation character string in an undetermined state or a notation character string in a confirmed state is displayed. The keyboard 28 is provided with various conversion command assignment keys.
【0038】3.フローチャート つぎに、ハードディスク26に記憶されているプログラ
ムについて、図6〜図8を用いて説明する。この実施形
態においては、アプリケーションプログラム26pは、
文字列入力可能状態で音声変換プログラム26aおよび
かな漢字変換プログラム26bを呼び出し、かな漢字文
字列が入力される。音声変換プログラム26aは表記文
字列を特定し(図6ステップST0〜ステップST
3)、この表記文字列をかな漢字変換プログラム26b
は未確定状態でアプリケーションプログラム26pに渡
す。アプリケーションプログラム26pは表記文字列を
未確定状態で表示する。3. Next, a program stored in the hard disk 26 will be described with reference to FIGS. In this embodiment, the application program 26p is:
The voice conversion program 26a and the kana-kanji conversion program 26b are called in a state where a character string can be input, and a kana-kanji character string is input. The voice conversion program 26a specifies the notation character string (FIG. 6, step ST0 to step ST0).
3) The kana-kanji conversion program 26b
Is passed to the application program 26p in an undetermined state. The application program 26p displays the notation character string in an undetermined state.
【0039】かな漢字変換プログラム26bは、操作者
の変換命令に基づいて表記文字列を変換する(図7ステ
ップST4〜図8ステップST33)。変換された表記
文字列は、アプリケーションプログラム26pに渡され
る。本実施形態においては、かな漢字変換プログラム2
6bとして、IME(input method editor)の1つで
ある株式会社ジャストシステム製の「ATOK11」
(商標)を用い、アプリケーションプログラム26pと
して、同社製の「一太郎8」(商標)を採用した。The kana-kanji conversion program 26b converts the character string to be written based on the conversion command from the operator (FIG. 7, step ST4 to FIG. 8, step ST33). The converted notation character string is passed to the application program 26p. In the present embodiment, the kana-kanji conversion program 2
6b, "ATOK11" manufactured by Justsystem Co., Ltd., which is one of IME (input method editor)
(Trademark) and "Ichitaro 8" (trademark) made by the company was adopted as the application program 26p.
【0040】まず、アプリケーションプログラム26p
について説明する。アプリケーションプログラム26p
は、日本語文書作成プログラムであり、起動することに
より、文字列入力可能画面がCRT30に表示される
(図示せず)。First, the application program 26p
Will be described. Application program 26p
Is a Japanese document creation program, and when activated, a character string input enabled screen is displayed on the CRT 30 (not shown).
【0041】この状態で、音声変換プログラム26aが
呼び出される。音声変換プログラム26aによって以下
の処理が実行される。操作者は、図3に示すマイク34
から音声データを入力する。CPU23は、マイク34
より音声入力があるか否かを判断しており(図6ステッ
プST0)、音声入力があれば音声データバッファ27
aにインターフェイス33にてデジタル変換されたデジ
タル音声データを記憶する(ステップST1)。たとえ
ば、「さんせいとあるかりせいのすいようえき」と発声
されると、デジタル変換されたデータが音声データバッ
ファ27aに記憶される。In this state, the voice conversion program 26a is called. The following processing is executed by the voice conversion program 26a. The operator operates the microphone 34 shown in FIG.
Input audio data from. The CPU 23 includes a microphone 34
It is determined whether or not there is a voice input (step ST0 in FIG. 6).
The digital audio data digitally converted by the interface 33 is stored in a (step ST1). For example, when "Sansei-Arikari-no-Sui-Eki" is uttered, the digitally converted data is stored in the audio data buffer 27a.
【0042】CPU23は、音声データバッファ27a
に記憶されたデジタル音声データから特徴量を抽出する
(ステップST2)。つぎに、図3に示す音声変換辞書
26bに登録された音声データ、単語間連接データと照
合し、最も一致度の高い文字列を得て、変換後バッファ
27eに記憶する(ステップST3)。例えば、この場
合、「さんせい/と/あるかりせい/の/すいようえき
/」と単語単位に区切られ、各単語毎に変換候補が特定
され、変換後バッファ27eには、表記文字列「賛成/
と/アルカリ性/の/水溶液」および読み文字列「さん
せい/と/あるかりせい/の/すいようえき」が記憶さ
れる。The CPU 23 has an audio data buffer 27a
A feature amount is extracted from the digital audio data stored in (step ST2). Next, the voice data and the inter-word concatenation data registered in the voice conversion dictionary 26b shown in FIG. 3 are collated to obtain a character string having the highest matching degree, and stored in the converted buffer 27e (step ST3). For example, in this case, a conversion candidate is specified for each word, such as "sansei / to / arikasei / no / suoiyoueki /", and a conversion candidate is specified for each word. Agree/
And / alkaline // aqueous solution ”and the reading character string“ sansei / to / akarisei / no / suoiyoueki ”are stored.
【0043】なお、図6ステップST0にて、音声入力
がなければ音声変換プログラムは終了する。In step ST0 in FIG. 6, if there is no voice input, the voice conversion program ends.
【0044】つぎに、かな漢字変換プログラム26bが
呼び出される。かな漢字変換プログラム26bによって
以下の処理が実行される。CPU23は、変換後バッフ
ァ27eに新たに文字列が記憶されたか否かを判断して
おり(図7ステップST4)、新たに文字列が記憶され
た場合には、かな漢字変換プログラムの変換単位(文
節)に区切りを修正し、その表記文字列を未確定バッフ
ァ27cに、その読み文字列を読みバッファ27bに記
憶する(図7ステップST5)。上記の場合であれば、
たとえば、表記文字列「賛成と/アルカリ性の/水溶
液」が半確定バッファ27cに、読み「さんせいと/あ
るかりせいの/すいようえき」が読みバッファ27bに
記憶される。Next, the kana-kanji conversion program 26b is called. The following processing is executed by the kana-kanji conversion program 26b. The CPU 23 determines whether or not a new character string is stored in the post-conversion buffer 27e (step ST4 in FIG. 7). If a new character string is stored, the conversion unit (phrase) of the kana-kanji conversion program is used. ) Is corrected, and the written character string is stored in the undetermined buffer 27c and the read character string is stored in the read buffer 27b (step ST5 in FIG. 7). In the above case,
For example, the notation character string “agreement / alkaline / aqueous solution” is stored in the semi-fixed buffer 27c, and the reading “sansanto / arukasei / suoiyoeki” is stored in the reading buffer 27b.
【0045】つぎに、CPU23は、半確定バッファ2
7cに記憶された表記文字列「賛成とアルカリ性の水溶
液」を、アプリケーションプログラム26pに半確定状
態であるとの条件をつけて渡す(図7ステップST
7)。アプリケーションプログラム26pは、置換され
た表記文字列を半確定状態でCRT30に表示する。Next, the CPU 23 executes the semi-determined buffer 2
The notation character string "agreement and alkaline aqueous solution" stored in 7c is passed to the application program 26p with the condition that it is in a semi-determined state (step ST in FIG. 7).
7). The application program 26p displays the replaced notation character string on the CRT 30 in a semi-determined state.
【0046】つぎに、CPU23は、半確定バッファ2
7cに記憶された文字列が、かな漢字変換規則に合致し
ているか否かを判断する(図7ステップST9)。この
例では、図5に示す共起辞書に基づいて、前記判断が行
われる。この場合、表記文字列「アルカリ性」と共起関
係にあるのは表記文字列「賛成」ではなく表記文字列
「酸性」であることがわかる。Next, the CPU 23 executes the semi-determined buffer 2
It is determined whether the character string stored in 7c matches the Kana-Kanji conversion rule (step ST9 in FIG. 7). In this example, the determination is made based on the co-occurrence dictionary shown in FIG. In this case, it is found that the co-occurrence relationship with the notation character string “alkaline” is not the notation character string “agree” but the notation character string “acidity”.
【0047】したがって、CPU23は、半確定バッフ
ァ27cに記憶された文字列がかな漢字変換規則に合致
していないと判断し、半確定バッファ27cに記憶され
た表記文字列をかな漢字変換規則に基づき、変換する
(図7ステップST11)。具体的には、「賛成」が
「酸性」に置換され、半確定バッファ27cに「賛成と
アルカリ性の水溶液」と記憶される。Therefore, the CPU 23 determines that the character string stored in the semi-fixed buffer 27c does not conform to the Kana-Kanji conversion rule, and converts the written character string stored in the semi-fixed buffer 27c based on the Kana-Kanji conversion rule. (Step ST11 in FIG. 7). Specifically, “agree” is replaced by “acid”, and “agree and alkaline aqueous solution” is stored in the semi-fixed buffer 27c.
【0048】つぎに、CPU23は、半確定バッファ2
7cに記憶された表記文字列「酸性とアルカリ性の水溶
液」を、アプリケーションプログラム26pに半確定状
態で渡す(図7ステップST13)。アプリケーション
プログラム26pは、置換された表記文字列を半確定状
態でCRT30に表示する。Next, the CPU 23 executes the semi-determined buffer 2
The notation character string “acidic and alkaline aqueous solution” stored in 7c is transferred to the application program 26p in a semi-determined state (step ST13 in FIG. 7). The application program 26p displays the replaced notation character string on the CRT 30 in a semi-determined state.
【0049】なお、ステップST9にて合致していると
判断した場合には、ステップST11、13の処理は行
わない。If it is determined in step ST9 that the values match, the processes in steps ST11 and ST13 are not performed.
【0050】つぎに、CPU23は、キー操作があるか
否かが判断される(ステップST14)。キー操作がな
ければ、かな漢字変換プログラムを終了し、図6に示す
音声変換プログラムを実行する。Next, CPU 23 determines whether or not there is a key operation (step ST14). If there is no key operation, the kana-kanji conversion program ends, and the voice conversion program shown in FIG. 6 is executed.
【0051】一方、ステップST14にて、キー操作が
あれば、ステップST15に進み、キーの種類を判断す
る。On the other hand, if there is a key operation in step ST14, the flow advances to step ST15 to determine the type of the key.
【0052】キーの種類が確定キーであれば、図8ステ
ップST17に進み、確定バッファ27dに半確定バッ
ファ27cのデータを記憶する。そして、確定状態の条
件付きでアプリケーションプログラム26pに渡す。ア
プリケーションプログラム26pは、確定バッファ27
dに記憶された表記文字列「酸性とアルカリ性の水溶
液」を、CRT30に確定状態で表示させる。If the type of the key is the decision key, the process proceeds to step ST17 in FIG. 8, and the data of the semi-decision buffer 27c is stored in the decision buffer 27d. Then, it is passed to the application program 26p with the condition of the fixed state. The application program 26 p
The written character string “acidic and alkaline aqueous solution” stored in d is displayed on the CRT 30 in a fixed state.
【0053】また、ステップST14にて、キーの種類
が取消キーであれば、半確定バッファ27c、読みバッ
ファ27bのデータをクリアする(図8ステップST2
5)。そして、処理を終了する。If the type of key is a cancel key in step ST14, the data in the semi-fixed buffer 27c and the read buffer 27b are cleared (step ST2 in FIG. 8).
5). Then, the process ends.
【0054】なお、図7ステップST4にて、変換後バ
ッファ27eに文字列が追加記憶されなかった場合に
は、ステップST14に進み、キー操作がされたか否か
を判断する。If no character string is additionally stored in the post-conversion buffer 27e in step ST4 in FIG. 7, the process proceeds to step ST14 to determine whether or not a key operation has been performed.
【0055】かな漢字変換プログラムによる処理と音声
変換プログラムとによる処理は順次繰り返される。The processing by the kana-kanji conversion program and the processing by the voice conversion program are sequentially repeated.
【0056】なお、操作者は入力した音声から所望の表
記文字列に変換されていない場合には、ステップST1
4にて、希望の変換を行うキーを操作すればよい。たと
えば、漢字で「太鼓はその箱の中に・・」と表記されて
いる場合に、「太鼓」の部分をかたかな表記したけれ
ば、つぎのように操作すればよい。半確定状態のまま、
注目文節変更キーを操作して、カーソルを「太鼓」の部
分へ移動させる。これにより、CPU23は、図8ステ
ップST31に進み、注目文節を変更する。そして、カ
タカナキーを操作すれば、ステップST14からステッ
プST27に進み、半確定バッファ27cの注目文節の
表記文字列が読みバッファ27bの読み文字列を参照し
てカタカナに変換される。If the input voice has not been converted into the desired notation character string, the operator proceeds to step ST1.
In step 4, a key for performing a desired conversion may be operated. For example, if "Taiko is in the box" in Kanji, and you want to write "Taiko" in the form of a letter, the following operation may be performed. In the semi-determined state,
Operate the notice phrase change key to move the cursor to the "Taiko" part. Accordingly, the CPU 23 proceeds to step ST31 in FIG. 8 and changes the noticeable phrase. Then, if the katakana key is operated, the process proceeds from step ST14 to step ST27, where the notation character string of the noticed phrase in the semi-fixed buffer 27c is converted into katakana with reference to the reading character string in the reading buffer 27b.
【0057】このように、注目部分である注目文節が判
別可能に表示されるように、表示制御命令を出力し、与
えられた表記変更命令に基づいて表記文字列を変更して
いる。これにより、表記文字列の変更が容易に行える。As described above, the display control instruction is output so that the noticeable phrase, which is the noticeable portion, is displayed in a distinguishable manner, and the notation character string is changed based on the given notation change instruction. As a result, the written character string can be easily changed.
【0058】他の変換についても同様である。たとえ
ば、ひらがな変換したければ、ひらがな変換キーを操作
すればよい。CPU23は、キーの種類がひらがなキー
であると判断し、半確定バッファ27cの注目文節をひ
らがな変換する(図8ステップST29)。The same applies to other conversions. For example, if you want to convert Hiragana, you can operate the Hiragana conversion key. The CPU 23 determines that the type of the key is a hiragana key, and converts the target phrase in the semi-fixed buffer 27c into hiragana (step ST29 in FIG. 8).
【0059】キーの種類が半角変換キーであれば、半確
定バッファ27cの注目文節を半角変換する(図8ステ
ップST35)。そして、ステップST14に戻り、キ
ー操作がされたかを判断する。If the key type is a half-width conversion key, the target phrase in the half-fixed buffer 27c is half-width converted (step ST35 in FIG. 8). Then, returning to step ST14, it is determined whether a key operation has been performed.
【0060】なお、キーの種類が区切り位置変更キーで
あれば、読みバッファ27bの区切り位置変更を行い
(図8ステップST21)、区切り位置変更された読み
文字列をアプリケーションプログラム26pに渡す(ス
テップST23)。そして、ステップST14に戻り、
キー操作があったかを判断する。If the type of key is a delimiter position change key, the delimiter position of the reading buffer 27b is changed (step ST21 in FIG. 8), and the read character string whose delimiter position has been changed is passed to the application program 26p (step ST23). ). Then, returning to step ST14,
Determine whether a key operation has been performed.
【0061】このように本実施形態においては、音声変
換プログラムによって変換された表記文字列を未確定状
態でIMEであるかな漢字変換プログラムで受け取っ
て、CRT30に未確定状態で表示させ、操作者のキー
操作に基づいて、表記文字列を変換している。したがっ
て、より効率的な文字列入力が可能となる。また、操作
者の慣れ親しんだかな漢字変換プログラムと同じ操作性
で変換ができるので、操作を別途覚える必要がなくな
る。As described above, in the present embodiment, the notation character string converted by the voice conversion program is received in an undetermined state by the Kana-Kanji conversion program, which is an IME, and displayed on the CRT 30 in an undetermined state. Notation strings are converted based on the operation. Therefore, more efficient character string input becomes possible. In addition, since the conversion can be performed with the same operability as the kana-kanji conversion program familiar to the operator, there is no need to learn the operation separately.
【0062】また、本実施形態においては、音声変換プ
ログラムによって変換された表記文字列をかな漢字変換
プログラムで検査し、適切な表記文字列でない場合に
は、かな漢字変換プログラムの変換規則に基づいて再変
換するようにしている。これにより、学習させていない
音声変換プログラムであっても、すでにその操作者が蓄
積しているかな漢字変換規則を活用して適切なかな漢字
変換を行うことができる。Also, in the present embodiment, the notation character string converted by the voice conversion program is checked by the kana-kanji conversion program, and if it is not an appropriate notation character string, it is re-converted based on the conversion rules of the kana-kanji conversion program. I am trying to do it. As a result, even if the speech conversion program has not been trained, appropriate Kana-Kanji conversion can be performed by utilizing the Kana-Kanji conversion rules already accumulated by the operator.
【0063】上記実施形態においては、ひらがな変換、
カタカナ変換、文節区切り位置変更、半角変換、確定、
取り消し等の命令の場合について説明したが、他の機
能、たとえば、カーソルの操作、カーソル前の1音削
除、カーソルを左へ移動、カーソルを右へ移動等につい
ても同様に適用することができる。In the above embodiment, the hiragana conversion,
Katakana conversion, phrase break position change, half-width conversion, confirmation,
Although the case of an instruction such as cancellation has been described, other functions such as operation of a cursor, deletion of one sound before the cursor, movement of the cursor to the left, movement of the cursor to the right, and the like can be similarly applied.
【0064】4.その他の実施形態 なお、本実施形態においては、かな漢字変換規則とし
て、共起情報を用いた場合について説明したが、これ以
外の規則、例えば学習情報等を採用してもよい。また、
日本語へのかな漢字変換だけでなく、言語規則であれば
どのようなものであってもよい。例えば、他の言語であ
る英語、中国語等の音声入力についても同様に適用する
ことかできる。4. Other Embodiments In the present embodiment, the case where co-occurrence information is used as the kana-kanji conversion rule has been described, but other rules, such as learning information, may be used. Also,
Not only kana-kanji conversion to Japanese but any language rules may be used. For example, the same can be applied to voice input in other languages such as English and Chinese.
【0065】また、同音異議語がある場合、本実施形態
のように共起情報を用いることにより、操作者の操作な
しで音声入力されたデータから適切な表記文字列を得る
ことができる。これに対して、音声変換プログラムの音
声変換辞書に登録されていない読みの音声データ(専門
用語等)については、正しく変換することができない。
なぜなら、音声変換プログラムは、その読みによく似た
読みを有する表記文字列に変換してしまうからである。
例えば、特許という用語がない場合、よく似た東京など
に変換され、その読みも「とうきょう」と変換されるわ
けである。一般に、かな漢字変換プログラムは、音声変
換プログラムから与えられた表記文字列または読みを参
照して、変換候補を検索する。したがって、このような
場合でも、正確に変換できるように、かな漢字変換プロ
グラムにかな漢字変換規則として、類似の読みを有する
表記文字列を記憶するようにしてもよい。このように、
類似語読みデータを記憶しておき、正しい読みまで予想
することにより、少しずれた読みが、音声変換プログラ
ムから与えられても、適切な表記文字列を得ることがで
きる。When there is a homonymous object word, by using co-occurrence information as in the present embodiment, it is possible to obtain an appropriate written character string from data input by voice without an operation by an operator. On the other hand, reading voice data (technical terms and the like) not registered in the voice conversion dictionary of the voice conversion program cannot be correctly converted.
The reason is that the voice conversion program converts the speech into a written character string having a pronunciation very similar to the pronunciation.
For example, if there is no term for a patent, it is converted to a similar Tokyo, etc., and its reading is also converted to “Tokyo”. In general, a kana-kanji conversion program searches for a conversion candidate by referring to a written character string or a reading given from a voice conversion program. Therefore, even in such a case, a written character string having a similar reading may be stored as a kana-kanji conversion rule in the kana-kanji conversion program so that conversion can be performed accurately. in this way,
By storing the similar word reading data and predicting the correct reading, an appropriate written character string can be obtained even if a slightly shifted reading is given from the speech conversion program.
【0066】また、和製英語となっているような単語、
例えば、「システム」等については、表記文字列とし
て、そのスペル「system」を記憶しておき、これ
に変換するようにしてもよい。Also, words that are in Japanese English,
For example, as for “system” and the like, the spelling “system” may be stored as a notation character string and converted to this.
【0067】なお、本実施形態においては、音声変換プ
ログラムとして、日本アイ・ビー・エム株式会社製のV
iaVoice(商標)を採用したが、これに限定され
ず、他の音声認識プログラムについても同様に適用でき
る。このように、市販の音声変換プログラムを音声入力
エンジンとして用いた場合に、変換対象の分野等によ
り、その変換率がそれほどよくない場合でも、いままで
操作者が蓄えたかな漢字変換の変換規則を用いて所望の
表記文字列を得ることができる。In the present embodiment, the voice conversion program is a program manufactured by IBM Japan, Ltd.
Although iaVoice (trademark) was adopted, the present invention is not limited to this, and other voice recognition programs can be similarly applied. In this way, when a commercially available voice conversion program is used as a voice input engine, even if the conversion rate is not so good due to the conversion target field, the conversion rules of the kana-kanji conversion stored by the operator are used. Thus, a desired written character string can be obtained.
【0068】また、音声変換プログラムについてはソフ
トウェアで実現した場合について説明したが、ハードウ
ェアで実現させてもよい。すなわち、音声データ変換手
段とは、音声データ変換装置を含む概念である。Although the speech conversion program has been described as being realized by software, it may be realized by hardware. That is, the audio data conversion means is a concept including the audio data conversion device.
【0069】また、本実施形態においては、アプリケー
ションプログラム26pに半確定状態であるとの条件を
つけて渡して、アプリケーションプログラム26pに半
確定状態でCRT30に表示させるようにした。すなわ
ち、かな漢字変換プログラムは、未確定バッファに記憶
された表記文字列が未確定状態で表示されるように、表
示制御命令を出力している。しかし、未確定状態での表
示については、このようにアプリケーションプログラム
26pが実行するだけでなく、アプリケーションプログ
ラム26pから表示しなかったという返答指令を、かな
漢字変換プログラムが受けて、これを表示するようにし
てもよい。また、かかる表示については、オペレーティ
ングシステム(OS)と分担して、実現するようにして
もよい。In the present embodiment, the application program 26p is provided with a condition that it is in a semi-determined state, and is displayed on the CRT 30 in a semi-determined state to the application program 26p. That is, the kana-kanji conversion program outputs the display control command so that the notation character string stored in the undetermined buffer is displayed in an undetermined state. However, as for the display in the undetermined state, not only is the application program 26p executed in this way, but the Kana-Kanji conversion program receives a reply command indicating that no display was made from the application program 26p, and displays it. You may. In addition, such display may be realized by sharing with the operating system (OS).
【0070】なお、本実施形態においては、図1に示す
機能を実現する為に、CPU23を用い、ソフトウェア
によってこれを実現している。しかし、その一部もしく
は全てを、ロジック回路等のハードウェアによって実現
してもよい。In the present embodiment, the functions shown in FIG. 1 are realized by using the CPU 23 and software. However, some or all of them may be realized by hardware such as a logic circuit.
【図1】本発明にかかる表記文字列変換装置10の機能
ブロック図である。FIG. 1 is a functional block diagram of a notation character string conversion device 10 according to the present invention.
【図2】図1に示す表記文字列変換装置10のハードウ
エア構成の一例を示す図である。FIG. 2 is a diagram illustrating an example of a hardware configuration of a notation character string conversion device 10 illustrated in FIG.
【図3】図2に示す表記文字列変換装置10を、CPU
23を用いて実現したハードウエア構成の一例を示す図
である。FIG. 3 is a block diagram of a notation character string conversion device 10 shown in FIG.
FIG. 3 is a diagram illustrating an example of a hardware configuration realized using the H.23.
【図4】音声変換辞書のデータ構造を示す。FIG. 4 shows a data structure of a speech conversion dictionary.
【図5】かな漢字変換辞書のデータ構造を示す。FIG. 5 shows a data structure of a kana-kanji conversion dictionary.
【図6】音声変換処理のフローチャートである。FIG. 6 is a flowchart of a voice conversion process.
【図7】かな漢字変換処理のフローチャートである。FIG. 7 is a flowchart of a kana-kanji conversion process.
【図8】かな漢字変換処理のフローチャートである。FIG. 8 is a flowchart of a kana-kanji conversion process.
【図9】従来の音声変換システムの機能ブロック図であ
る。FIG. 9 is a functional block diagram of a conventional voice conversion system.
3・・・・・音声入力手段 5・・・・・音声データ変換手段 6・・・・・音声変換手段 7・・・・・変換変換辞書 10・・・・表記文字列変換装置 11・・・・読み文字列記憶手段 12・・・・未確定文字列記憶手段 13・・・・手動変換手段 14・・・・出力手段 15・・・・自動変換手段 17・・・・言語規則記憶手段 23・・・CPU 27・・・メモリ 3 ... Voice input means 5 ... Voice data conversion means 6 ... Voice conversion means 7 ... Conversion conversion dictionary 10 ... Notation character string conversion device 11 ... ..Reading character string storage means 12... Undetermined character string storage means 13... Manual conversion means 14... Output means 15... Automatic conversion means 17. 23: CPU 27: Memory
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平9−160750(JP,A) 実開 平5−79657(JP,U) (58)調査した分野(Int.Cl.7,DB名) G06F 17/22 ──────────────────────────────────────────────────続 き Continuation of the front page (56) References JP-A-9-160750 (JP, A) JP-A-5-79657 (JP, U) (58) Fields investigated (Int. Cl. 7 , DB name) G06F 17/22
Claims (9)
抽出して表記文字列および対応する読み文字列に変換し
て出力する音声データ変換手段から与えられた表記文字
列を操作者の変換命令に基づいて変換する表記文字列変
換装置であって、 前記音声データ変換手段から与えられた表記文字列を未
確定状態で記憶する未確定文字列記憶手段、前記音声データ変換手段から与えられた読み文字列を記
憶する読み文字列記憶手段、 前記未確定文字列記憶手段に記憶された表記文字列が未
確定状態で表示されるように、表示制御命令を出力する
出力手段、 前記未確定文字列記憶手段に記憶された表記文字列の注
目部分について、表記変換命令が与えられると、前記読
み文字列記憶手段に記憶された読み文字列を参照して前
記変換命令に基づいた表記文字列に変更する手動変換手
段、 を備えた表記文字列変換装置。1. A notation character string provided from a sound data conversion means for extracting a feature amount from voice data input by an operator , converting the feature amount into a notation character string and a corresponding reading character string, and outputting the converted character string. A notation character string conversion device for converting based on a command, wherein the notation character string storage means for storing the notation character string provided from the voice data conversion means in an undetermined state, and the character string conversion means provided from the voice data conversion means. Write the reading string
Reading character string storage means, output means for outputting a display control command so that the notation character string stored in the unconfirmed character string storage means is displayed in an unconfirmed state, for the target portion of the stored representation string, the notation conversion command is given, the reading
Refer to the reading character string stored in the character string storage
A notation character string conversion device, comprising: manual conversion means for changing to a notation character string based on the notation conversion instruction .
すると、選択された変換命令割当キーに割り当てられた
変換命令に基づいて、前記未確定文字列記憶手段に記憶
された前記注目部分の未確定文字列を変更することを特
徴とする表記文字列変換装置。2. The notation character string conversion device according to claim 1, wherein, when an operator selects a conversion command assignment key, the manual conversion unit performs a conversion based on the conversion command assigned to the selected conversion command assignment key. A notation character string conversion device for changing an unconfirmed character string of the noted portion stored in the unconfirmed character string storage means.
記を変更する命令であること、 を特徴とする表記文字列変換装置。3. A writing character string converter according to claim 1, wherein the representation conversion instructions, said an instruction to change the representation of undetermined character string of the target portion, notation string conversion device according to claim.
えられると、これを特定して、前記変換を行うこと、 を特徴とする表記文字列変換装置。4. The notation character string conversion device according to claim 1, wherein the manual conversion means, when given a specific instruction for specifying a target portion, specifies the instruction and performs the conversion. Notation string converter .
列のうち特定の表記文字列の関係を前記言語規則に基づ
き判断して、表記文字列間の関係が前記言語規則に合致
していないと判断した場合には、前記未確定状態の表記
文字列が前記言語規則に合致するように変更する自動変
換手段、 を備えたことを特徴とする表記文字列変換装置。5. The notation character string conversion device according to claim 1, wherein a language rule storage means for storing a language rule, and a specific notation character string among a plurality of notation character strings stored in the undetermined character string storage means. The relationship is determined based on the language rule, and if it is determined that the relationship between the written character strings does not match the language rule, the written character string in the undetermined state matches the language rule. A notation character string conversion device , comprising: automatic conversion means for changing.
抽出して表記文字列およびその読み文字列に変換して出
力する音声データ変換手段から与えられた表記文字列を
操作者の変換命令に基づいて変換する表記文字列変換装
置であって、 前記音声データ変換手段から与えられた表記文字列を未
確定状態で記憶する未確定文字列記憶手段、前記音声データ変換手段から与えられた読み文字列を記
憶する読み文字列記憶手段、 前記未確定文字列記憶手段に記憶された表記文字列につ
いて注目部分が判別可能に表示手段に表示されるよう
に、表示制御命令を出力する出力手段、前記注目部分の未確定文字列を変換する表記変更命令が
与えられると、前記読み文字列記憶手段に記憶された読
み文字列を参照して前記変換命令に基づいた表記文字列
に変更する 手動変更手段、 を備えた表記文字列変換装置。6. A notation character string provided from a sound data conversion means for extracting a feature amount from voice data input by an operator , converting the feature amount into a notation character string and its reading character string, and outputting the converted character string. A notation character string conversion device that converts the notation character string given from the audio data conversion means in an undetermined state, and a reading given from the audio data conversion means. Write a character string
Reading character string storage means for memorizing, output means for outputting a display control command so that a noticeable part of a notation character string stored in the undetermined character string storage means is displayed on a display means in a distinguishable manner, and the noticeable part Notation change instruction that converts undetermined character strings
When given, the reading stored in the reading character string storage
Notation character string based on the conversion instruction with reference to only the character string
Writing character string converter with manual changing means for changing the.
抽出して表記文字列およびその読み文字列に変換する音
声データ変換手段、 前記音声データ変換手段で変換された表記文字列を未確
定状態で記憶する未確定文字列記憶手段、前記音声データ変換手段から与えられた読み文字列を記
憶する読み文字列記憶手段、 前記未確定文字列記憶手段に記憶された表記文字列を表
示する表示手段、 変換命令が機能別に割り当てられた変換命令割当キー、 操作者によって前記変換命令割当キーのいずれかが選択
されると、この変換命令割り当てキーに割り当てられた
変換命令に基づいて前記読み文字列記憶手段に記憶され
た読み文字列を変換し、これにより前記未確定文字列記
憶手段の表記文字列を変更する手動変換手段、 を備えた表記文字列変換装置。7. A voice data conversion means for extracting a feature amount from voice data input by an operator and converting the feature into a notation character string and its reading character string , wherein the notation character string converted by the voice data conversion means is not determined. An unconfirmed character string storage means for storing in a state, and a reading character string given from the voice data conversion means.
Reading character string storage means, display means for displaying a notation character string stored in the undecided character string storage means, a conversion command assignment key to which a conversion command is assigned for each function, If either is selected, the key assigned to this conversion instruction assignment key
Stored in the read character string storage means based on the conversion instruction.
A notation character string conversion device for converting the notation character string read by the user , thereby changing the notation character string in the undetermined character string storage means.
抽出して表記文字列およびその読み文字列に変換して出
力する音声データ変換手段から表記文字列を受け取っ
て、操作者の変換命令に基づいて前記表記文字列を変換
する表記文字列変換方法であって、 前記音声データ変換手段から表記文字列およびその読み
文字列が与えられると、この表記文字列を未確定状態で
表示手段に表示させ、前記注目部分の未確定文字列を変換する表記変更命令が
与えられると、前記注目部分の表記文字列に対応する読
み文字列を前記表記変更命令に基づいて変換し、前記注
目部分に表示すること 、 を特徴とする表記文字列変換方法。8. A notation character string is received from voice data conversion means for extracting a feature amount from voice data inputted by an operator, converting the feature amount into a notation character string and its reading character string , and outputting the converted character string. A notation character string conversion method for converting the notation character string based on the notation character string and its reading from the voice data conversion means.
When a character string is given, this notation character string is displayed on the display means in an undetermined state, and a notation change instruction for converting the undetermined character string of the noted portion is issued.
If given, the reading corresponding to the notation character string of the noted portion
The character string is converted based on the
A notation character string conversion method characterized by being displayed on an eye part .
装置を備えたコンピュータを、請求項1〜請求項7のい
ずれかの表記文字列変換装置として機能させるためのプ
ログラムを記憶した記憶媒体。9. A computer comprising an input device, a control device, an output device and a storage device according to claim 1.
A storage medium storing a program for functioning as a notation character string conversion device .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10175644A JP3071760B2 (en) | 1998-06-23 | 1998-06-23 | Notation string conversion device and notation string conversion method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10175644A JP3071760B2 (en) | 1998-06-23 | 1998-06-23 | Notation string conversion device and notation string conversion method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000010971A JP2000010971A (en) | 2000-01-14 |
JP3071760B2 true JP3071760B2 (en) | 2000-07-31 |
Family
ID=15999703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10175644A Expired - Fee Related JP3071760B2 (en) | 1998-06-23 | 1998-06-23 | Notation string conversion device and notation string conversion method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3071760B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7285248B2 (en) | 2001-01-29 | 2007-10-23 | Fumakilla Limited | Fan type chemical dispersion equipment |
-
1998
- 1998-06-23 JP JP10175644A patent/JP3071760B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7285248B2 (en) | 2001-01-29 | 2007-10-23 | Fumakilla Limited | Fan type chemical dispersion equipment |
Also Published As
Publication number | Publication date |
---|---|
JP2000010971A (en) | 2000-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7299187B2 (en) | Voice command processing system and computer therefor, and voice command processing method | |
US5835924A (en) | Language processing apparatus and method | |
JP4829901B2 (en) | Method and apparatus for confirming manually entered indeterminate text input using speech input | |
US6490563B2 (en) | Proofreading with text to speech feedback | |
US6581033B1 (en) | System and method for correction of speech recognition mode errors | |
US7802184B1 (en) | Method and apparatus for processing text and character data | |
US8606582B2 (en) | Multimodal disambiguation of speech recognition | |
JP5021802B2 (en) | Language input device | |
US7765102B2 (en) | Generic spelling mnemonics | |
JP2002117026A (en) | Method and system for filtration and selection from candidate list generated by probabilistic input method | |
JPH03224055A (en) | Method and device for input of translation text | |
JP3476007B2 (en) | Recognition word registration method, speech recognition method, speech recognition device, storage medium storing software product for registration of recognition word, storage medium storing software product for speech recognition | |
JP2004046807A (en) | Multi-modal input of ideographic language | |
JPS61107430A (en) | Editing unit for voice information | |
JPWO2007097390A1 (en) | Speech recognition system, speech recognition result output method, and speech recognition result output program | |
JP3795692B2 (en) | Character processing apparatus and method | |
JP3071760B2 (en) | Notation string conversion device and notation string conversion method | |
JP3102636B2 (en) | Notation string conversion device and notation string conversion method | |
JP3762300B2 (en) | Text input processing apparatus and method, and program | |
JP3958908B2 (en) | Transcription text automatic generation device, speech recognition device, and recording medium | |
JP3120831B2 (en) | Kana-Kanji conversion device | |
JP3814000B2 (en) | Character string conversion apparatus and character string conversion method | |
JP3069532B2 (en) | Kana-kanji conversion method and device, and computer-readable recording medium storing a program for causing a computer to execute the kana-kanji conversion method | |
JP2006309469A (en) | Retrieval device, retrieval method, program, and computer-readable recording medium | |
JPH10143503A (en) | Speech word processor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120526 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |