JPH10334085A - 文字入力装置 - Google Patents

文字入力装置

Info

Publication number
JPH10334085A
JPH10334085A JP9141560A JP14156097A JPH10334085A JP H10334085 A JPH10334085 A JP H10334085A JP 9141560 A JP9141560 A JP 9141560A JP 14156097 A JP14156097 A JP 14156097A JP H10334085 A JPH10334085 A JP H10334085A
Authority
JP
Japan
Prior art keywords
conversion
chinese
input device
chinese word
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9141560A
Other languages
English (en)
Inventor
Katsuya Kono
勝也 河野
Yoshitake Inoue
喜勇 井上
Hiroyuki Kumai
裕之 隈井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP9141560A priority Critical patent/JPH10334085A/ja
Publication of JPH10334085A publication Critical patent/JPH10334085A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】中国語入力における変換精度を向上する。 【解決手段】変換結果作成手段7は、ピン音漢字変換を
行う際に、用語辞書3で検索した単語と、変換履歴保持
手段11に保持している過去の確定候補との共起関係を
共起辞書9で検索し、一致する組み合わせが存在する単
語を優先的に変換候補として表示手段13に表示する。
そして、ユーザーの選択結果は変換履歴保持手段11に
待避させて次の変換処理で参照する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字入力装置に関
し、特に中国語(漢字)の文字入力装置に関するもので
ある。
【0002】
【従来の技術】従来、ピン音を漢字(中国語単語)に変
換する装置としては、特開平5―216887号公報に
述べられている装置等がある。ピン音は中国語の発音表
記であり、このピン音を入力して漢字に変換する方法
は、中国語の文字を入力する手段として最も習得が容易
である。
【0003】さて、ピン音による漢字入力を情報処理装
置で行う場合には、多くの変換システムでは、情報処理
装置に付属している英字キーボードを利用している。そ
して、ピン音を漢字に変換する契機となる入力を行う操
作は、スペースキーを押し下げることで行っているシス
テムが非常に多い。すなわち、 操作(1) ピン音入力 操作(2) スペースキー押下(これにより変換システ
ムがピン音に対応する漢字の候補を提示する。) 操作(3) 候補選択 操作(4) 候補確定操作 の4つの操作で一連の漢字入力が行われる。
【0004】一方、ピン音の正書法(表記のルール)で
は、ピン音を文節単位で分けて記述する。たとえば、
「我是日本人」という漢字文のピン音(声調は含まな
い)は、「wo shi ribenren」と記述する。したがっ
て、正書法に基づいてピン音を入力すると、文節毎にス
ペースを入力することになる。その結果として、ピン音
を入力して漢字に変換する情報処理装置では、1文節か
ら数文節の短い文入力毎にスペースが押され、その度に
漢字変換を行うことが多くなる。
【0005】
【発明が解決しようとする課題】このような従来の文字
入力装置では、操作(4)で漢字変換を行う際に、複数
の変換候補がある場合には、尤度の高い変換候補を優先
的に表示するために、過去に同じ読み(ピン音)に対する
変換を行ったときのユーザーの選択の履歴(学習と呼ば
れる)や、そのピン音の前後にあるピン音あるいは漢字
変換結果を評価して変換候補の順位付けを行っている。
【0006】しかし、この評価の際に参照するピン音あ
るいは漢字変換結果は、直前の操作(1),(2)ある
いは(3)の結果に限定されていた。したがって、操作
(1)よりも前に入力されたピン音あるいは漢字は評価
されていない。
【0007】ピン音漢字変換では、前述したように短い
文入力毎に変換が行われることが多いために、従来の文
字入力装置では最適な候補選択を行うための評価参照情
報が少ないので、正しい評価が行われない場合が多く発
生するという問題があった。
【0008】本発明の目的は、短い文入力毎に変換が行
われた場合でも、尤度の高い最適な変換候補を表示する
ことができる文字入力装置を提供することにある。
【0009】
【課題を解決するための手段】本発明は、ユーザーによ
って変換候補が選択されて変換が確定した後もそのピン
音ならびに変換結果を待避させて保持する変換履歴保持
手段を設け、その後の変換の際に該手段に保持している
ピン音ならびに変換結果を利用して選択候補の決定を行
うようにして、尤度の高い選択候補を提示することがで
きるようにするものである。
【0010】具体的には、隣接する確率が高い中国語の
単語の組み合わせを保持する共起辞書を用意すると共
に、ピン音を知友ごく後の単語漢字に変換し、確定する
毎にそのピン音とそれに対してユーザーが選択した変換
結果の情報を変換履歴保持手段に待避させて保持し、そ
の後に継続して入力されたピン音を漢字に変換するとき
には、この変換履歴保持手段に保持しているピン音なら
びにユーザーの選択した変換結果との共起関係の有無を
前記共起辞書で検索し、一致した単語があった場合にそ
れを優先的に変換候補として表示するようにして変換精
度を向上させる。
【0011】
【発明の実施の形態】本発明の文字入力装置の一実施形
態を説明する。
【0012】図1は、本発明になる文字入力装置のブロ
ック図である。1は入力手段であり、ピン音をローマ字
(英字)で入力することができるキーボードなどの入力装
置である。3は、ピン音と該ピン音に対応する中国語の
単語および品詞を格納する用語辞書である。5は辞書検
索手段であり、入力手段1によって入力されたピン音に
したがって用語辞書3を検索する。
【0013】7は変換結果作成手段であり、入力手段1
から入力される変換指示に従って、用語辞書3を検索し
た結果に基づいて変換の候補を作成する。この変換結果
作成手段7は、複数文節の変換処理を行うことが可能で
あり、この変換処理に際しては、共起関係にある漢字の
組み合わせを保持する共起辞書9を参照し、複数の変換
候補がある場合にはその前後関係に基づいて最も尤度の
高い変換候補を優先的に提示するように変換結果を作成
する。
【0014】11は、ユーザーによって選ばれた変換候
補の表記(漢字)と読み文字列(ピン音)の組み合わせ
を時系列的に保持する変換履歴保持手段である。この変
換履歴保持手段13は、電源投入時に初期化される。
【0015】13は、入力手段1によって入力されたピ
ン音や変換結果作成手段7が作成した変換候補や確定し
た変換結果を表示する表示手段である。
【0016】このような本発明になる文字入力装置は、
例えば、CPU,メモリ,外部記憶装置,入出力デバイ
スを備えた一般的なパーソナルコンピュータに制御プロ
グラムと用語辞書および共起辞書のデータを組み込むこ
とによって構成することができる。また、制御プログラ
ムおよび辞書を組み込んだ専用端末装置でも実施するこ
とができる。
【0017】図2は、用語辞書3の一例を示している。
この用語辞書3は、インデックスであるピン音文字列2
01と、これに対応する単語の表記203ならびに品詞
205を格納している。
【0018】図3は、共起辞書9の一例を示している。
この共起辞書9は、中国語で隣接の関係になる頻度が高
い単語の組を保持しており、図示の例では前側に位置す
る単語301と後側に位置する単語303を格納してい
る。前側単語301と後側単語303は1対1で相互に
対応づけられているので、前側単語301が決まると後
側単語303を参照することができ、逆に後側単語30
3が決まれば前側単語301を参照することができる。
【0019】図4は、本発明になる文字入力装置におけ
る変換処理手順を示すフローチャートである。ユーザー
が入力手段1を操作してピン音の読み文字列を入力する
と、変換結果作成手段7は、ステップ403とステップ
405を繰り返してスペースが入力されるまで該ピン音
の読み文字列を取得する。ユーザーがスペースバーを押
してスペースを入力(変換を指示)すると、変換結果作
成手段7は、ステップ407に移行して辞書検索手段5
を機能させ、入力されている読み文字列を検索子として
用語辞書3を検索して中国語単語に変換する。単語の検
索は1単語のみでなく、複数文節分を一度に検索する。
【0020】次に、ステップ409で変換結果、すなわ
ち辞書検索結果を変換候補として表示手段13に表示
し、ユーザーによる選択入力を待つ。ユーザーは表示手
段13に表示された変換候補の選択あるいは候補の確定
の操作を行う。候補の選択は、中国語にも日本語と同様
に多くの同音異表記の語があり、100%正しい変換を
行うことは困難であることから、複数の変換候補を表示
してユーザーによる選択が必要である。変換候補の表示
と選択入力は日本語入力装置におけるかな漢字変換入力
と同様の技術で実現することができる。
【0021】ステップ409において、アルファベット
のキーが押された場合には、新たな読みの入力と判断し
てステップ411に移行する。このとき入力されたキー
(ピン音)は次のステップ403で読み文字列を入力す
る際に読み文字として使用する。
【0022】ステップ411では、ユーザーが選択した
単語列あるいは検索処理407で検索して表示した変換
候補の第1候補の単語列を、確定した中国語文字列とし
て表示手段13に出力する。
【0023】本発明になる文字入力装置の特徴は、変換
し、確定した後も変換結果に関する情報(読みと表記)
を保持し、それ以降の変換処理に利用する点である。
【0024】以下の説明では、まず、基本的な変換処理
を実現するためのデータ構造と変換候補作成の流れを説
明し、その後、変換結果の待避と再利用について説明す
る。
【0025】最初に、ステップ409の変換候補の作成
処理について詳細に説明する。変換候補の作成に当た
り、変換結果作成手段7は、辞書検索結果を1単語の読
み文字列単位に分割して複数のテーブルに保持する。1
つのテーブルには読み文字列と同音の単語表記(中国語
単語=漢字)のリストを保持しており、候補リストと呼
ばれる。複数文節の辞書検索ならびに変換候補の作成を
行うため、各候補リストは相互の前後関係を示すポイン
ターを持っている。
【0026】図5は、前記候補リストの構造を示してい
る。この候補リスト501において、509は辞書で一
致した読み文字列である。513は、その読み文字列5
09に対応する単語表記へのポインタ配列である。ポイ
ンタ配列513の末尾はNull(0)である。511
は、現在ユーザーが選択している(もしくはデフォルト
の)単語表記ポインタの配列番号である。また、503
はユーザーが変換候補の選択を行ったかどうかを保持す
るユーザー選択有無フラグである。505は、読み文字
列509の前の読み文字列に対応する候補リスト501
を指す前候補ポインタである。また、507は、読み文
字列509の後の読み文字列に対応する候補リスト50
1を指す後候補ポインタである。前(または後)に続く
読み文字列が無い場合にはNull(0)である。
【0027】図6は、3文節の読み文字列“san ba s
an"をまとめて変換した場合の候補リスト501の例を
示している。各候補リスト501a,501b,501
cはポインターで相互に参照できるようになっている。
なお、以下の説明の都合上、接続関係にある候補リスト
501を候補リスト列と呼び、候補リスト501aのよ
うに読み文字列の先頭を含む変換単位の候補リストを先
頭の候補リスト、候補リスト501bのように読み文字
列の末尾を含む変換単位の候補リストを末尾の候補リス
トと呼ぶ。
【0028】候補リスト501のポインタ配列513
は、候補の確からしさに基づいて順序付けするが、その
具体的な処理は、図4の検索処理(ステップ407)で
行っている。その処理の流れを図7を用いて説明する。
【0029】辞書検索処理407では、まず、ステップ
701において、入力された読み文字列に対して、先頭
から最長一致する用語辞書3の読み文字列を検索する。
次に、ステップ703において、一致した読み文字列に
対応する単語へのポインタを取得し、用語辞書3の登録
順で候補リスト501のポインタ配列513にセットし
ていく。その後、ステップ705において、現在の検索
を行う前に作成された候補リスト501を参照して、変
換結果の単語の第1候補(図5に示した候補リスト50
1のポインタ513aで指示される)を取得する。変換
対象の読み文字列が、入力された読み文字列の先頭であ
った場合には、後述する変換履歴保持手段11に保持さ
れている候補リスト501を参照して同様に取得する。
【0030】そして、ステップ707において、ステッ
プ705で取得した単語とステップ703で得られた単
語の組み合わせを共起辞書9で検索し、一致するものが
あるかどうかを調べる。一致する単語の組み合わせがあ
れば、ステップ709で該当する単語のポインタをポイ
ンタ配列513の先頭に移動する。該当するものが複数
ある場合には、該当する単語の辞書順に並べる。
【0031】その後、ステップ711で残りの読み文字
列があるかどうかを調べ、残りがある場合にはステップ
701に戻り、残りの読み文字列に対してステップ70
1〜ステップ711の処理を繰り返す。
【0032】次に、候補リスト501の情報の待避につ
いて詳細に説明する。
【0033】本発明になる文字入力装置の処理手順で
は、ステップ411で確定文字列を出力する際に、ステ
ップ407で作成した候補リスト列を変換履歴保持手段
11に移動して待避させる。変換履歴保持手段11に
は、図8に示すように、末尾候補リストポインタ801
があり、候補リスト列を移動するときに末尾の候補リス
ト501へのポインタがセットされる。この待避情報の
参照は、前述した図7の処理におけるステップ705で
行う。すなわち、入力された読み文字列の先頭であった
場合には、この末尾候補リストポインタ801を参照し
て待避されている候補リスト列の末尾の候補リスト50
1を参照する。
【0034】この実施形態においては、変換履歴保持手
段11に新しい候補リスト列を移動する際に、それまで
保持していた古い候補リスト501があればそれを消去
する。しかし、過去の候補リスト501を消去せずに複
数の候補リストを時系列的に保持しておくこともでき
る。過去の変換結果を数多く残しておくことで、隣接し
ていない単語の共起関係まで評価することも可能にな
る。
【0035】ここで、本発明になる文字入力装置におけ
る変換処理の具体的に説明する。なお、以下の説明にお
いて、用語辞書3には図2に示した順で読み文字列“b
a”,“san”に対応した単語が登録されており、共
起辞書9には、図3に示したように“把”―“傘”の対
応関係が記憶されているものとする。そして、ユーザー
が電源投入後に、“三把傘”という漢字文字列を入力す
るために、“san”〈スペースキー〉“ba”〈スペ
ースキー〉“san”〈スペースキー〉と入力した場合
を例示する。
【0036】図9は、入力手段1からのユーザーの入力
と、候補リストの内容と、変換履歴保持手段11に待避
している候補リスト501の内容を示している。説明の
都合上、図面には候補リスト501のポインタ配列51
3が示す単語を直接記述している。
【0037】最初の“san”〈スペースキー〉の入力
では、変換履歴保持手段7にはまだ何も記憶されていな
い。したがって、検索処理407の処理においても共起
関係は存在せず、辞書順に候補リストが作成される。こ
の例では目的語が“三”であるので“三”を選択する。
次に、“ba”〈スペースキー〉の入力では、変換履歴
保持手段7に待避されている“三”に対する共起関係を
検索する。この場合は共起関係が辞書に存在せず、辞書
順に候補リストが作成される。更に、“san”<スペ
ースキー>の入力を行うと、変換履歴保持手段7に待避
されている“把”に対する共起関係を検索する。この場
合は“把”―“傘”の共起関係が辞書にあるために、
“傘”を優先して候補リストの上位に移動する。このよ
うに、共起関係を評価して変換候補を作成することがで
きる。
【0038】このような変換処理を従来の文字入力装置
で行うと、後の読み“san”の変換候補を作成すると
きに、その前に入力された“把”は評価できないため
に、最適な変換候補“傘”を優先させることはできな
い。
【0039】このように、本発明になる文字入力装置で
は、変換を指示されるまでに入力された読み文字列だけ
でなく、それ以前に変換した結果を利用して変換候補を
作成することにより、共起関係の評価のような文法処理
を有効に機能させることが可能となり、より目的に近い
変換候補を作成することができる。
【0040】
【発明の効果】以上に説明したような制御処理により、
本発明になる文字入力装置は、読み文字列を中国語単語
に変換し、変換結果を確定した後もその変換結果に関す
る情報(読み文字列と表記)を保持してそれ以降の変換
処理に利用することにより、尤度の高い変換を行うこと
ができるようになる。
【図面の簡単な説明】
【図1】本発明の一実施形態を示す文字入力装置のブロ
ック図である。
【図2】図1に示した文字入力装置における用語辞書の
説明図である。
【図3】図1に示した文字入力装置にける共起辞書の説
明図である。
【図4】本発明になる文字入力装置における変換処理の
フローチャートである。
【図5】本発明になる文字入力装置における変換候補の
リストの構造説明図である。
【図6】本発明になる文字入力装置において複数文節の
変換候補を検索したときのリスト相互の接続関係の説明
図である。
【図7】図4に示した変換処理における辞書検索および
変換候補作成処理の詳細なフローチャートである。
【図8】図1に示した文字入力装置における変換履歴保
持手段の構成の説明図である。
【図9】本発明になる文字入力装置における変換例の説
明図である。
【符号の説明】
1…入力手段、3…用語辞書、5…辞書検索手段、7…
変換結果作成手段、9…共起辞書、11…変換履歴保持
手段、13…表示手段。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 隈井 裕之 神奈川県横浜市戸塚区吉田町292番地 株 式会社日立製作所マルチメディアシステム 開発本部内

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】文字を入力する入力手段と、ピン音と該ピ
    ン音に対する中国語単語を格納した用語辞書と、ピン音
    に対する中国語単語を前記用語辞書から検索する辞書検
    索手段と、前記入力手段から入力された文字や検索され
    た中国語単語や選択された中国語単語を表示する表示手
    段と、前記入力手段から入力されたピン音を取得して前
    記辞書検索手段に前記用語辞書から対応する中国語単語
    を検索させ、検索された中国語単語を変換候補として前
    記表示手段に表示して目的の中国語単語を前記入力手段
    から選択させることで選択された中国語単語を前記入力
    されたピン音に対する最終的な変換結果として前記表示
    手段に表示させ変換結果作成手段を備えた文字入力装置
    において、 中国語単語と該単語の前後に接続する可能性が高い中国
    語単語を関連付けて格納する共起辞書と、入力手段から
    の入力によって変換候補の中から選択されて確定した前
    記中国語単語を保持する変換履歴保持手段とを設け、 前記変換結果作成手段は、前記辞書検索手段によって検
    索した中国語単語と前記変換履歴保持手段に保持してい
    る中国語単語との接続性を前記共起辞書を参照して評価
    することにより、接続性が高い中国語単語を優先度の高
    い変換候補として前記表示手段に表示させるようにした
    ことを特徴とする文字入力装置。
  2. 【請求項2】請求項1において、前記変換履歴保持手段
    は、変換候補の中から選択されて確定した中国語単語と
    その読み文字列の組み合わせを保持することを特徴とす
    る文字入力装置。
  3. 【請求項3】請求項1または2において、前記変換履歴
    保持手段は、電源投入時に初期化することを特徴とする
    文字入力装置。
  4. 【請求項4】請求項1〜3の1項において、前記変換結
    果作成手段は、変換候補から選択された中国語単語を確
    定するときに該中国語単語の情報を変換履歴保持手段に
    格納することを特徴とする文字入力装置。
  5. 【請求項5】請求項1〜3の1項において、前記変換結
    果作成手段は、変換候補から選択された中国語単語の情
    報を変換履歴保持手段に時系列的に格納することを特徴
    とする文字入力装置。
  6. 【請求項6】請求項1〜3の1項において、前記変換結
    果作成手段は、変換候補から選択された中国語単語の情
    報を変換履歴保持手段に格納するときに古い情報を消去
    することを特徴とする文字入力装置。
JP9141560A 1997-05-30 1997-05-30 文字入力装置 Pending JPH10334085A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9141560A JPH10334085A (ja) 1997-05-30 1997-05-30 文字入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9141560A JPH10334085A (ja) 1997-05-30 1997-05-30 文字入力装置

Publications (1)

Publication Number Publication Date
JPH10334085A true JPH10334085A (ja) 1998-12-18

Family

ID=15294814

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9141560A Pending JPH10334085A (ja) 1997-05-30 1997-05-30 文字入力装置

Country Status (1)

Country Link
JP (1) JPH10334085A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007058860A (ja) * 2005-08-25 2007-03-08 Yu-Chih Cheng 漢字後続文字入力法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007058860A (ja) * 2005-08-25 2007-03-08 Yu-Chih Cheng 漢字後続文字入力法

Similar Documents

Publication Publication Date Title
US6490563B2 (en) Proofreading with text to speech feedback
US8346537B2 (en) Input apparatus, input method and input program
JPH03224055A (ja) 同時通訳向き音声認識システムおよびその音声認識方法
US10614065B2 (en) Controlling search execution time for voice input facility searching
JPH10334085A (ja) 文字入力装置
JP3758241B2 (ja) 音声情報検索装置
JPH1063651A (ja) 中国語入力装置
JPH0630052B2 (ja) 音声認識表示装置
JPH0380363A (ja) 文書処理装置
JP2668205B2 (ja) 文章検索装置
JP2001051992A (ja) 日本語統計データ作成装置および方法、並びにディクテーションシステム
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JPH0350669A (ja) 情報処理装置
JPH05282293A (ja) 文書作成装置
JPS60112175A (ja) 仮名漢字変換装置における略称語変換方式
JPS62282364A (ja) 文字列検索方式
JPH11312158A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JP2001125907A (ja) 辞書検索方法、装置、および辞書検索プログラムを記録した記録媒体
JPH08129545A (ja) 文字列変換方法及び文書作成装置
JPH10154141A (ja) かな漢字変換装置
JP2004086449A (ja) 不完全または曖昧な音声表記入力のための比較機能を有する中国語音声表記入力装置およびその方法
JPH0981555A (ja) 文書処理装置及びその方法
JPS6198475A (ja) 日本語文章入力装置
JPS6024630A (ja) 制御情報付きカナ文字列形成方式
JPH09245023A (ja) 情報処理装置