JP3893709B2 - 文字列変換装置および方法、仮名漢字変換装置、文章校正装置並びにそのプログラムを記録した記録媒体 - Google Patents

文字列変換装置および方法、仮名漢字変換装置、文章校正装置並びにそのプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP3893709B2
JP3893709B2 JP34720697A JP34720697A JP3893709B2 JP 3893709 B2 JP3893709 B2 JP 3893709B2 JP 34720697 A JP34720697 A JP 34720697A JP 34720697 A JP34720697 A JP 34720697A JP 3893709 B2 JP3893709 B2 JP 3893709B2
Authority
JP
Japan
Prior art keywords
notation
character string
word
parallel
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP34720697A
Other languages
English (en)
Other versions
JPH11161646A (ja
Inventor
泰男 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP34720697A priority Critical patent/JP3893709B2/ja
Publication of JPH11161646A publication Critical patent/JPH11161646A/ja
Application granted granted Critical
Publication of JP3893709B2 publication Critical patent/JP3893709B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文字列変換装置および方法、仮名漢字変換装置、文章校正装置並びにそのプログラムを記録した記録媒体に関し、詳しくは文字列を入力し、変換しようとする語を予め格納した辞書を参照して該辞書に記憶された複数の表記候補の中から1の表記を選択し、前記入力された文字列を変換する技術に関する。
【0002】
【従来の技術】
入力された文字列を所定の文字列に変換して出力する文字列変換装置が種々提案されている。このような装置においては、1つの入力文字列に対して、複数の変換候補となる文字列を予め辞書に格納しておき、変換の際これらを主候補および次候補として表示する構成を採っている。例えば、「校正」と「構成」のような同音異義語については勿論のこと、「猫」と「ネコ」、「売り上げ」と「売上げ」、「ベニス」と「ヴェニス」、「電話」と「TEL」のような同じ読みに対して異なる表記を有する語についてそれぞれ複数の候補表記を辞書に記憶している。従って、文書を作成する使用者は、表示される多数の候補表記の中から、文書の用途や文章中での使用箇所に応じた最適な表記を自由に選択し、所望の文字列を得ることができる。
【0003】
このような文字列変換装置では、いわゆる学習機能を備え、変換後に表示された変換候補のうち使用者の選択により決定された候補を、次回以降の変換において優先的に表示される候補として辞書に記憶する構成を採る。従って、同音同義語や異音同義語を有する文字列を、同一の文章において何回も入力する場合であっても、第2回目以降の変換の際には、変換後に次候補を選択することなく前回選択した表記と同一表記の単語を得ることが可能となる。
【0004】
【発明が解決しようとする課題】
しかし、文書の作成に際しては、2以上の異なる語について、各語の表記種類を統一したい場合がある。例えば、「犬と猫」のような並列関係にある場合の「犬」および「猫」や、「彼は母を彼女に」のような主格,対格,方向格の関係にある場合の「彼」,「母」および「彼女」、「売り上げた額は買い上げた額よりも多い」のような比較関係にある場合の「売り上げ」および「買い上げ」等については(以下このような関係にある語を「関係語」という)、各語の文字種や送り仮名の用い方が統一されていることが望ましい。
【0005】
かな文字列を仮名漢字混じり文字列に変換して表示する従来の仮名漢字変換装置では、各関係語のそれぞれについて、主候補となる表記が変換後に最初に表示される。従って、各関係語についてそれぞれ異なる種類の表記が主候補として辞書に記憶されているような場合には、各関係語について個々に次候補の選択を行なわなければならず、変換後の文字列の決定に伴う使用者の作業負担は多大であった。
【0006】
また、関係語であっても文章中の特定の箇所については他の箇所と異なる種類の表記で表現したい場合がある。例えば会話文において、会話する者を子供と想定している場合には、年齢や境遇等を考慮すると「犬と猫」よりも「イヌとネコ」と表現した方が適切である。このような場合、従来の仮名漢字変換装置では、たとえ各関係語のそれぞれについての主候補が同じ種類の表記で辞書に記憶されていても、文中に各語が出現する度に次候補の選択を行なう必要があった。
【0007】
一方、入力文字列のうち範囲指定された部分につき、これを他の文字列に変換する文章校正装置においては、同一の単語同士の間では、文末の文体チェックやスペルの誤り等を修正することにより、単語間における表記の種類を統一することはできたが、関係語のような異なる単語の間においてその表記の種類を統一することはできなかった。また、関係語について、文章中の特定の箇所については他の箇所と異なる種類の表記としたい場合には、入力文字列に対して、表記の種類を変更すべき校正範囲を表記の種類を統一すべき校正範囲とは別に指定するか、または一括指定された範囲にある各関係語のそれぞれについて、個別に適当な表記を選択しなければならなかった。
【0008】
本発明の文字列変換装置および方法、並びにその処理を実行するためのプログラムを記録した記録媒体は、こうした問題を解決し、所望の文字列を得るために使用者が要する作業労力を軽減して使い勝手を向上することを目的としてなされ、次の構成を採った。
【0009】
【課題を解決するための手段およびその作用効果】
本発明の文字列変換装置は、
文字列を入力し、変換しようとする語を予め格納した辞書を参照して該辞書に記憶された複数の表記候補の中から1の表記を選択し、前記入力された文字列を変換する文字列変換装置であって、
前記入力された文字列の中から所定の関係にある2以上の異なる語を検索する関係語検索手段と、
該関係語検索手段により検索された1の語について、前記複数の表記候補の中から1の表記を選択する表記選択手段と、
該表記選択手段により選択された表記に従って、前記関係語検索手段により検索された2以上の異なる語のうち前記選択された1の語以外の語について、その表記を決定する表記決定手段とを備えたことを要旨とする。
【0010】
また、本発明の文字列変換方法は、
文字列を入力し、変換しようとする語を予め格納した辞書を参照して該辞書に記憶された複数の表記候補の中から1の表記を選択し、前記入力された文字列を変換する文字列変換方法であって、
前記入力された文字列の中から所定の関係にある2以上の異なる語を検索し、該検索された1の語について、前記複数の表記候補の中から1の表記を選択し、
該選択された表記に従って、前記検索された2以上の異なる語のうち前記選択された1の語以外の語について、その表記を決定することを要旨とする。
【0011】
かかる文字列変換装置および文字列変換方法では、入力された文字列の中から所定の関係にある2以上の異なる語(関係語)の検索を行ない、この関係語のうち1の語について、辞書に格納された複数の表記候補中から1の表記を選択し、この選択された表記に従って、関係語のうち前記1の語以外の語についての表記を決定して、文字列の変換を行なう。
【0012】
所定の関係には、「犬と猫」や「犬および猫」のように名詞を並列助詞や並列接続詞でつなぐ並列関係である場合や、「彼は母を彼女に」のように名詞と格助詞との結合がそれぞれ主格,対格,方向格の関係である場合、「売り上げた額は買い上げた額よりも多い」のような比較関係である場合等が考えられる。但し、本例示に限られるものではなく、語意,外観,称呼上や文法上若しくは俗語慣習上、異なる語の間で一定の関係が認められるものであれば足りる。また、関係語の検索は、連続した文節間のみならず、修飾語を挟む場合や文を跨ぐ場合等のように関係語の存在する文節が離間している場合であっても、行なうことができる。
【0013】
以上のような構成を採用することにより、異なる語の間であっても各語を統一された表記に変換することができるので、使用者は各語ごとに何回も次候補の選択をする必要がなく、容易に所望の文字列を得ることができる。
【0014】
辞書に格納する各語について、文字情報とともに各語の属するカテゴリーを記憶しておき、関係語のカテゴリーが同じである場合にのみ関係語の検索を行なう構成を採ることも好適である。文型上、並列などの関係が存在しても、表記を統一することが望まれない場合もあるからである。こうした事例には種々のケースが考えられるが、ひとつには、「人の名前」と「動物の名前」のように2以上の語が異なるカテゴリーに属する場合がある。このような場合、本構成によれば、関係語であっても各語の表記を統一せず、カテゴリーを同じくする関係語のみについて各語の表記を統一する。従って、本構成を採ることによって、実際の使用場面に一層即した文章を得ることができる。
【0015】
また、本発明の第1のコンピュータ読み取り可能な記録媒体は、
文字列を入力し、変換しようとする語を予め格納した辞書を参照して該辞書に記憶された複数の表記候補の中から1の表記を選択し、前記入力された文字列を変換するためのコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記入力された文字列の中から所定の関係にある2以上の異なる語を検索する機能と、
該検索された1の語について、前記複数の表記候補の中から1の表記を選択する機能と、
該選択された表記に従って、前記検索された2以上の異なる語のうち前記選択された1の語以外の語について、その表記を決定する機能とをコンピュータに実現させるためのコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体である。
【0016】
かかる記録媒体をコンピュータに読み取らせることにより、入力された文字列の中から所定の関係にある2以上の異なる語を検索し、検索された1の語について選択された表記に従って、他の語の表記を決定する処理が実行されるので、2以上の異なる語の間における表記が統一された文字列を変換後の文字列として得ることができる
【0017】
なお、記録媒体としては、フレキシブルディスクやCD−ROM、光磁気ディスク、ICカード、ROMカートリッジ、パンチカード、バーコードなどの符号が印刷された印刷物、コンピュータの内部記憶装置(RAMやROMなどのメモリ)および外部記憶装置等の、コンピュータが読取り可能な種々の媒体を利用できる。
【0018】
本発明の仮名漢字変換装置は、文字列を入力し、該入力された文字列を文節分かち書きして、得られた各文節について予め辞書に記憶された複数の表記候補の中から1の表記を選択し、前記文節分かち書きされた文字列を仮名漢字混じり文字列に変換する仮名漢字変換装置であって、
前記文節分かち書きされた文字列の中から所定の関係にある2以上の異なる語を検索する関係語検索手段と、
該関係語検索手段により検索された1の語について、前記複数の表記候補の中から1の表記を選択する表記選択手段と、
該表記選択手段により選択された表記に従って、前記関係語検索手段により検索された2以上の異なる語のうち前記選択された1の語以外の語について、その表記を決定する表記決定手段と、
前記表記選択手段により選択された表記と前記表記決定手段により決定された表記を表示する表示手段とを備えたことを要旨とする。
【0019】
かかる仮名漢字変換装置では、仮名漢字変換の過程において文節分かち書きされた文字列の中から所定の関係にある2以上の異なる語(関係語)の検索を行ない、この関係語のうち1の語について、辞書に格納された複数の表記候補の中から1の表記を選択し、この選択された表記に従って、関係語のうち前記1の語以外の語についての表記を決定して、仮名漢字混じり文字列への変換を行なう。
【0020】
本発明では、文節分かち書きされた文字列に対して関係語の検索を行なうこととしているが、文節分かち書きされる前の文字列に対して関係語の検索を行なう構成としても差し支えない。また選択および決定された表記での関係語の表示は、文節分かち書きされた文字列が初めて表示される際に行なわれるものに限らず、関係語について初回表示に対する次候補が選択され、この選択された次候補を表示する際に行なわれるものも含まれる。この場合、次候補が選択された1の関係語以外の関係語について、決定された表記を表示する時期は特に限定されず、次候補が選択された1の関係語の表記が未確定の時点で表示するものであっても、表記が確定された時点で表示するものであってもよい。
【0021】
このような仮名漢字変換装置としての構成を採用することにより、文節分かち書きと同時に、異なる語の間で表記が統一された状態の仮名漢字混じり文字列を得ることができる。また、関係語の1つについて次候補が選択されると、この選択された表記に従って他の関係語の表記も変更されるので、使用者は関係語のそれぞれについて次候補の選択を行なう必要がない。
【0022】
また、本発明の第2のコンピュータ読み取り可能な記録媒体は、
文字列を入力し、該入力された文字列を文節分かち書きして、得られた各文節について予め辞書に記憶された複数の表記候補の中から1の表記を選択し、前記文節分かち書きされた文字列を仮名漢字混じり文字列に変換するためのコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記文節分かち書きされた文字列の中から所定の関係にある2以上の異なる語を検索する機能と、
該検索された1の語について、前記複数の表記候補の中から1の表記を選択する機能と、
該選択された表記に従って、前記検索された2以上の異なる語のうち前記選択された1の語以外の語について、その表記を決定する機能と、
前記選択された表記と前記決定された表記を表示する機能とをコンピュータに実現させるためのコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体である。
【0023】
本発明の文章校正装置は、文字列を入力し、予め辞書に記憶された複数の表記候補を参照して、前記入力された文字列を所望の表記の文字列に変換する文章校正装置であって、
前記入力された文字列について校正を行なう範囲を指定する校正範囲指定手段と、
該校正範囲指定手段により指定された範囲の中から所定の関係にある2以上の異なる語を検索する関係語検索手段と、
該関係語検索手段により検索された1の語について、前記複数の表記候補の中から1の表記を選択する表記選択手段と、
該表記選択手段により選択された表記に従って、前記関係語検索手段により検索された2以上の異なる語のうち前記選択された1の語以外の語について、その表記を決定する表記決定手段とを備えたことを要旨とする。
【0024】
かかる文章校正装置では、指定された校正範囲の中から関係語を検索し、このうち1の関係語についての表記を選択することにより、この選択された表記に従って他の関係語についての表記を決定し、この決定された表記に基づいて、指定された範囲に存在する各関係語について校正を行なう。従って、使用者は、校正を指定した範囲に存在する関係語のいずれか1つについてのみ所望する表記への校正指示を行なえばよく、校正を指定した範囲に存在する関係語のそれぞれについて校正指示を行なう必要がない。
【0025】
関係語の検索は、前述した並列関係にある関係語に限定して検索するものであってもよい。並列関係にあるか否かは、関連語同士を接続する語の情報に着目すれば、判断することができる。但し、並列関係を表わす文字等は文法上の並列助詞や並列接続詞に限るものではなく、文字列変換装置において並列関係を意味するものと定義された全ての文字,図形,記号等を含む。例えば、「、(読点)」や「・(中点)」、「,(コンマ)」、「=(等号)」、「…(点線)」、「−(ハイフン)」等で結合されている場合も並列関係に該当し得る。文章の作成に伴う並列助詞や並列接続詞の使用頻度は高いので、本構成によっても使用者の次候補選択労力を十分に軽減でき、使い易さを実現することができる。
【0026】
一文を単位として関係語の検索を行なう構成とすることも好適である。この構成によれば、文を跨いで関係語の検索を行なうことがないので、使用者は、同一の関係語であっても、文の種類に応じて適切に統一された表記を得ることができる。勿論、章や節,段落等のような一文よりも大きい単位や所定の関係ごとのような一文よりも小さい単位で関係語の検索を行なう構成としても差し支えない。
【0027】
特に、本構成を仮名漢字変換装置に採用すれば、ある文に存在する関係語については局所的に他の文と異なる表記を採用したいような場合にも、使用者はスムーズに所望の表記を得ることができる。また、本構成を文章校正装置に採用すれば、校正が指定された範囲内に存在する複数の文に、同一の関係語が存在する場合であっても、当該関係語について文単位で別々に所望の表記に校正することができる。従って、使用者は、文ごとに校正範囲を指定し直す必要がない。
【0028】
【発明の他の態様】
本発明の他の第1の態様としては、コンピュータに上記の発明の各工程または各手段の機能を実現させるコンピュータプログラムを通信経路を介して供給するプログラム供給装置としての態様がある。こうした態様では、プログラムをネットワーク上のサーバなどに置き、通信経路を介して、必要なプログラムをコンピュータにダウンロードし、これを実行することで、上記の文字列変換装置や文字列変換方法を実現することができる。
【0029】
本発明の他の第2の態様としては、文字列を入力し、文字列を入力し、予め辞書に記憶された複数の表記候補を参照して、前記入力された文字列を所望の表記の文字列に変換するためのコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記入力された文字列について校正を行なう範囲を指定する機能と、
該指定された範囲の中から所定の関係にある2以上の異なる語を検索する機能と、
該検索された1の語について、前記複数の表記候補の中から1の表記を選択する機能と、
該選択された表記に従って、前記検索された2以上の異なる語のうち前記選択された1の語以外の語について、その表記を決定する機能とをコンピュータに実現させるためのコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体としての態様がある。
【0030】
【発明の実施の形態】
以上説明した本発明の構成および作用を一層明らかにするために、以下本発明の実施の形態を実施例に基づき説明する。図1は本発明の好適な一実施例である仮名漢字変換装置において、仮名漢字変換制御ロジックが実際に動作するハードウェアの構成を示すブロック図である。図1に示すように、本実施例の仮名漢字変換装置は、マウス33,キーボード24,CD−ROMドライブ34,ハードディスク32,モデム37,CRT26およびプリンタ28などを周辺機器として備えたコンピュータ38上で実現される。
【0031】
コンピュータ38は、各種演算処理を実行するためのCPU21を中心に、バス31により相互に接続された次の各部を備えている。ROM22は、CPU21で各種演算処理を実行するのに必要な仮名漢字変換に関わるプログラムやデータなどを予め格納しているメモリであり、RAM23は、同じくCPU21で各種演算処理を実行するのに必要な仮名漢字変換に関わる各種データを一時的に格納するためのメモリである。入力インタフェース25は、キーボード24やマウス33からのキー信号の入力を司る。CRTコントローラ(CRTC)27は、カラー表示可能なCRT26への信号出力を制御し、出力インタフェース29は、プリンタ28へのデータの出力を制御する。ディスクコントローラ(DDC)30は、ハードディスク32やCD−ROMドライブ14あるいは図示していないフレキシブルドライブとの間のデータの授受を制御する。
【0032】
ハードディスク32には、RAM23にロードされて実行される各種プログラムやデバイスドライバの形式やモジュールの形式で提供される仮名漢字変換処理プログラム、あるいは各種変換辞書などが記憶されている。また、CD−ROM35やフレキシブルディスク(図示せず)にも、上記したと同様な各種プログラムや必要なデータなどを記憶しておき、これら各種プログラムやデータを、CD−ROMドライブ34やフレキシブルドライブなどを介して、CD−ROM35やフレキシブルディスクよりロードすることにより、コンピュータ38に実行させることも可能である。
【0033】
また、バス31には、シリアル入出力インタフェース(SIO)36が接続されている。このSIO36は、モデム37に接続されており、モデム37を介して、公衆電話回線PTLに接続されている。コンピュータ38は、この公衆電話回線PTLを介して、外部のネットワークNWに接続可能であり、特定のサーバSVにアクセスすることにより、必要なプログラムやデータをハードディスク32にダウンロードすることも可能である。
【0034】
このように構成されたハードウェアにより、文字列の入力、仮名漢字変換、編集、表示、印刷などがなされる。すなわち、キーボード24から入力された文字列は、ハードディスク32に記憶した各種データを参照しながらCPU21により所定の処理がなされ、RAM23の所定領域に格納され、CRTC27を介してCRT26の画面上に表示される。
【0035】
次に、こうして構成されたハードウェアにより実行される仮名漢字変換処理の詳細について説明する。図2は、本実施例の仮名漢字変換装置が実行する処理の全体構成を示すブロック図である。仮名漢字変換の大まかな処理手順は、次の通りである。キーボード24等の入力手段INから仮名文字列を入力した後、仮名漢字変換実行キーを操作すると、所定の割り込み処理が起動される。この割り込み処理の起動によって、仮名文字列を入力し、辞書を参照して文節分かち書き、候補単語の検索、並列関係にある語(以下、並列関係語と略す)についての表記の統一等を行なって、入力した仮名文字列を仮名漢字混じり文字列に変換して表示する一連の処理が実行される。この処理は、MS−DOSでは、デバイスドライバが起動されることにより行なわれる。もとより、仮名漢字変換を1つのアプリケーション(インプットメソッド)が行なうものとし、変換結果を、必要とするアプリケーションに引き渡す構成としても差し支えない。この場合には、キーボード24からの入力をインプットメソッドが一括して引き受けることになる。
【0036】
使用者によって仮名漢字変換実行キーが操作されることにより、入力手段INによって入力された仮名文字列は変換手段に渡される。変換手段は、文節分かち書き変換モジュールBW、並列表記統一モジュールHTおよび次候補変換モジュールJIという3つのモジュールによって構成されており、変換手段に渡された仮名文字列は、まず、文節分かち書き変換モジュールBWに送出される。
【0037】
文節分かち書き変換モジュールBWでは、辞書に格納された単語情報を参照して、受け取った仮名文字列を文節単位に分かち書きし、各文節を仮名漢字混じり文字列に変換する処理、および各文節について次候補となる候補単語を抽出し、次候補の選択に備えて格納する処理が実行される。複数の表記が想定される単語については、複数の表記の全てを派生表記として辞書内に記憶している。このような場合には、第1候補として辞書に記憶された表記が選択される。
【0038】
以下、辞書の構造について説明する。辞書は、キーボードから入力された文字列を漢字やひらがな文字、カタカナ文字等に変換するための情報を予め格納している。辞書は、ヘッダとインデックス部と辞書本体から構成される。ヘッダは、辞書自体を管理するための情報である。インデックス部には、辞書本体に格納された各単語を検索するための見出しが五十音順に設定されている。辞書本体には、インデックス部の各見出しに対応する単語データが、具体的には、各単語の読み,表記,品詞等についての情報が格納されている。従って、ある単語についての見出し語をインデックス部の見出しによって検索することによって、辞書本体に存在するその単語に関する読み,表記,品詞等の情報を読み出すことができる。
【0039】
辞書本体には、始めに読み情報と表記情報が記録され、その後に品詞情報が記録されている。通常、1つの読みに対して考えられる表記は複数存在し得るので、1つの読み情報に対しては、複数の表記情報を表記の種類ごとに格納している。この表記の種類は、文字の種類や文字の用い方によって分類されており、例えば、「いぬ」という読みに対応する表記には、「犬」という漢字表記、「イヌ」というカタカナ表記、「いぬ」というひらがな表記があり、この3種類の表記が「いぬ」という読み情報に対応する表記情報として格納されている。この各種類の表記を派生表記という。各派生表記には、各派生表記毎に固有の1バイトの数値が付与されており、この値を読み取ることによって、表記の種類を区別することが可能となる。勿論、派生表記の数が少ない場合には、1バイトのうちの上位4ビットや下位4ビットのみを用いて数値を設定することも可能である。
【0040】
品詞情報は通常複数あり、その語の意味上の役割(人名、役職、住所、動物・・・・等)を示す意味情報や、活用形、活用語尾長、連語品詞、短文品詞、特殊品詞など様々な情報が記憶されている。
【0041】
これらの処理の終了後、変換された仮名漢字混じり文字列は、文節分かち書き変換モジュールBWから並列表記統一モジュールHTに渡される。並列表記統一モジュールHTでは、受け取った仮名漢字混じり文字列から並列関係語を抽出し、単語情報の1つとして辞書に格納された単語の意味を表わす情報や派生表記に関する情報を参照して、抽出された並列関係語の表記として同じ種類の表記を選択し、受け取った文字列中の並列関係語の表記を選択された表記に置き換える処理が実行される。なお、どの文節のどの語が並列関係語として抽出されたかについての情報は、次候補の選択に備えて記憶領域に格納される。これらの処理の終了後、並列関係語の表記が統一された仮名漢字混じり文字列は、並列表記統一モジュールHTから表示手段DPに渡され、文節単位に区分けされた態様でCRT26等の表示手段DP上に表示される。
【0042】
未確定の仮名漢字混じり文字列に対し、入力手段INによって次候補選択キーの入力がされると、指定された文節に対して次候補を選択し、もとの文節候補と置き換える次候補変換処理が起動する。この起動によって、カーソルで指定された文節につき、その位置情報が、次候補変換モジュールJIに渡される。次候補変換モジュールJIでは、先に文節分かち書き変換モジュールBWで抽出および格納された候補単語のうち、指定された位置の文節に対する候補単語を、次候補として抽出し、使用者によって選択された次候補を次候補選択前の文節と置き換える処理が行なわれる。
【0043】
これらの処理の終了後、置き換えられた文節の表記に関する情報が、次候補変換モジュールJIから並列表記統一モジュールHTに渡される。並列表記統一モジュールHTでは、先に記憶領域に格納された、仮名漢字混じり文字列中の並列関係語とこの語が存在する文節位置についての情報から、次候補に置き換えられた文節内に並列関係語が含まれているか否かが判断される。並列関係語が含まれている場合には、この並列関係語と並列関係にある他の並列関係語の表記として、次候補に置き換えられた文節の表記と同じ種類の表記を選択し、もとの表記と置き換える処理が行なわれる。これらの処理の終了後、表記が置き換えられた文節につき、置き換え後の仮名漢字混じり文字列が、並列表記統一モジュールHTから表示手段DPに渡され、CRT26等の表示手段DP上に表示される。
【0044】
以上説明した文節分かち書き変換モジュールBW、並列表記統一モジュールHTおよび次候補変換モジュールJIの各モジュール内で、それぞれ仮名漢字変換処理、並列表記統一処理および次候補処理がCPU21により行なわれる。この一連の仮名漢字変換処理、次候補処理および並列表記統一処理の全体的な処理手順について、図3のフローチャートに基づいて説明する。図3は、本実施例における仮名漢字変換処理ルーチンの概略を示すフローチャートである。この処理ルーチンは、キーボード24から一ないし複数の仮名文字が入力された後、変換キー(例えば「スペースキー」)が押されたとき、開始される処理である。なお、変換キーが操作されなくても、所定数の仮名文字が入力されたとき、あるいは「。」や「、」「.」などの区切り記号が入力されたときに、図3の仮名漢字変換処理が開始されるものとしても差し支えない。
【0045】
この処理が開始されると、まず分かち書き処理(ステップS100)が行なわれる。この処理においては、仮名漢字変換の対象となる仮名文字列を確定し、この確定された文字列について、辞書に格納された単語情報を参照して、変換した場合の単語の総コストが最小となるような文節の組み合わせを決定し、各文節を仮名文字列に対応する仮名漢字混じり文字列に変換する処理が行なわれる。さらに、次候補の選択に対処すべく、各文節について同音語等の異なる表記の変換候補を抽出して記憶する処理も行なわれる。
【0046】
次に、文節分かち書きされた文字列のうち所定の並列関係語について表記を統一する処理Aを行なう(ステップS120)。この処理の詳細については後述する。次に、並列表記統一処理Aを経て作成された仮名漢字混じり文字列を、文節分かち書きされた態様でCRT26に表示する処理を行なう(ステップS130)。このとき、文節内の単語は、各文節についてそれぞれ第一候補とされる表記を用いて表示され、第二候補以下の文字列は展開バッファに格納される。従って、次候補の要求があったときには、第二候補以下の文字列を即座に取り出すことができる。
【0047】
その後、第一候補を表示した文節のいずれかについて次候補への変換要求があるか否かを判断し(ステップS140)、次候補への変換要求がない場合には、カーソルの位置する文節が確定したと判断されるまで、ステップS140に戻って上記各処理を繰り返し(ステップS170)、当該文節が確定した場合には、文節の確定処理を行なう(ステップS175)。
【0048】
次候補への変換要求がある場合には、選択された文節について次候補処理を行ない(ステップS150)、次候補処理が行なわれた文節に並列関係語がある場合には、続いて他の並列関係語の表記を統一する処理Bを行なう(ステップS160)。この処理の詳細については後述する。このように、本装置では、文節分かち書き処理後に表示された文字列についても、再び次候補処理段階において並列関係語に関する表記の統一を行なうことができる。並列表記統一処理Bの終了により、または次候補処理を行なうことなく、カーソルの位置する文節を確定した後は、変換された全ての文節が確定するまで、ステップS140に戻って上記各処理を繰り返し(ステップS180)、全文節の確定をもって仮名漢字変換処理ルーチンを終了する。
【0049】
ステップS120およびS160の並列表記統一処理は、仮名漢字変換装置の内部および周辺機器に設定された各機能部によって実行される。この各機能部の構成と働きについて図4のブロック図に基づいて説明する。ここで行なわれる処理は、キーボード24による実行キーの入力により、中央処理装置(CPU)21がRAM23、ハードディスク30に格納された情報を参照して実行するものである。キーボード24から入力されたキーイメージを文字入力部40が仮名文字列として入力し、使用者により仮名漢字変換実行キーが選択されると、このキー入力を仮名漢字変換制御部42が仮名漢字変換制御プログラムおよび並列表記統一制御プログラムの実行命令として取得する。仮名漢字変換制御部42は、入力された仮名文字列を仮名漢字混じり文字列に変換するまでの全工程を司り、後述する種々の仮名漢字変換処理を制御し、最終的な変換結果を変換後文字列出力部74に送出する。
【0050】
仮名漢字変換制御部42は、受け取った仮名文字を文節分かち書き部44に引き渡す。文節分かち書き部44は、まず辞書に格納された単語情報を参照して、受領した仮名文字列に対する文節区切り位置を決定する。次に、区切られた各文節を構成する各単語につき、辞書に第1候補として格納されている表記を採用して、仮りの仮名漢字混じり文字列を一時的に決定する(以下、この一次的に決定された文字列を「仮り仮名漢字混じり文字列」という)。この仮り仮名漢字混じり文字列は並列関係語抽出部46に渡され、並列関係語抽出部46は仮り仮名漢字混じり文字列の中から並列関係にある語を抽出する。
【0051】
並列関係にある語の抽出は、以下のように実行される。並列関係語抽出部46は仮り仮名漢字混じり文字列を抽出範囲特定部48に引き渡す。抽出範囲特定部48は、並列関係にある語を抽出すべき文字列の範囲を特定し、特定された文字列の範囲を並列関係文節特定部50に送出する。本実施例では、抽出すべき文字列の範囲を一文単位として特定している。
【0052】
並列関係文節特定部50は、辞書を参照して、抽出範囲特定部48により特定された範囲に存在する各文節の中から、並列関係にある語が存在する文節を特定する機能部であり、この機能は以下のように実行される。並列関係文節特定部50から指示を受けた文節選択部52は、抽出範囲特定部48により特定された範囲から文節を選択し、選択された文節につき並列助詞判定部54は並列助詞があるか否かを、並列接続詞判定部56は並列接続詞があるか否かをそれぞれ判定する。この判定は、単語に関する情報の1つとして辞書に格納されている品詞情報を参照することにより行なわれる。こうして判定された並列助詞および並列接続詞が存在する文節の情報は並列関係文節特定部50に送られ、この情報を基にして並列関係文節特定部50は並列関係語が存在する文節を特定する。本実施例では、並列助詞が存在する文節の場合には当該文節が、並列接続詞が存在する文節の場合には当該文節の直前にある文節が、並列関係語が存在する文節とみなされる。
【0053】
こうして特定された並列関係語が存在する文節の位置情報は、並列関係語切出部58に送られ、並列関係語切出部58は、位置情報を受領した文節の中から並列関係語を切り出す。この切り出しは文節を構成する各語について辞書に格納された品詞情報を参照し、品詞情報が名詞である語を切り出すことによって行なわれる。こうして切り出された並列関係語とこの語が存在する文節の位置情報は、並列関係語切出部58によってRAM23上の並列関係語記憶部90に送られ、並列関係語記憶部90は送られた複数の並列関係語を1のグループとして記憶する。
【0054】
並列関係語の切り出しが終了した後、並列関係語切出部58は、切り出された並列関係語とこの語が存在する文節の位置情報を並列表記統一部A60に送る。並列表記統一部A60は、複数の並列関係語の間において、それらの表記を統一する機能部である。並列関係語の表記の統一は、以下のように実行される。並列表記統一部A60は、切り出された並列関係語とこの語が存在する文節の位置情報を先頭語選択部62に送る。先頭語選択部62は、受領した情報に基づいて、仮り仮名漢字混じり文字列の中で最も先頭位置にある文節に属する並列関係語を選択する。選択終了後、先頭語選択部62は選択した並列関係語が属する文節の位置情報を後続語選択部64に渡し、後続語選択部64は先頭語選択部62によって選択された並列関係語以外の関係語を選択する。
【0055】
選択終了後、後続語選択部64は、先頭語選択部62および後続語選択部64によってそれぞれ選択された並列関係語を表記パターン取得部66に送る。表記パターン取得部66は、選択された並列関係語のそれぞれにつき、仮り仮名漢字混じり文字列において採用された表記に関する情報を取得し、表記の種類が一致しているか否かを判断する機能部である。表記に関する情報は単語ごとに辞書内に格納されており、実際には、各派生表記に付与された派生表記の特徴(例えば、漢字、ひらがな、カタカナ等)を示す情報と各派生表記の文字情報が、表記に関する情報として取得される。なお、本実施例では、この情報を取得する際、後の次候補処理に備えて、仮り仮名漢字混じり文字列において採用されなかった種類の表記についても、表記に関する情報が取得される。こうして取得された並列関係語の表記に関する情報は、表記パターン取得部66によってRAM23上の表記パターン記憶部92に送出され記憶される。
【0056】
表記パターン取得部66は、表記の種類の一致性についての判断結果を後続語表記決定部70に送出するとともに、先に先頭語選択部62および後続語選択部64から受領した並列関係語を意味判定部68に送る。意味判定部68は、先頭語選択部62および後続語選択部64によって選択された並列関係語のそれぞれにつき、各語の持つ意味を取得し、意味が一致しているか否かを判断する機能部である。この意味の取得は、各単語に付与された意味内容(例えば、人名,地名,動物名等)を表わす情報を辞書から取り出すことによって行なわれる。こうして取得された並列関係語の意味情報は、意味判定部68によってRAM23上の意味判定記憶部94に送出され記憶される。なお、本実施例では辞書に格納された単語ごとに意味情報を付与する構成としているが、単語に付与される情報は意味情報に限るものではなく、単語を区別することが可能な情報であれば十分である。
【0057】
意味判定部68は、意味の一致性についての判断結果を後続語表記決定部70に送出する。この判断結果を受領した後続語表記決定部70は、先に表記パターン取得部66から受領した表記の種類の一致性についての判断結果と併せて、表記の種類が不一致で、かつ意味が一致する場合には、先頭語選択部62により選択された先頭の並列関係語の表記に従って、後続語選択部64により選択された後続の並列関係語の表記を決定し、この表記を仮り仮名漢字混じり文字列において採用された表記と置き換えて変換文字列出力部72に送る。変換文字列出力部72は、受け取った文字列を初回表示分の仮名漢字混じり文字列と決定して、これを仮名漢字変換制御部42に送出し、仮名漢字変換制御部42は、この文字列を文節分かち書き候補文字列として変換後文字列出力部74に送る。変換後文字列出力部74は、この文字列のコード情報をCRTC27に送り、これをCRTC27が視認可能な文字情報に変換して、CRT26に文節分かち書き候補文字列を表示する。
【0058】
表示された候補文字列が非所望のものであるため、使用者により次候補選択キーが操作されたとき、次候補選択の実行命令を次候補選択部76が受け取って、次候補処理が起動する。次候補選択部76は、次候補要求があった文節に対し、使用者の選択に従って、辞書に格納されている複数の表記の中から「第2候補、第3候補…」の如く、候補の若い順に表記を選択する機能部である。次候補選択部76は、次候補処理を行なう旨と選択された次候補を次候補文節特定部78に送り、次候補文節特定部78はCRT26上のカーソルが位置する文節を次候補の抽出を行なう文節として特定し、特定された文節の位置情報と選択された次候補を並列関係語有無判定部80に送る。
【0059】
並列関係語有無判定部80は、次候補の抽出を行なう文節として特定された文節に並列関係語が存在するか否かを判定する機能部である。この判定は、先に並列関係語記憶部90に記憶された並列関係語が存在する文節の位置情報を参照することにより行なわれる。次候補の抽出を行なう文節として特定された文節に並列関係語が存在しない場合には、並列関係語有無判定部80はこの旨を次候補選択部76へフィードバックし、以降、次候補選択部76は、使用者によって選択された表記を次候補として決定して、これを変換後文字列出力部74へ出力し、CRTC27を介してCRT26に表示する。
【0060】
次候補の抽出を行なう文節として特定された文節に並列関係語が存在する場合には、並列関係語有無判定部80は、この旨および選択された次候補を並列表記統一部B82に送る。並列表記統一部B82は、次候補が選択された文節内にある並列関係語とその他の文節内にある並列関係語との表記を統一する機能部である。並列関係語の表記の統一は、以下のように実行される。並列表記統一部B82は、次候補の抽出を行なう文節として特定された文節の位置情報を並列関係語選択部84に送る。並列関係語選択部84は、まず当文節内にある並列関係語およびこれと同一グループにある他の並列関係語を並列関係語記憶部90から取り出す。次に、表記パターン記憶部92を参照して、当文節内にある並列関係語、即ち、次候補として選択された語の表記の種類と次候補処理が行なわれていない他の並列関係語の表記の種類との一致性を判断する。さらに、並列関係語選択部84は、意味判定記憶部94を参照して、並列関係語のそれぞれにつき各語の持つ意味を取得して、意味の一致性を判断する。なお、表記パターン記憶部92および意味判定記憶部94を参照せず、辞書を参照する構成としても差し支えない。
【0061】
こうして取得された並列関係語および並列関係語に関する表記の種類の一致性および意味の一致性についての判断結果は、次候補表記決定部86に送出される。表記パターン次候補表記決定部86は、表記の種類が不一致で、かつ意味が一致する場合には、次候補として選択された語の表記に従って次候補処理が行なわれていない他の並列関係語の表記を変更して決定する。決定された表記は変換後文字列出力部74へ送出され、CRTC27を介してCRT26に表示される。
【0062】
以上、並列表記統一処理を行なう各機能部の構成と働きについて概説した。これらの各機能部の働きは、CPU21により逐次実行される処理によって実現されるものである。そこで、この逐次処理の開始から終了までの流れを、図5のフローチャートに基づいて説明する。まず始めに、文節分かち書きされた仮名漢字混じり文字列が初めて表示される前に、並列関係語の表記を統一する処理である並列表記統一処理A(図3ステップS120)について説明し、次に、次候補が選択された際における、並列関係語の表記を統一する処理である並列表記統一処理B(図3ステップS160)について説明する。図5(a)は、本実施例における並列表記統一ルーチンAの概略を示すフローチャートである。この処理ルーチンは、入力された仮名文字列に対してスペースキーが押されて、仮名文字列が仮名漢字混じり文字列に文節分かち書きされた後であって、各文節の候補文字列を漢字かな混じり文として表示する前に実行される。
【0063】
この処理が開始されると、まずステップS100において文節分かち書きされた文字列の中から一文を特定する処理が行なわれる(ステップS200)。この処理によって、一文が並列関係語の表記を統一すべき範囲として決定される。勿論、一文を特定せずに文節分かち書きされた文字列の先頭から次々と並列関係語を検索する構成としてもよい。例えば、所定の文節数を取得することにより文頭から順次仮名漢字混じり文字列に変換していく自動変換の形式を採用する場合には、むしろ一文を特定する必要はない。なお、並列関係語の表記を統一すべき範囲を章や節,段落等のような一文よりも大きい範囲や一文内における並列関係語の1グループごとのような一文よりも小さい範囲としても差し支えない。
【0064】
次に、特定された一文から並列関係にある語を抽出する処理を行なう(ステップS220)。この処理の詳細については後述する。次に、抽出された並列関係語のうち、一文のうちで一番先頭に存在する語の表記を決定し(ステップS240)、この決定された表記に従って後続の並列関係語の表記を確定する処理を行なう(ステップS260)。この一連の処理の詳細については後述する。
【0065】
次に、ステップS200で特定された一文中の全ての並列関係について解析を完了したか否かを判断する(ステップS280)。特定された一文中に未解析である他の並列関係が存在する場合には、ステップS240に戻って表記確定処理を繰り返す。特定された一文中に未解析である他の並列関係が存在しない場合には、本ルーチンは「NEXT」に抜けて終了する。以上の処理によって、並列関係語の表記が統一された一文が、文節分かち書きされた態様でCRT26に表示されることになる(図3のステップS130)。
【0066】
図6のステップS220における、特定された一文から並列関係にある語を抽出する処理の詳細について、図6に基づいて説明する。図6は、並列関係語の抽出処理ルーチンの概略を示すフローチャートである。本ルーチンが起動されると、まず特定された一文から最初の文節を取得し(ステップS400)、取得した文節内に並列助詞による並列関係語があるか否かを判断する処理を行なう(ステップS410)。当該文節内に並列助詞による並列関係語がない場合には、さらに当該文節内に並列接続詞による並列関係語があるか否かを判断する処理を行なう(ステップS420)。
【0067】
文節内に並列助詞による並列関係語があるか否かの判断は、以下のように行なわれる。まず文節を構成する各単語につき、辞書に格納された品詞情報を参照して、文節内に並列助詞があるか否かを判定する。本実施例では、「と」,「も」,「や」,「か」,「とか」,「に」,「だの」,「やら」等の語に並列助詞としての品詞情報を与えている。並列助詞がある場合には並列助詞の前に位置する単語の品詞情報が名詞であるか否かを判定する。名詞であれば、この語を並列関係語の1つとみなし、当該文節内に並列助詞による並列関係語があると認定される。
【0068】
文節内に並列接続詞による並列関係語があるか否かの判断は、以下のように行なわれる。まず前述した並列助詞の場合と同様に、辞書に格納された品詞情報を参照して文節を構成する語が並列接続詞であるか否かを判定する。本実施例では、「または」,「もしくは」,「かつ」,「および」のような文法上の並列接続詞のみならず、「、(読点)」や「・(中点)」、「,(コンマ)」、「=(等号)」、「…(点線)」、「−(ハイフン)」等の並列関係を意味する文字,図形,記号の全てを並列接続詞として扱っている。並列接続詞がある場合には並列接続詞の前に位置する単語の品詞情報が名詞であるか否かを判定する。名詞であれば、この語を並列関係語の1つとみなし、この語が存在する文節内に並列接続詞による並列関係語があると認定される。
【0069】
なお、フローチャートには図示しないが、文節内に並列関係語が含まれているか否かの判断は、並列関係の終端となる文節に関しては、以下のように行なう。当該文節に並列助詞および並列接続詞がない場合でも、当該文節に、「が」,「は」,「を」等のような、並列文においてしばしば並列助詞と組み合わせて用いられる格助詞があり、かつ当該文節以前の文節において既に並列関係語があると認定されていることを条件として、格助詞の前に位置する名詞である単語を並列関係の終端となる並列関係語とみなし、当該文節内に並列関係語があると認定する。
【0070】
以上のような方法で並列関係語の有無が判断されるので、並列関係語の存在する文節が連続している場合のみならず、文節間に修飾語を挟むために並列関係語の存在する文節が離間している場合であっても有効に並列関係語を検索することができる。例えば、「大きい/犬と/小さい/猫が/走っていった。」と文節分かち書きされた文字列に対しても、「犬」と「猫」を一の並列関係に属する並列関係語として認定することができる。
【0071】
並列助詞による並列関係語もしくは並列接続詞による並列関係語がある場合には、この語のフラグを値1として設定してこれを記憶する処理を行なう(ステップS440)。並列関係語とそのフラグ値は、ステップS200において特定された一文について文字列の確定がなされるまでRAM23上の所定領域に記憶され、文字列の確定と同時にゼロクリアされる。
【0072】
なお、本実施例においては、並列関係の終端となる並列関係語とこの語以前に抽出された並列関係語をグループ化して記憶する手段を採用している。従って、特定された一文に2以上の並列関係が存在する場合でも、各関係に属する並列関係語群毎に表記を統一することができる。例えば、「いぬ」,「ねこ」,「かわ」,「やま」といった単語について、候補文字列としては「イヌ」,「ねこ」,「川」,「やま」がそれぞれ個別に学習されて第一候補となっている場合であって、「イヌと/ねこが/走って/、/川や/やまへ/行った」と文節分かち書きされた、「いぬ」,「ねこ」という第1の並列関係語群と「かわ」,「やま」という第2の並列関係語群のそれぞれについて、第1の並列関係語群はカタカナ表記、第2の並列関係語群は漢字表記のように、異なる表記に統一することができる。この結果、文節分かち書きされた文字列は「イヌと/ネコが/走って/、/川や/山へ/行った」のように変換される。
【0073】
文節内に並列助詞による並列関係語もしくは並列接続詞による並列関係語のいずれかがある場合にはこの語のフラグを設定および記憶した後に(ステップS440)、いずれもない場合には特にフラグの値を設定することなく、特定された一文に次の文節があるか否かを判断する処理を行なう(ステップS460)。次の文節がある場合には、当該文節を新たに取得し(ステップS480)、ステップS410に戻って上述した処理を繰り返す。次の文節がない場合には、特定された一文を構成する全ての文節について並列関係語の抽出を完了したものとみなして、」本ルーチンを終了し、次の処理へ移る。
【0074】
次に、ステップS240およびS260における一連の処理を表記確定処理とし、その詳細について図7および8のフローチャートを用いて説明する。図7は、本実施例における表記確定処理ルーチンAの概略を示すフローチャートである。本ルーチンが起動されると、まず特定された一文で最初に出現する並列関係語について表記パターンを取得する処理を行なう(ステップS500)。並列関係語の特定は、抽出の際に記憶されたフラグの値を参照することにより行なわれる。本装置では、文節分かち書き処理の後、各文節を構成する語の第1候補表記を採用して表示する構成を採っている。従って、並列関係語の表記パターンの取得は、辞書を参照し、当該語について第1候補とされている派生表記についての情報を取り出すことによって行なわれる。
【0075】
ステップS500で取得した表記パターンをRAM23上の所定領域に一時的に記憶した後、特定された一文の中で最初の並列関係語の次に出現する並列関係語についてその表記パターンを取得する処理を行なう(ステップS520)。並列関係語およびその表記パターンの取得は、前述した最初の並列関係語の場合と同様に行なう。次に、ステップS500で取得した最初の並列関係語の表記パターンとステップS520で取得した次の並列関係語の表記パターンとを比較し、次の並列関係語の表記パターンを最初の並列関係語の表記パターンに統一する処理を行なう(ステップS540)。例えば、最初の並列関係語の表記が「イヌ」という全カナ表記であり、次の並列関係語の表記が「ねこ」という全かな表記である場合には、次の並列関係語の表記を「ネコ」という全カナ表記に変更する。この処理の詳細については後述する。
【0076】
この処理が完了したならば、さらに次の並列関係語があるか否かを判断する(ステップS560)。次の並列関係語の有無は、RAM23上にグループ化して記憶されている並列関係語群を参照することにより判断される。次の並列関係語があれば、ステップS520に戻って以上の処理を繰り返す。次の並列関係語がなければ本ルーチンを終了する。
【0077】
本実施例では、並列関係語の持つ意味にも着目して表記を統一するか否かを決定している。この処理につき、図8に記載した表記パターン統一処理ルーチンAに基づいて説明する。本ルーチンが起動されると、まず、最初の並列関係語に付与された意味を取得する処理を行なう(ステップS600)。並列関係語の意味の取得は、辞書に格納された各語についての意味情報を参照することによって行なわれる。意味情報は、例えば、「ナポレオン」という語については「人名」、「ベニス」という語については「地名」、「いぬ」という語については「動物」、「カラス」という語については「鳥」という形で各語に与えられている。勿論、参照可能な情報は意味情報に限られるものでなく、各単語を区別できる何らかの情報であって、辞書を参照して検索することが可能な情報であればよい。
【0078】
ステップS600で取得した意味情報をRAM23上の所定領域に一時的に記憶した後、次の並列関係語に付与された意味を取得する処理を行なう(ステップS620)。並列関係語の意味の取得は、前述した最初の並列関係語の場合と同様に行なう。次に、ステップS620で取得した次の並列関係語の意味がステップS600で取得した最初の並列関係語の意味と同じであるか否かを判断し(ステップS640)、意味が同じである場合にのみ次の並列関係語の表記パターンを最初の並列関係語の表記パターンに変更する処理を行なって(ステップS660)、本ルーチンを終了する。例えば、「太郎と/カラスが/喧嘩した」と文節分かち書き処理された一文については、「太郎」,「カラス」にはそれぞれ「人名」,「鳥」という異なる意味情報が付与されているので、各語が並列関係にあるにも拘わらず両者の表記パターンは統一されない。
【0079】
以上、本実施例の仮名漢字変換装置において、文節分かち書きされた仮名漢字混じり文字列が初めて表示される前に実行される、並列関係語の表記を統一する処理の内容について説明した。次に、これらの処理に基づいて、実際に表記の統一がなされる様子を図9に基づいて具体的に説明する。図9中の記号「/」は文節の一単位を表わしている。例文1では、「いぬ」,「ねこ」,「うさぎ」という3つの単語が「と」という並列助詞で結合され、並列関係を形成している。キーボード入力された例文1のかな文字列に対して仮名漢字変換処理の実行キーが操作されると、ステップS100の処理に従って文節分かち書きを行なう。
【0080】
分かち書き後の文節を構成する各単語については、辞書に保有されている表記のうち第1候補となる表記が採用される。この状態を示したのが図9中段の例文1である。即ち、この場合は、「いぬ」,「ねこ」,「うさぎ」という各語については、それぞれ「犬」,「ネコ」,「うさぎ」という表記が第1候補として辞書に格納されていたことになる。
【0081】
この後、並列表記統一処理Aが実行され、ステップS410の処理に従って、並列助詞である「と」と格助詞である「が」が存在する第1文節,第2文節,第3文節に並列関係語があると判断し、「犬」,「ネコ」,「うさぎ」という表記の3つの語を抽出する。この3つの語が「動物」という共通の意味を持つ語であることを、ステップS640の処理によって認識した上で、後続語の「ネコ」,「うさぎ」という表記をそれぞれ「猫」,「兔」という先頭語の「犬」で採用されている漢字表記に変更する。この表記が変更された文字列が、仮名漢字変換後の文字列としてCRT26に表示される。この表示状態を図9最下段の例文1に示す。
【0082】
例文2では、「いぬ」と「ねこ」、「うさぎ」という3つの単語が「および」という並列接続詞で結合され、並列関係を形成している。この場合も前述した例文1の場合と同様に、文節分かち書きを行なって、例文2中段のような仮名漢字混じり文字列を形成する。この後、並列表記統一処理Aが実行され、ステップS420の処理に従って、並列接続詞である「および」と格助詞である「が」が存在する第1文節,第2文節,第3文節に並列関係語があると判断し、「犬」,「ネコ」,「うさぎ」という表記の3つの語を抽出する。以降は、例文1の場合と同様に、ステップS640の処理により、3つの語について意味の確認を行なって、後続語の「ネコ」,「うさぎ」という表記をそれぞれ「猫」,「兔」という先頭語の「犬」で採用されている漢字表記に変更する。この結果、CRT26には、図9最下段に示す態様で表示される。
【0083】
また、前述したように、並列助詞の有無とおよび並列接続詞の有無を文節ごとに独立して判断することにより並列関係語が抽出されるので、例文3のような「と」という並列助詞と「および」という並列接続詞が混在して1つの並列関係を形成している場合であっても、並列関係語の表記を統一することができる。
【0084】
例文4は、記号「・(中点)」を用いて並列関係を形成した文字列を表わしているが、本装置では「・(中点)」を並列接続詞とみなしてそれ自体独立の文節を形成する構成としている。従って、このような場合であっても例文2の並列接続詞による並列関係の場合と同じ処理によって、並列関係語の表記を統一することができる。
【0085】
例文5は、各並列関係語に対して、それぞれ「大きい」、「小さい」、「白い」という修飾語が付加された場合の文例である。前述したように、本実施例では並列助詞または並列接続詞の前に位置する単語あるいは格助詞の前に位置する単語の品詞情報が名詞であるか否かを判定することにより並列関係語を抽出する。例えば、例文5の場合には、並列助詞である「と」の前に位置する「犬」および「ネコ」と格助詞である「が」の前に位置する「うさぎ」が、並列関係語として抽出される。従って、例文5のような修飾語付きの場合であっても「犬」,「ネコ」,「うさぎ」という並列関係語を確実に抽出してこれらの表記を統一することができる。
【0086】
例文6は、一文に、「いぬ,猫,ウサギ」と「川,ヤマ,たに」という2以上の並列関係が認められる場合を示す。前述の通り、本装置は最初の並列関係の終端となる並列関係語を切り出したとき、この語以前に抽出された並列関係語をグループ化して記憶し、残りの文節に対しては再び最初の並列関係語の切り出しから開始して次なる並列関係の終端を検索する。従って、特定された一文に2以上の並列関係が存在する場合でも、それぞれ独立の並列関係として扱われる。よって、例文6の「いぬ,猫,ウサギ」という並列関係語群については「いぬ」のひらがな表記に、「川,ヤマ,たに」という並列関係語群については「川」の漢字表記にそれぞれ統一し、図9最下段のように表示することができる。
【0087】
なお、本実施例では、並列関係の先頭となる並列関係語の表記を基準として、後続の並列関係語の表記を変更する構成について説明したが、並列関係語は一群のグループとして抽出および記憶されているので、後続の並列関係語の表記を基準とし、より文の前方に位置する並列関係語の表記を変更することも可能である。
【0088】
次に、次候補が選択された際に並列関係語の表記を統一する処理である並列表記統一処理Bについて説明する。図5(b)は、本実施例における並列表記統一処理ルーチンBの概略を示すフローチャートである。この処理ルーチンは、使用者によってシフトキーを押したまま次候補キーが操作されたとき、開始される処理である。勿論、次候補キーのみを操作したときに本処理が開始されるものとしても差し支えない。なお、本実施例では、次候補キーのみを操作した場合には、カーソルで指定された文節のみについて表記を変更する通常の次候補処理が行なわれる。
【0089】
この処理が開始されると、まずステップS150において次候補処理の実行が選択された文節を特定し(ステップS300)、特定された文節内に並列関係語があるか否かを判断する処理を行なう(ステップS310)。並列関係語があるか否かの判断は、先に記憶された並列関係語についてのフラグを参照することにより行なわれる。
【0090】
並列関係語があると判断した場合には、当文節内にある並列関係語の表記を決定し(ステップS330)、この決定された表記に従って他の並列関係語の表記を変更する処理を行なう(ステップS350)。この一連の処理の詳細については後述する。
【0091】
次に、ステップS330で決定され、ステップS350で選択された表記で、次候補を表示する処理を行なう(ステップS370)。本実施例では、次候補が選択された1の並列関係語の表記が未確定の段階で、次候補が選択された1の並列関係語以外の並列関係語に対して変更された表記をも表示するが、この変更された表記を表示する時期は特に限定されるものではなく、表記が確定された時点で初めて表示するものであってもよい。
【0092】
次候補の表示後、ステップS150で新たに次候補が選択された文節があるか否かを判断する(ステップS390)。新たに次候補が選択された文節がある場合には、ステップS310に戻って並列関係語の存否の確認処理および表記確定処理を繰り返す。新たに次候補が選択された文節がない場合には、本ルーチンを終了して次の処理へ移る。
【0093】
次に、ステップS330およびS350における一連の処理を表記確定処理とし、その詳細について図10および図11のフローチャートを用いて説明する。図10は、本実施例における表記確定処理ルーチンBの概略を示すフローチャートである。本ルーチンが起動されると、まず次候補が選択された文節内の並列関係語について表記パターンを取得する処理を行なう(ステップS700)。例えば、並列関係語である「イヌ」というカタカナ表記に対し「犬」という漢字表記を次候補として選択した場合には、表記の種類を漢字表記として取得する。なお、本実施例では、先にRAM23上に記憶された情報に基づいて表記パターンを取得する構成としているが、再度辞書を参照して表記パターンを取得する構成としても差し支えない。
【0094】
次に、選択された文節内にある並列関係語と並列関係にある他の並列関係語について表記パターンを取得する処理を行なう(ステップS720)。他の並列関係語の特定およびその表記パターンの取得は、選択文節内の並列関係語と同じグループ内に記憶されている当該並列関係語以外の語についての情報を取り出すことによって行なわれる。なお、本実施例では、他の並列関係語が未確定文字列である場合にのみこの語を特定して表記パターンを取得する構成としているが、本装置に確定文字列を未確定文字列として再表示する機能を付加することにより、確定文字列も含めて表記統一の対象とすることもできる。
【0095】
次に、ステップS700で取得した選択文節内の並列関係語の表記パターンとステップS720で取得した他の並列関係語の表記パターンとを比較し、他の並列関係語の表記パターンを選択文節内の並列関係語の表記パターンに統一する処理を行なう(ステップS740)。例えば、使用者による次候補の選択によって選択文節内の並列関係語の表記が「いぬ」という全かな表記から「イヌ」という全カナ表記に変更された場合には、先に行なわれた表記統一処理により「ねこ」という全かな表記で表示された他の並列関係語について、その表記を「ネコ」という全カナ表記に変更する。
【0096】
表記パターンの統一は、文節分かち書きの直後に最初に行なわれる統一処理と同様に、並列関係語の持つ意味が同じである場合にのみ他の並列関係語の表記パターンを選択文節内の並列関係語の表記パターンに変更する構成を採る。この処理について、図11の表記確定処理ルーチンBを表わすフローチャートに記載しているが、処理内容は既に説明した図8の表記確定処理ルーチンAと同様であるので、ここでは詳しい説明を省略する。図11におけるステップS800、S820、S840、S860は、それぞれ図8におけるステップS600、S620、S640、S660に対応する処理である。
【0097】
以上説明した表記パターンの統一処理の完了後、さらに他の並列関係語があるか否かを判断する(ステップS760)。他の並列関係語の有無は、RAM23上にグループ化して記憶されている並列関係語群を参照することにより判断される。他の並列関係語があれば、ステップS720に戻って以上の処理を繰り返し、他の並列関係語がなければ本ルーチンを終了する。
【0098】
以上、本実施例の仮名漢字変換装置において、次候補が選択された際に実行される、並列関係語の表記を統一する処理の内容について説明した。次に、これらの処理に基づいて、実際に表記の統一がなされる様子を図12に基づいて具体的に説明する。図12は、図9で説明した処理の続きを表わしており、図9にて並列表記統一処理Aがされた後の各例文がCRT36に表示されている状態を図12の上段に示している。図12の表示処理はこの状態を表わしたものである。図中の文字列を囲む枠線CSは、カーソルの位置を表わしている。
【0099】
例文1ないし例文5は、いずれも初回表示された「犬」という語に対して「イヌ」というカタカナ表記からなる次候補を使用者が要求する場合の例である。まず、ステップS300の処理によって、カーソルの置かれている「犬」を含む文節を次候補が選択された文節として特定する。先に行なわれた並列関係語の抽出処理のステップS440において設定および記憶されたフラグ値から、例文1および例文3ないし5の「犬と」という文節と例文4の「犬」という文節には、「犬」という並列関係語があると判断する。「犬」に対して「イヌ」が次候補として選択されたとき、ステップS330の処理に従って、次候補が選択された文節の表記を「イヌと」若しくは「イヌ」に決定する。図12の中段は、このときのCRT26上の表示状態を示したものである。
【0100】
次に、次候補「イヌ」の選択に伴い、ステップS740の処理に従って、「イヌ」と並列関係にある「猫」や「兔」の持つ語の意味は、「イヌ」の持つ語の意味と一致すると判断した上で、ステップS350の処理に従って、「猫」や「兔」という次候補選択されていない並列関係語についても、次候補選択された「イヌ」の表記であるカタカナ表記に変更し、それぞれ「ネコ」や「ウサギ」という表記にて表示する。図12の最下段は、このときのCRT26上の表示状態を示したものである。
【0101】
例文6は、一文に、「いぬ,猫,ウサギ」と「川,ヤマ,たに」という2以上の並列関係が認められる場合において、初回表示された「いぬ」という語に対しては「イヌ」というカタカナ表記からなる次候補を、初回表示された「川」という語に対しては「かわ」というひらがな表記からなる次候補を、それぞれ使用者が要求した場合の例である。前述の通り、この2つの並列関係はそれぞれ独立の並列関係として扱われるので、「いぬ」にカーソルが置かれ、「イヌ」というカタカナ表記が次候補として選択された場合には、同一の並列関係にある「ねこ」,「うさぎ」についてはそれぞれ「ネコ」,「ウサギ」というカタカナ表記に変換される一方、同一の並列関係にない「川」,「山」,「谷」についてはカタカナ表記に変更されない。これらについて表記を変更する場合には、「川」を含む文節にカーソルを置いて次候補の選択を行なえば、選択された表記に従って「山」,「谷」についての表記が変更される。従って、「川」にカーソルが置かれ、この語に対し「かわ」というひらがな表記が次候補として選択された場合には、同一の並列関係にある「山」,「谷」についてそれぞれ「やま」,「たに」というひらがな表記に変更される。
【0102】
なお、本実施例では、並列関係の先頭となる並列関係語の表記を基準として、後続の並列関係語の表記を変更する構成について説明したが、並列関係語は一群のグループとして抽出および記憶されているので、後続の並列関係語の表記を基準とし、文の前方に位置する並列関係語の表記を変更することも可能である。
【0103】
以上、並列関係語に関する表記の統一を行なう仮名漢字変換装置について説明したが、本実施例の仮名漢字変換装置を、並列関係以外の関係を有する複数の語の間で、それらの語の表記を統一する構成とすることも可能である。この仮名漢字変換装置を、複数の異なる語が並列関係以外の関係を有する場合にも語間の表記を統一し得る装置とすることもできる。並列関係以外の関係には、第1の例として、複数の異なる語に格助詞が結合した結果、それらが主格,対格,方向格を表わす関係にある場合が考えられる。この具体例を図9および図12における例文7に示す。図9の中段における例文7は、「犬が/ネコに/噛み付いた」と文節分かち書きされた文字列を表わしたものである。ここで、「犬」と「ネコ」はそれぞれ主格を表わす格助詞「は」と方向格を表わす格助詞「に」に結合し、一文節を形成している。
【0104】
前述の通り、本装置の辞書は単語データとともに各語の品詞情報を格納しているので、辞書を参照して格助詞を抽出することにより、カタカナ表記である「ネコ」を「犬」の漢字表記に合わせ、「犬が/猫に/噛み付いた」という表記統一された文字列を得ることができる。また、図12の中段における例文7は、漢字表記である「犬」に対して「イヌ」というカタカナ表記を次候補として選択した場合を表わしたものである。このような場合にも、「猫」をカタカナ表記に変更して、「イヌが/ネコに/噛み付いた」という表記統一された文字列を得ることができる。
【0105】
第2の例として、複数の異なる語の間に比較関係がある場合が考えられる。例えば、「Aは/Bよりも/きれいだ。」と文節分かち書きされた文字列の場合には、辞書を参照して比較を表わす格助詞を抽出することにより、AとBの表記を統一することができる。なお、本装置では語の持つ品詞情報に着目して関係語を検索しているが、これに限られるものではなく、語について与えられている何らかの情報であればよい。このような情報として、例えば、部首等のような品詞情報以外の文法上の情報や略語や俗語の存在情報、その他文字,記号,図形に与えられた意味情報,外形情報,読み方情報等が考えられる。
【0106】
さらに、本実施例では、既に確定された文字列につき、指定された範囲の文字列を表記統一の対象とする構成としてもよい。この構成を採用し得る実用的な例として、文字列を入力して、この入力された文字列のうち使用者が指定した範囲の文字や文章について、辞書等に登録されている複数の表記候補と比べあわせることにより、文字や文章の誤りを正す文章校正装置等が考えられる。以下、本発明の文章校正装置としての実現形態を、実施例として説明する。
【0107】
本実施例の文章校正装置を構成するCPUやCRTなどのハードウェアは、前述した仮名漢字変換装置の場合と同じものを使用している。本実施例の文章校正装置は、文章校正処理を行なうプログラムを備えており、このプログラムに従ってCPU21が各部に実行命令を行なうことにより、文章校正処理が実現される。この文章校正処理を実現する装置の各部を図13のブロック図に示す。本実施例の文章校正装置は、入力部EN、校正部PF、校正指示部OD、出力部OU、CRT26を備える。入力部ENは、校正の対象となる文字列を装置内部に入力する機能部である。この機能は、実際には、装置の内部または外部に設けられた記憶領域に記憶されたテキストデータをCPU21が文字として読み取ることによって実現される。本実施例では、記録媒体TXの記憶領域に、コード情報の形でテキストデータを格納している。
【0108】
校正指示部ODは、使用者の選択に従って、入力されたテキストから校正範囲を指定し、校正の内容や項目を決定する機能部である。この校正範囲および校正の内容や項目に関する情報は、校正部PFに送出される。校正部PFは、指定された範囲の文字列から、文字や表現の誤りを抽出するとともに、この誤りに対応する正しい文字や表現を選択する機能部である。この抽出および選択は、実際には、図示しない辞書に格納された単語情報をCPU21が参照することによって行なわれる。
【0109】
校正部PFには、表記統一部CAが設けられており、表記統一部CAは、並列関係にある語の表記の不一致を誤りと判定して、これを抽出し、各並列関係語について統一した表記を選択する。校正部PFで行なわれた抽出および選択の結果は、出力部OUに送出される。出力部OUは、文字をコード情報から外形情報に変換し、入力されたテキストや校正の結果を視認可能にCRT26に表示する。
【0110】
次に、このような機能部を有する文章校正装置によって実際に並列関係にある語についての表記の統一が行なわれる手順を、CPU21が実行する処理に基づいて説明する。使用者によってフロッピーディスクドライブに記録媒体TXがセットされ、読み出そうとするテキストが選択されると、選択されたテキストを文字列としてCRT26に表示する処理を行なう。
【0111】
続いて、使用者によって、表示された文字列に対して校正の対象とすべき範囲が選択され、文章校正開始の実行命令がなされると、文章校正処理プログラムが起動する。この起動後に行なわれる処理の流れを図14の文章校正処理ルーチンに基づいて説明する。まず、テキストにおいて選択された範囲を校正範囲として指定し(ステップS900)、指定された範囲に存在する文字列につき、予め設定された校正の内容や項目に従い、辞書を参照して、文字や表現が誤っている単語や文字列を抽出する処理を行なう(ステップS910)。
【0112】
本実施例では、校正範囲において並列関係にある語の間の表記が統一されていない場合にも、これを文字の誤りとみなして該当する単語を抽出することとしている。この過程を図14の並列語抽出・選択ルーチンに基づいて説明する。本ルーチンにおいて行なわれる各処理は、第2実施例の並列表記統一処理Bとほぼ同様である。まず、指定された範囲に存在する文字列の中から並列関係にある語を抽出する処理を行なう(ステップS911)。この処理は、第1実施例における図5のステップS220に相当する処理である。並列関係にある語の抽出は、辞書に格納された単語についての品詞情報を参照することによって行なわれる。
【0113】
次に、各並列関係語に用いられている表記を比較し、これらが一致しているか否かを判断する処理を行なう(ステップS912)。この処理は、第1実施例における図5のステップS240およびS260に相当する処理である。詳しくは、並列関係の先頭に位置する並列関係語の表記を基準とし、この表記種類が同じ並列関係にある他の並列関係語の表記種類と一致しているか否かを判断する。この判断は、辞書に格納された単語についての表記情報を参照することによって行なわれる。
【0114】
表記が一致していなければ、並列関係の先頭に位置する並列関係語の表記と一致しない表記を用いている並列関係語を指定し、指定された並列関係語には文字の誤りがあるとみなして、この並列関係語を抽出する処理を行なう。このような処理を行なうことによって、並列関係にある語の間の表記が統一されていない場合にも、これを文字の誤りとみなし、該当する並列関係語を抽出することができる。次に、抽出された並列関係語に対して並列関係の先頭に位置する並列関係語の表記種類と同じ種類の表記を用いた場合の語を、正しい単語として決定する処理を行ない(ステップS913)、本サブルーチンを終了する。
【0115】
このように文字や表現が誤っている単語や文字列を抽出した後、抽出された単語や文字列に対する正しい単語や文字列を選択する処理を行なう(ステップS920)。抽出された単語が表記が統一されていない並列関係語である場合には、ステップS913において決定された単語を正しい単語として選択する。
【0116】
選択終了後、抽出された誤りのある単語や文字列を、他の文字列とは識別可能に表示し、選択された正しい単語や文字列を、修正候補としてCRT26上のダイアログボックス内に選択可能に表示する処理を行なう(ステップS930)。誤りのある単語や文字列の1つについて、使用者により修正候補の1つが選択されたとき(ステップS940)、文章中の誤りのある単語や文字列を修正候補と置き換える処理を行なう(ステップS950)。抽出された全ての単語や文字列について、使用者による修正候補の選択若しくは修正候補を無視する指示がされるまで、次の抽出単語や文字列を選択して以上の処理を繰り返し(ステップS960、S970、S980)、指定された範囲についての文章校正処理を終了する。
【0117】
本実施例の文章校正装置において、実際に並列関係にある語の表記の統一がなされる様子を、具体例に即して説明する。校正範囲として指定された範囲に「犬とネコが走っていった」という文字列を含むテキストがCRT26に表示され、この校正範囲について文章校正処理が実行された場合を例にとる。まず、文字列内に「と」という並列助詞と「が」という格助詞が存在することが認識され、この結果、「犬」と「ネコ」という2つの語が並列関係語として抽出される。次に、この2つの語の表記種類が判断されるが、「犬」は漢字表記である一方、「ネコ」はカタカナ表記であり、両者の表記は一致しないと判断される。従って、並列関係の先頭語である「犬」の漢字表記が正しい表記とされ、漢字表記ではない「ネコ」は表記に誤りがあるとみなされる。この結果、誤りのある単語として「ネコ」が抽出され、正しい単語として「ネコ」に漢字表記を用いた「猫」という語が正しい単語として選択される。
【0118】
抽出された「ネコ」という文字列は、表示されたテキスト中の他の文字列と区別することができるように、白抜き文字で表示され、正しい単語として選択された「猫」という文字列は、修正候補として表示される。使用者が「猫」という修正候補を選択したとき、テキスト中の「ネコ」という文字列は「猫」という文字列と置き換えられて表示される。この結果、「犬と猫が走っていった」という並列関係にある語の間において表記が統一された文字列を得ることができる。
【0119】
以上、仮名漢字変換装置および文章校正装置としての実施例について説明したが、本発明によって実現される並列表記統一処理は、ある文字列を異なる文字列に変換する機能を実現する装置であれば、その全てに適用することが可能である。従って、装置への文字入力の方法や出力の方法、処理プログラムを格納する媒体の種類、処理プログラムの供給方法等に関しては、以上説明した実施例に何ら限定されるものではなく、現在又は将来において存在し得る種々の態様を考えることができる。例えば、装置への文字の入力方法は、キーボード操作や記録媒体の読み取りによって入力する方法に限らず、OCR(光学式文字認識)のような、印刷又は手書きされた文字を光学的に読み取り、その結果を文字データとして入力する方法であってもよい。
【0120】
以上本発明の実施例について説明したが、本発明はこうした実施例に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々なる様態で実施し得ることは勿論である。
【図面の簡単な説明】
【図1】本発明の実施例である仮名漢字変換装置が実現されるハードウェアを示すブロック図である。
【図2】実施例としての仮名漢字変換装置における文節分かち書き機能と並列表記統一機能との関係を示すブロック図である。
【図3】本発明の実施例で実行される仮名漢字変換処理ルーチンを説明するフローチャートである。
【図4】実施例としての仮名漢字変換装置における並列表記統一機能の実現形態を示す機能ブロック図である。
【図5】並列表記統一ルーチンAおよびBを示すフローチャートである。
【図6】並列関係語の抽出処理ルーチンを示すフローチャートである。
【図7】表記確定処理ルーチンAを示すフローチャートである。
【図8】表記パターン統一処理ルーチンAを示すフローチャートである。
【図9】実施例としての仮名漢字変換装置において行なわれる並列表記統一処理Aの具体例を示す説明図である。
【図10】表記確定処理ルーチンBを示すフローチャートである。
【図11】表記パターン統一処理ルーチンBを示すフローチャートである。
【図12】実施例としての仮名漢字変換装置において行なわれる並列表記統一処理Bの具体例を示す説明図である。
【図13】実施例としての文章校正装置における各機能部を示すブロック図である。
【図14】本発明の実施例で実行される文章校正処理ルーチンを説明するフローチャートである。
【符号の説明】
21…CPU
22…ROM
23…RAM
24…キーボード
25…入力インタフェース
26…CRTディスプレイ
27…CRTC
28…プリンタ
29…出力インタフェース
30…ディスクコントローラ
31…バス
32…ハードディスク
33…マウス
34…CD−ROMドライブ
35…CD−ROM
36…シリアル入出力インタフェース
37…モデム
38…コンピュータ
40…文字入力部
42…仮名漢字変換制御部
44…文節分かち書き部
46…並列関係語抽出部
48…抽出範囲特定部
50…並列関係文節特定部
52…文節選択部
54…並列助詞判定部
56…並列接続詞判定部
58…並列関係語切出部
60…並列表記統一部A
62…先頭語選択部
64…後続語選択部
66…表記パターン取得部
68…意味判定部
70…後続語表記決定部
72…変換文字出力部
74…変換後文字列出力部
76…次候補選択部
78…次候補文節特定部
80…並列関係語有無判定部
82…並列表記統一部B
84…並列関係語選択部
86…次候補表記決定部
90…並列関係語記憶部
92…表記パターン記憶部
94…意味判定記憶部

Claims (7)

  1. 文字列を入力し、変換しようとする語を予め格納した辞書を参照して該辞書に記憶された複数の表記候補の中から1の表記を選択し、前記入力された文字列を変換する文字列変換装置であって、
    前記入力された文字列の中から所定の関係にある2以上の異なる語を検索する関係語検索手段と、
    該関係語検索手段により検索された1の語について、漢字、ひらがな、およびカタカナの表記候補の中から1の表記の選択を受け付ける表記選択手段と、
    該表記選択手段により選択された表記に従って、前記関係語検索手段により検索された2以上の異なる語について、その表記を漢字、ひらがな、およびカタカナのいずれかに統一するように決定する表記決定手段とを備え、
    前記関係語検索手段は、一文を単位として検索を行なう手段であり、
    前記関係語検索手段における所定の関係は、前記一文に含まれる少なくとも1つの並列関係であり、
    前記関係語検索手段は、格助詞の前に位置する名詞である単語を前記並列関係の終端とみなし、
    前記表記決定手段は、前記並列関係毎に前記統一を行う手段を有する文字列変換装置。
  2. 請求項1記載の文字列変換装置であって、
    前記辞書は、格納する各語について各語の属する予め設定されたカテゴリーを記憶しており、
    前記関係語検索手段は、所定の関係にある2以上の異なる語の検索を前記カテゴリーを同じくする語について行なう手段である文字列変換装置。
  3. 文字列を入力し、該入力された文字列を文節分かち書きして、得られた各文節について予め辞書に記憶された複数の表記候補の中から1の表記を選択し、前記文節分かち書きされた文字列を仮名漢字混じり文字列に変換する仮名漢字変換装置であって、
    前記文節分かち書きされた文字列の中から所定の関係にある2以上の異なる語を検索する関係語検索手段と、
    該関係語検索手段により検索された1の語について、漢字、ひらがな、およびカタカナの表記候補の中から1の表記の選択を受け付ける表記選択手段と、
    該表記選択手段により選択された表記に従って、前記関係語検索手段により検索された2以上の異なる語について、その表記を漢字、ひらがな、およびカタカナのいずれかの表記に統一するように決定する表記決定手段と、
    前記表記選択手段により選択された表記と前記表記決定手段により決定された表記を表示する表示手段と、
    を備え、
    前記関係語検索手段は、一文を単位として検索を行なう手段であり、
    前記関係語検索手段における所定の関係は、前記一文に含まれる少なくとも1つの並列関係であり、
    前記関係語検索手段は、格助詞の前に位置する名詞である単語を前記並列関係の終端とみなし、
    前記表記決定手段は、前記並列関係毎に前記統一を行う手段を有する仮名漢字変換装置。
  4. 文字列を入力し、予め辞書に記憶された複数の表記候補を参照して、前記入力された文字列を所望の表記の文字列に変換する文章校正装置であって、
    前記入力された文字列について校正を行なう範囲を指定する校正範囲指定手段と、
    該校正範囲指定手段により指定された範囲の中から所定の関係にある2以上の異なる語を検索する関係語検索手段と、
    該関係語検索手段により検索された1の語について、漢字、ひらがな、およびカタカナの表記候補の中から1の表記の選択を受け付ける表記選択手段と、
    該表記選択手段により選択された表記に従って、前記関係語検索手段により検索された2以上の異なる語について、その表記を漢字、ひらがな、およびカタカナのいずれかの表記に統一するように決定する表記決定手段とを備え、
    前記関係語検索手段は、一文を単位として検索を行なう手段であり、
    前記関係語検索手段における所定の関係は、前記一文に含まれる少なくとも1つの並列関係であり、
    前記関係語検索手段は、格助詞の前に位置する名詞である単語を前記並列関係の終端とみなし、
    前記表記決定手段は、前記並列関係毎に前記統一を行う手段を有する文章校正装置。
  5. 文字列を入力し、変換しようとする語を予め格納した辞書を参照して該辞書に記憶された複数の表記候補の中から1の表記を選択し、前記入力された文字列をコンピュータを用いて変換する文字列変換方法であって、
    前記入力された文字列の中から所定の関係にある2以上の異なる語を前記コンピュータが検索する関係語検索工程と、
    該検索された1の語について、漢字、ひらがな、およびカタカナの表記候補の中から1の表記の選択を前記コンピュータが受け付ける表記選択工程と、
    該選択された表記に従って、前記検索された2以上の異なる語について、その表記を漢字、ひらがな、およびカタカナのいずれかの表記に統一するように前記コンピュータが決定する表記決定工程と、
    を備え、
    前記関係語検索工程は、一文を単位として前記コンピュータが検索を行なう工程を含み、
    前記関係語検索工程における所定の関係は、前記一文に含まれる少なくとも1つの並列関係であり、
    前記関係語検索工程は、格助詞の前に位置する名詞である単語を前記並列関係の終端とみなす工程を含み、
    前記表記決定工程は、前記並列関係毎に前記コンピュータが前記統一を行う工程を含む文字列変換方法。
  6. 文字列を入力し、変換しようとする語を予め格納した辞書を参照して該辞書に記憶された複数の表記候補の中から1の表記を選択し、前記入力された文字列を変換するためのコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
    前記入力された文字列の中から所定の関係にある2以上の異なる語を検索する関係語検索機能と、
    該検索された1の語について、漢字、ひらがな、およびカタカナの表記候補の中から1の表記の選択を受け付ける表記選択機能と、
    該選択された表記に従って、前記検索された2以上の異なる語について、その表記を漢字、ひらがな、およびカタカナのいずれかの表記に統一するように決定する表記決定機能と、
    を前記コンピュータに実現させるためのコンピュータプログラムを記録し、
    前記関係語検索機能は、一文を単位として検索を行なう機能を含み、
    前記関係語検索機能における所定の関係は、前記一文に含まれる少なくとも1つの並列関係であり、
    前記関係語検索機能は、格助詞の前に位置する名詞である単語を前記並列関係の終端とみなす機能を含み、
    前記表記決定機能は、前記並列関係毎に前記統一を行う機能を含むコンピュータ読み取り可能な記録媒体。
  7. 文字列を入力し、該入力された文字列を文節分かち書きして、得られた各文節について予め辞書に記憶された複数の表記候補の中から1の表記を選択し、前記文節分かち書きされた文字列を仮名漢字混じり文字列に変換するためのコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
    前記文節分かち書きされた文字列の中から所定の関係にある2以上の異なる語を検索する関係語検索機能と、
    該検索された1の語について、漢字、ひらがな、およびカタカナの表記候補の中から1の表記の選択を受け付ける表記選択機能と、
    該選択された表記に従って、前記検索された2以上の異なる語について、その表記を漢字、ひらがな、およびカタカナのいずれかの表記に統一するように決定する表記決定機能と、
    前記選択された表記と前記決定された表記を表示する表示機能と
    を前記コンピュータに実現させるためのコンピュータプログラムを記録し、
    前記関係語検索機能は、一文を単位として検索を行なう機能を含み、
    前記関係語検索機能における所定の関係は、前記一文に含まれる少なくとも1つの並列関係であり、
    前記関係語検索機能は、格助詞の前に位置する名詞である単語を前記並列関係の終端とみなす機能を含み、
    前記表記決定機能は、前記並列関係毎に前記統一を行う機能を含むコンピュータ読み取り可能な記録媒体。
JP34720697A 1997-12-01 1997-12-01 文字列変換装置および方法、仮名漢字変換装置、文章校正装置並びにそのプログラムを記録した記録媒体 Expired - Fee Related JP3893709B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34720697A JP3893709B2 (ja) 1997-12-01 1997-12-01 文字列変換装置および方法、仮名漢字変換装置、文章校正装置並びにそのプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34720697A JP3893709B2 (ja) 1997-12-01 1997-12-01 文字列変換装置および方法、仮名漢字変換装置、文章校正装置並びにそのプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JPH11161646A JPH11161646A (ja) 1999-06-18
JP3893709B2 true JP3893709B2 (ja) 2007-03-14

Family

ID=18388647

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34720697A Expired - Fee Related JP3893709B2 (ja) 1997-12-01 1997-12-01 文字列変換装置および方法、仮名漢字変換装置、文章校正装置並びにそのプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3893709B2 (ja)

Also Published As

Publication number Publication date
JPH11161646A (ja) 1999-06-18

Similar Documents

Publication Publication Date Title
US5835924A (en) Language processing apparatus and method
US5214583A (en) Machine language translation system which produces consistent translated words
US5349368A (en) Machine translation method and apparatus
US6286014B1 (en) Method and apparatus for acquiring a file to be linked
JPS61107430A (ja) 音声情報の編集装置
JPH0535783A (ja) タイポグラフイカル情報付き文書の翻訳装置
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
JPH08263478A (ja) 中国語簡繁体字文書変換装置
JP3893709B2 (ja) 文字列変換装置および方法、仮名漢字変換装置、文章校正装置並びにそのプログラムを記録した記録媒体
JPH0442704B2 (ja)
JPH08212216A (ja) 自然言語処理装置および自然言語処理方法
JP3377942B2 (ja) 電子辞書検索装置および電子辞書検索装置制御用プログラムを記憶したコンピュータ読取可能な記憶媒体
JP7418761B2 (ja) 画像と文字との混在文章を生成する装置
JP3952009B2 (ja) 翻訳メモリシステム、翻訳方法、および翻訳メモリシステム用プログラム
JP3814000B2 (ja) 文字列変換装置および文字列変換方法
US20010033285A1 (en) Character attribute setting device and method in document preparing apparatus
JP3700193B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
JPH10293811A (ja) 文書認識装置及び方法並びにプログラム記憶媒体
JP2000029882A (ja) 要約文作成装置
JPH08129545A (ja) 文字列変換方法及び文書作成装置
JPH1097539A (ja) 文書変換装置
JPH0567080A (ja) かな漢字変換装置
JPH08241315A (ja) 文書処理装置の単語登録機構
JPH0869463A (ja) 仮名漢字変換装置および仮名漢字変換方法
JP2000181909A (ja) 辞書学習方法及び文書作成装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040913

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20041015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050222

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060516

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060704

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060719

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060822

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061018

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061121

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061204

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101222

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101222

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111222

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111222

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131222

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees