JP2004038797A - Character string converter, character string conversion method and program for making computer execute the method - Google Patents

Character string converter, character string conversion method and program for making computer execute the method Download PDF

Info

Publication number
JP2004038797A
JP2004038797A JP2002197806A JP2002197806A JP2004038797A JP 2004038797 A JP2004038797 A JP 2004038797A JP 2002197806 A JP2002197806 A JP 2002197806A JP 2002197806 A JP2002197806 A JP 2002197806A JP 2004038797 A JP2004038797 A JP 2004038797A
Authority
JP
Japan
Prior art keywords
character string
conversion
candidate
determining
occurrence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002197806A
Other languages
Japanese (ja)
Inventor
Keisuke Arita
有田 圭介
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP2002197806A priority Critical patent/JP2004038797A/en
Publication of JP2004038797A publication Critical patent/JP2004038797A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To correct erroneous selection and erroneous establishment of homonyms by an operator in real time in inputting character strings. <P>SOLUTION: Regarding a read character string under conversion by a character string conversion section 205, for example, "idou", in spite of the coocurrence of a conversion candidate "idou" which means "personnel transfer" with "jinji" meaning personnel affairs exists, when a candidate other than that, for example, "idou" which means "move" is selected by the operator, an erroneous conversion judgment section 209 selects and establishes the coincident conversion candidate on presenting it to the operator and by obtaining confirmation of it. On the contrary, regarding the last read character string, for example, "jinkou", in spite of "jinkou" which means population, coocurring with "mitsudo" meaning "density", when other candidate, for example, "jinkou" which means "artificial" is established, the coocurring word is replaced with the last establishment candidate on presenting it to the operator and by obtaining his confirmation. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
この発明は、入力された文字列を他の文字列に変換する文字列変換装置、文字列変換方法およびその方法をコンピュータに実行させるプログラムに関する。
【0002】
【従来の技術】
同一の読み文字列について複数存在する同音異義語は、文意や文脈によってきめ細かく使い分けなければならない。そして、本出願人が製造・販売する「ATOK」など従来のかな漢字変換ソフトウエアでは、操作者の指示にしたがって同音異義語の一つを選択・確定しているが、操作者の不注意や不勉強などにより、しばしば「人事移動」「人口衛星」などの誤変換が発生してしまう。
【0003】
こうした誤変換を防止するべく、ATOKでは変換候補の順位を決定する際に、直近に確定された数語と共起関係にあるものの順位を上げるようにしている(AI用例機能)。この機能により、たとえば「お茶」「が」に続けて読み文字列「あつい」を変換すると「熱い」が第一候補に、「夏」「は」に続けて読み文字列「あつい」を変換すると「暑い」が第一候補にというように、確定済の他の語との関係から見て最も確からしい変換候補が優先的に提示されるようになる。
【0004】
【発明が解決しようとする課題】
しかしながら、逆に第一候補になるからと言って必ずしも他の語との共起関係があるわけではなく、単に同一読み文字列について直近に確定された変換候補がそれであったというだけの場合もある。すなわち、優先的に提示されている候補が、常に確率的に正確である可能性の高い語であるとは言えない。
【0005】
このように、従来技術では上位の変換候補が共起により優先されたのか、単なる学習により優先されたのかが区別できないため、操作者がわざわざ共起を否定するような変換操作(確率的に誤変換である可能性が高い操作)をしてもそれを修正することができないという問題点があった。
【0006】
なお、ATOKには変換候補の一覧表示時に、各候補の意味や使い方を別ウィンドウにより表示する機能がある(同音語用例表示機能)。図10はこの同音語用例表示機能により表示される、同音語用例ウィンドウの一例を示す説明図である。
【0007】
同音異義語の選択に迷ったときは、操作者はこうした同音語の使い分け情報を参照することができるが、図示するように実際の使用例は一語につき数例であり、他の組み合わせについては操作者が類推しなければならない。また、現状では候補一覧中の全候補について使い分け情報が整備されているわけではなく、図中右横に三角のマークがついている単語にのみ上記情報が用意されている。
【0008】
また、本出願人が製造・販売するワープロソフトの「一太郎」には、「修太」という文書校正機能が搭載されており、操作者は文書作成中や文書完成後にこの機能を実行することで、文書中の同音語誤りなどをまとめてチェックできる。もっとも、シンプルなエディタなどにはこうした機能を搭載しないものも多く、また主に画像や音声などを扱うソフトウエアでは、たとえ文字入力の機会が多くあったとしても校正機能は具備しないのが普通である。
【0009】
この発明は上記従来技術による問題を解決するため、操作者による同音異義語の誤選択や誤確定を文字列入力時にリアルタイムに修正することが可能な文字列変換装置、文字列変換方法およびその方法をコンピュータに実行させるプログラムを提供することを目的とする。
【0010】
【課題を解決するための手段】
上述した課題を解決し、目的を達成するため、請求項1に記載の発明にかかる文字列変換装置は、入力された文字列を他の文字列に変換する文字列変換装置において、第1の文字列の変換候補のうちいずれか一つを確定する第1の確定手段と、第2の文字列の変換候補のうちいずれか一つを選択する選択手段と、前記第1の確定手段により確定された変換候補と前記選択手段により選択された変換候補との間に共起関係があるか否かを判定する判定手段と、前記判定手段により前記変換候補の間に共起関係がないと判定された場合に、前記第2の文字列の変換候補のうち前記第1の確定手段により確定された変換候補と共起関係があるものを確定する第2の確定手段と、を備えたことを特徴とする。
【0011】
この請求項1に記載の発明によれば、変換中の第2の文字列につき選択されている候補が、第1の文字列につきすでに確定されている候補との共起関係からみて同音異義語の変換ミスである可能性の高い場合には、選択中の候補の代わりにそれとは別の、より確からしい同音異義語が選択・確定される。
【0012】
また、請求項2に記載の発明にかかる文字列変換装置は、入力された文字列を他の文字列に変換する文字列変換装置において、第1の文字列の変換候補のうちいずれか一つを確定する第1の確定手段と、第2の文字列の変換候補のうちいずれか一つを選択する選択手段と、前記第1の確定手段により確定された変換候補と前記選択手段により選択された変換候補との間に共起関係があるか否かを判定する判定手段と、前記判定手段により前記変換候補の間に共起関係がないと判定された場合に、前記第1の文字列の変換候補のうち前記選択手段により選択された変換候補と共起関係があるものを確定する第2の確定手段と、を備えたことを特徴とする。
【0013】
この請求項2に記載の発明によれば、第1の文字列につきすでに確定されている候補が、変換中の第2の文字列につき選択されている候補との共起関係からみて同音異義語の変換ミスである可能性の高い場合には、確定済の候補がそれとは別の、より確からしい同音異義語に置換される。
【0014】
また、請求項3に記載の発明にかかる文字列変換装置は、入力された文字列を他の文字列に変換する文字列変換装置において、第1の文字列の変換候補のうちいずれか一つを確定する第1の確定手段と、第2の文字列の変換候補のうちいずれか一つを選択する選択手段と、前記第1の確定手段により確定された変換候補と前記選択手段により選択された変換候補との間に共起関係があるか否かを判定する判定手段と、前記判定手段により前記変換候補の間に共起関係がないと判定された場合に、前記第1の文字列の変換候補および前記第2の文字列の変換候補のうち相互に共起関係があるものを確定する第2の確定手段と、を備えたことを特徴とする。
【0015】
この請求項3に記載の発明によれば、第1の文字列につきすでに確定されている候補と、変換中の第2の文字列につき選択されている候補のいずれも、相互間の共起関係からみて同音異義語の変換ミスである可能性の高い場合には、第1の文字列については確定済の候補がそれとは別の、より確からしい同音異義語に置換されるとともに、第2の文字列については選択中の候補の代わりに、それとは別のより確からしい同音異義語が選択・確定される。
【0016】
また、請求項4に記載の発明にかかる文字列変換装置は、前記請求項1〜請求項3のいずれか一つに記載の発明において、さらに、前記第2の確定手段により確定される変換候補を表示する表示手段を備えたことを特徴とする。
【0017】
この請求項4に記載の発明によれば、誤選択や誤確定の自動修正に先立って、当該処理を実行してもよいかどうかの最終確認が操作者に対してなされる。
【0018】
また、請求項5に記載の発明にかかる文字列変換装置は、前記請求項1〜請求項4のいずれか一つに記載の発明において、前記第1の文字列は前記第2の文字列の直前に確定された文字列であることを特徴とする。
【0019】
この請求項5に記載の発明によれば、時間的に連続して入力された文字列(通常は位置的にも連続(隣接)する文字列)について、相互間の共起関係を基礎として誤選択や誤確定の自動修正がおこなわれる。
【0020】
また、請求項6に記載の発明にかかる文字列変換方法は、入力された文字列を他の文字列に変換する文字列変換方法において、第1の文字列の変換候補のうちいずれか一つを確定する第1の確定工程と、第2の文字列の変換候補のうちいずれか一つを選択する選択工程と、前記第1の確定工程で確定された変換候補と前記選択工程で選択された変換候補との間に共起関係があるか否かを判定する判定工程と、前記判定工程で前記変換候補の間に共起関係がないと判定された場合に、前記第2の文字列の変換候補のうち前記第1の確定工程で確定された変換候補と共起関係があるものを確定する第2の確定工程と、を含んだことを特徴とする。
【0021】
この請求項6に記載の発明によれば、変換中の第2の文字列につき選択されている候補が、第1の文字列につきすでに確定されている候補との共起関係からみて同音異義語の変換ミスである可能性の高い場合には、選択中の候補の代わりにそれとは別の、より確からしい同音異義語が選択・確定される。
【0022】
また、請求項7に記載の発明にかかる文字列変換方法は、入力された文字列を他の文字列に変換する文字列変換方法において、第1の文字列の変換候補のうちいずれか一つを確定する第1の確定工程と、第2の文字列の変換候補のうちいずれか一つを選択する選択工程と、前記第1の確定工程で確定された変換候補と前記選択工程で選択された変換候補との間に共起関係があるか否かを判定する判定工程と、前記判定工程で前記変換候補の間に共起関係がないと判定された場合に、前記第1の文字列の変換候補のうち前記選択工程で選択された変換候補と共起関係があるものを確定する第2の確定工程と、を含んだことを特徴とする。
【0023】
この請求項7に記載の発明によれば、第1の文字列につきすでに確定されている候補が、変換中の第2の文字列につき選択されている候補との共起関係からみて同音異義語の変換ミスである可能性の高い場合には、確定済の候補がそれとは別の、より確からしい同音異義語に置換される。
【0024】
また、請求項8に記載の発明にかかる文字列変換方法は、入力された文字列を他の文字列に変換する文字列変換方法において、第1の文字列の変換候補のうちいずれか一つを確定する第1の確定工程と、第2の文字列の変換候補のうちいずれか一つを選択する選択工程と、前記第1の確定工程で確定された変換候補と前記選択工程で選択された変換候補との間に共起関係があるか否かを判定する判定工程と、前記判定工程で前記変換候補の間に共起関係がないと判定された場合に、前記第1の文字列の変換候補および前記第2の文字列の変換候補のうち相互に共起関係があるものを確定する第2の確定工程と、を含んだことを特徴とする。
【0025】
この請求項8に記載の発明によれば、第1の文字列につきすでに確定されている候補と、変換中の第2の文字列につき選択されている候補のいずれも、相互間の共起関係からみて同音異義語の変換ミスである可能性の高い場合には、第1の文字列については確定済の候補がそれとは別の、より確からしい同音異義語に置換されるとともに、第2の文字列については選択中の候補の代わりに、それとは別のより確からしい同音異義語が選択・確定される。
【0026】
また、請求項9に記載の発明にかかるプログラムによれば、前記請求項6〜請求項8のいずれか一つに記載された方法がコンピュータによって実行される。
【0027】
【発明の実施の形態】
以下に添付図面を参照して、この発明による文字列変換装置、文字列変換方法およびその方法をコンピュータに実行させるプログラムの好適な実施の形態を詳細に説明する。
【0028】
図1は、この発明の実施の形態による文字列変換装置のハードウエア構成を示す説明図である。同図において、101は装置全体を制御するCPUを、102は基本入出力プログラムを記憶したROMを、103はCPU101のワークエリアとして使用されるRAMを、それぞれ示している。
【0029】
また、104はCPU101の制御にしたがってHD(ハードディスク)105に対するデータのリード/ライトを制御するHDD(ハードディスクドライブ)を、105はHDD104の制御にしたがって書き込まれたデータを記憶するHDを、それぞれ示している。
【0030】
また、106はCPU101の制御にしたがってFD(フレキシブルディスク)107に対するデータのリード/ライトを制御するFDD(フレキシブルディスクドライブ)を、107はFDD106の制御にしたがって書き込まれたデータを記憶する着脱自在のFDを、それぞれ示している。
【0031】
また、108はカーソル、メニュー、ウィンドウ、あるいは文字や画像などの各種データを表示するディスプレイを、109は通信ケーブル110を介してLANなどのネットワークに接続され、当該ネットワークとCPU101とのインターフェースとして機能するネットワークI/Fを、それぞれ示している。
【0032】
また、111は文字、数値、各種指示などの入力のための複数のキーを備えたキーボードを、112は各種指示の選択や実行、処理対象の選択、マウスポインタの移動などをおこなうマウスを、それぞれ示している。また、113は着脱可能な記録媒体であるCD−RWを、114はCD−RW113に対するデータのリードを制御するCD−RWドライブを、100は上記各部を接続するためのバスまたはケーブルを、それぞれ示している。
【0033】
つぎに、図2はこの発明の実施の形態による文字列変換装置の構成を機能的に示す説明図である。まず、200は読み入力部であり、ローマ字による読み文字列の入力を受け付けて、当該ローマ字を平仮名に変換の上、後述する文字列変換部205に引き渡す機能部である。なお、読み文字列を当初から平仮名で入力する場合には、ローマ字から平仮名への変換は不要である。
【0034】
201は変換指示部であり、注目する文字列の他の文字列への変換指示を操作者から受け付けて、後述する文字列変換部205に通知する機能部である。この変換指示は、たとえばキーボード111上のスペースキーの押下によりなされる。
【0035】
一回目の変換指示では、変換指示部201からの通知を受けた文字列変換部205は、上記他の文字列として読み文字列の変換候補のうち第一順位のもの(以下では「第一候補」と言う)を選択する。また、二回目以降の変換指示は選択された変換候補(以下では「選択候補」と言う)の切り替えを意味し、変換指示部201からの通知を受けた文字列変換部205は、現在選択中の変換候補に代えてその次の順位の変換候補を選択する。
【0036】
202は確定指示部であり、変換中の文字列の確定指示を操作者から受け付けて、文字列変換部205に通知する機能部である。本実施の形態による確定指示には、通常の確定指示と、後述する優先確定指示との二種類がある。
【0037】
前者はたとえばEnterキーや下矢印キーの押下によりなされ、Enterキーの場合は変換中の全文節が、下矢印キーの場合は注目中の文節(カーソルの位置する文節)のみが、それぞれ確定される。また、後者はたとえばShift+Enterキーによりなされるが、この指示があったときの処理については後述する。
【0038】
203および204は文字列変換部205により参照される辞書であり、203が変換前文字列(読み)と変換後文字列(表記)とを対応づけた変換辞書、204が共起する語句同士を対応づけた共起辞書である。
【0039】
図3は、共起辞書204の内容を模式的に示す説明図である。図示するように、共起辞書204には共起する語句のそれぞれの読みと表記とが対応づけられている。なお、ここで対応づけられているのは二つの語句であるが、三つ以上であってももちろんよい。また、ここでは説明の便宜上、変換辞書203と共起辞書204とは別個に編成されるものとしたが、変換辞書203の中に共起辞書204の内容を取り込むなどして、両者を融合してしまってもよい。
【0040】
205は文字列変換部であり、任意の文字列をそれとは異なる文字列に変換する機能部である。読み入力部200から読み文字列が入力された直後、変換指示部201がその変換指示の入力を検知すると、文字列変換部205は上記読み文字列につき、各文節の区切れ位置を変化させながら変換辞書203を検索して、最も確からしい区切れ位置と各文節の変換候補とを取得する。
【0041】
その後、文字列変換部205は共起辞書204を検索して、各文節の変換候補の組み合わせの中に共起関係の成立する組み合わせ、すなわち共起辞書204で対応づけられているような語句の組み合わせがあれば、それらの変換候補の順位を上げて各文節の第一候補とする。そして、各文節についてその第一候補を選択するとともに、各文節のすべての変換候補を後述する変換候補表示部206に引き渡す。
【0042】
また、文字列変換部205は変換指示部201から、同一文節についての再度の変換指示が入力すると、当該文節の選択候補を現在のものから一つ低い順位のものへ切り替えるとともに、その事実を変換候補表示部206に通知する。
【0043】
また、文字列変換部205は確定指示部202から通常の確定指示が入力すると、その時点での選択候補を確定候補として後述する作成中文書記憶部207に、またその変換前の読み文字列と、上記確定候補を含む当該読み文字列のすべての変換候補とを後述する確定済文字列記憶部208に、それぞれ引き渡す。なお、確定指示部202から優先確定指示が入力したときの文字列変換部205の処理は、ケースによって異なるため後述する。
【0044】
206は変換候補表示部であり、文字列変換部205から引き渡された変換候補を画面表示する機能部である。変換候補表示部206は、一回目の変換指示では画面上の読み文字列を第一候補で置換するのみであるが、二回目の変換指示では上記第一候補を第二候補で置換するとともに、当該読み文字列の変換候補を列挙した変換候補ウィンドウ(後述)を表示する。
【0045】
207は作成中文書記憶部であり、文字列変換部205から順次出力される確定候補、すなわちその時点までに作成された文書全体を記憶する機能部である。
【0046】
208は確定済文字列記憶部であり、文字列変換部205により直前に確定された読み文字列とそのすべての変換候補とを保持する機能部である。確定指示部202による指示を受けた文字列変換部205から、確定された読み文字列とそのすべての変換候補とを引き渡されると、確定済文字列記憶部208は現在保持している読み文字列とその変換候補とを破棄して、代わりに上記読み文字列と変換候補とを記憶する。
【0047】
209は誤変換判定部であり、現在変換中の読み文字列の変換候補と、直前に確定された読み文字列の変換候補との共起関係の有無にもとづいて、共起辞書204に登録された共起関係に相反するような同音異義語への誤変換がないかどうか/なかったかどうかを判定する機能部である。また、210は共起用例表示部であり、誤変換判定部209により誤変換がある/あったと判定された場合に、最適な変換候補の組み合わせを共起用例ウィンドウにより表示する機能部である。
【0048】
誤変換判定部209により誤変換がある/あったと判定され、したがって共起用例表示部210により共起用例ウィンドウが表示されるケースには下記三つがある。
【0049】
(ケース1)変換中の読み文字列について選択されている変換候補が、直前に確定された読み文字列の確定候補と共起関係になく、かつ変換中の読み文字列の変換候補の中に、直前に確定された読み文字列の確定候補と共起関係にあるものが含まれている場合
【0050】
たとえば読み文字列「じんじいどう」は、スペースキーが押下されたこと、すなわち当該読み文字列の変換指示があったことを変換指示部201が検知すると、文字列変換部205により「じんじ」「いどう」の二文節に分割されて、それぞれ「人事」「異動」と変換される。
【0051】
このときカーソルは先頭の文節の「人事」に位置しているので、この状態で下矢印キーを押下すると、当該操作を検知した確定指示部202から文字列変換部205に注目文節の確定指示が伝達され、「じんじ」のみが「人事」に確定される。すなわち、確定候補「人事」が文字列変換部205から作成中文書記憶部207に送出されるとともに、読み文字列「じんじ」とその変換候補「人事」および「仁慈」が確定済文字列記憶部208に送出される。
【0052】
この直後、カーソルは後続の文節の「異動」に移動するので、この状態でスペースキーを押下すると、文字列変換部205は第一候補の「異動」に代えて第二候補の「移動」を選択する。また、変換候補表示部206により図4に示すような変換候補ウィンドウ400が表示され、読み文字列「いどう」の変換候補が列挙されるとともに、現在選択中の第二候補が強調(反転)して表示される。
【0053】
文字列変換部205による変換中の読み文字列の変換候補(選択候補を含む)と、確定済文字列記憶部208に保持されている、直前に確定された読み文字列の変換候補(確定候補を含む)との関係を監視している誤変換判定部209は、変換中の読み文字列「いどう」について選択中の変換候補「移動」が、直前に確定された読み文字列「じんじ」の確定候補「人事」と共起関係になく、かつ変換中の読み文字列の変換候補の中に、「人事」と共起関係にある「異動」が含まれていること、すなわち上記の例がケース1の誤変換に該当することを検出する。
【0054】
そして、このような誤変換を検出すると、誤変換判定部209は共起の観点から見てもっともらしい変換候補の組み合わせ、ここでは「人事」と「異動」との組み合わせを共起用例表示部210に引き渡し、図4に示すような共起用例ウィンドウ401により操作者の再考を促す。なお、図示する共起用例ウィンドウ401は、変換候補ウィンドウ400で「異動」「いどう」以外の変換候補が選択されている限り表示され続ける(「異動」「いどう」が選択されたときのみ消去される)。
【0055】
(ケース2)変換中の読み文字列について選択されている変換候補が、直前に確定された読み文字列の確定候補と共起関係になく、かつ直前に確定された読み文字列の変換候補の中に、変換中の読み文字列について選択されている変換候補と共起関係にあるものが含まれている場合
【0056】
たとえば読み文字列「じんこう」が「人工」で確定された直後、読み文字列「みつど」の変換指示があると、文字列変換部205はその第一候補である「密度」を選択する。そして、誤変換判定部209は選択中の変換候補「密度」が、直前の確定候補「人工」と共起関係になく、かつ「じんこう」の他の変換候補の中に、「密度」と共起関係にある「人口」があること、すなわち上記の例がケース2の誤変換に該当することを検出すると、共起用例表示部210に指示して図5に示すような共起用例ウィンドウ500を表示させる。
【0057】
(ケース3)変換中の読み文字列について選択されている変換候補が、直前に確定された読み文字列の確定候補と共起関係になく、かつ変換中の読み文字列の変換候補の中に、直前に確定された読み文字列の変換候補と共起関係にあるものが含まれている場合
【0058】
たとえば読み文字列「じんこう」が「人口」で確定された直後、読み文字列「えいせい」の変換指示があると、文字列変換部205はその第一候補である「衛生」を選択する。そして、誤変換判定部209は選択中の変換候補「衛生」が直前の確定候補「人口」と共起関係になく、かつ「えいせい」の変換候補の一つである「衛星」と、「じんこう」の変換候補の一つである「人工」との間に共起関係があること、すなわち上記の例がケース3の誤変換に該当することを検出すると、共起用例表示部210に指示して図6に示すような共起用例ウィンドウ600を表示させる。
【0059】
ケース1〜3は、いずれも適切に変換候補を選択・確定すれば共起関係が成立するはずの読み文字列について、当該関係が成立しないような誤った同音異義語の選択・確定がおこなわれている場合である。そして、共起用例ウィンドウ401・500および600は、いずれも共起関係にある語の組み合わせ、すなわち共起関係から見て最も確からしい語の組み合わせを操作者に提示するためのものである。
【0060】
そして、共起用例ウィンドウが表示された状態でShift+Enterキーを押下すると、その事実を検知した確定指示部202により、選択中あるいは確定済の語よりも共起用例ウィンドウ内の語を優先させるべき旨の指示(優先確定指示)が文字列変換部205に伝達される。「優先させる」とは、選択中の変換候補については当該候補に代えて共起用例ウィンドウ内の変換候補を選択の上確定すること、また確定済の変換候補については、当該候補を共起用例ウィンドウ内の変換候補で置換することを意味している。
【0061】
すなわち、図4に示したケース1の場合には、確定指示部202からの指示を受けた文字列変換部205は選択中の「移動」に代えて、共起用例ウィンドウ401内の「異動」を選択するとともに、「異動」を確定候補として作成中文書記憶部207に送出する。また、読み文字列「いどう」とその変換候補である「異動」「移動」「異同」・・・などを確定済文字列記憶部208に送出する。
【0062】
また、図5に示したケース2の場合には、文字列変換部205は直前に確定した読み文字列「じんこう」の「人工」への確定を取り消すとともに、当該文節の新たな確定候補である、共起用例ウィンドウ500内の「人口」を作成中文書記憶部207に送出する。これを受けた作成中文書記憶部207は、前回の確定候補である「人工」を今回の確定候補である「人口」で置換する。
【0063】
また、現在変換中の読み文字列「みつど」については、文字列変換部205は選択中でありかつ共起用例ウィンドウ500にも表示されている「密度」を確定候補として、作成中文書記憶部207に送出する。さらに、読み文字列「みつど」とその変換候補の「密度」とを確定済文字列記憶部208に送出する。
【0064】
すなわち、ケース1では現在変換中の文節について、共起の観点から見て確からしい変換候補が選択・確定されるのみであったが、ケース2では直前に確定された文節にまで遡って、当該確定が覆され、正しい変換候補が選択・確定し直されることになる。
【0065】
また、図6に示したケース3の場合には、文字列変換部205は直前に確定した読み文字列「じんこう」の「人口」への確定を取り消すとともに、当該文節の新たな確定候補である、共起用例ウィンドウ600内の「人工」を作成中文書記憶部207に送出する。これを受けた作成中文書記憶部207は、前回の確定候補である「人口」を今回の確定候補である「人工」で置換する。
【0066】
また、現在変換中の読み文字列「えいせい」については、文字列変換部205は選択中の「衛生」に代えて、共起用例ウィンドウ600内の「衛星」を選択するとともに、「衛星」を確定候補として作成中文書記憶部207に送出する。さらに、読み文字列「えいせい」とその変換候補である「衛星」「衛生」「永世」・・・などを確定済文字列記憶部208に送出する。
【0067】
すなわち、ケース3はケース1とケース2との混合型であって、ケース1と同様、現在変換中の文節について共起の観点からもっともらしい変換候補が選択・確定されるとともに、ケース2と同様、直前に確定された文節についても正しい変換候補が選択・確定し直されることになる。
【0068】
なお、図7は図6から再度の変換指示を入力した状態であり、読み文字列「えいせい」の変換候補を列挙する変換候補ウィンドウ700が新たに表示されている。このとき、「えいせい」の選択候補は「衛生」から「衛星」に切り替わっており、直前の確定候補と現在の選択候補との関係はケース3からケース2に変化しているが、いずれにせよ共起の観点からは誤変換である可能性が高いので、共起用例ウィンドウ600は図6の状態から表示されたままである。
【0069】
つぎに、図8はこの発明の実施の形態による文字列変換装置における、文字列変換処理の手順を示すフローチャートである。
【0070】
読み入力部200から読み文字列が入力された後(ステップS801)、変換指示部201からスペースキーの押下などにより変換指示が入力されると(ステップS802:Yes)、文字列変換部205は上記文字列中の各文節についてその変換候補を変換辞書203から読み出すとともに(ステップS803)、共起辞書204を参照して各候補の優先順位を決定し、各文節についてそれぞれの第一候補を選択する(ステップS804)。そして、変換候補表示部206は各文節の読み文字列に代えて、上記第一候補を画面表示する(ステップS805)。
【0071】
また、変換候補表示部206による候補表示と平行して、誤変換判定部209はステップS803で文字列変換部205により読み出された変換候補と、確定済文字列記憶部208に保持された、直前に確定された読み文字列の変換候補との間に、上述のケース1〜3のような関係があるかどうかを判定する(ステップS806)。
【0072】
そして上記関係がある場合、すなわち共起辞書204に登録された共起関係に相反するような同音異義語の選択・確定がなされている場合には(ステップS806:Yes)、誤変換判定部209は共起用例表示部210に正しい候補の組み合わせを引き渡して、図4〜図6に示したような共起用例ウィンドウを表示させる(ステップS807)。
【0073】
その後ステップS802に戻り、再度変換指示があれば(ステップS802:Yes)、前回のループで読み出した変換候補があるのでステップS803は省略して、現在選択中の候補より一つ下の順位の候補を選択する(ステップS804)。そして、これは同一文節に対する再度の変換指示であるので、変換候補表示部206は表示中の第一候補を第二候補に置換するのみならず、変換候補ウィンドウを開いてその他の変換候補を一覧表示する(ステップS805)。
【0074】
なお、このときも誤変換判定部209は現在の変換候補と直前の変換候補との関係を監視しており、引き続きケース1〜3のような関係が成立するようであれば(ステップS806:Yes)、前回のループで表示した共起用例ウィンドウを表示し続ける(ステップS807)。
【0075】
また、ステップS802に戻った後に再度の変換指示でなく、確定指示部202から確定指示が入力された場合(ステップS802:No、ステップS808:Yes)、当該指示がEnterキーや下矢印キーの押下による通常の確定指示であれば(ステップS809:Yes)、文字列変換部205はその時点で選択されている候補を確定する(ステップS810)。
【0076】
また、上記指示がShift+Enterキーの押下による優先確定指示であるれば(ステップS809:No)、文字列変換部205はケースに応じて、共起用例ウィンドウ内の候補を変換中文字列あるいは確定済文字列に優先して確定する(ステップS811)。通常の確定、あるいは優先確定の後は当該確定候補を画面表示し(ステップS812)、表示中の変換候補ウィンドウや共起用例ウィンドウを消去(ステップS813)した後、ステップS801に戻って新たな読み文字列の入力を受け付ける。
【0077】
以上説明した実施の形態によれば、共起辞書204にあらかじめ登録されている共起用例を否定するような候補選択・候補確定があった場合に、現在変換中の文節にとどまらず、必要であればすでに確定済の文節に遡って誤選択・誤確定が修正されるため、かな漢字変換における同音語誤りが未然に防止される。
【0078】
なお、上述した実施の形態では時間的に連続する語句間(続けて入力された語句間)の共起関係を監視しているのであって、それらの語句の位置関係は問題にしていない。したがって、たとえば「みつど」を「密度」に確定した直後、カーソルを「密度」の直前に移動して「じんこう」と入力し、変換候補中から「人工」を選択した場合は、一見ケース2のようであるが原理上はケース1の誤変換であって、共起用例ウィンドウにより「人口密度」の正しい組み合わせが示唆されることになる。
【0079】
なお、このように時間的な連続性のみに注目すると、たとえば「じんじ」を「人事」に確定した直後、カーソルを遠く離れた位置に移動して「いどう」を「移動」に変換した場合にも共起用例ウィンドウが表示されることになるが、このような指摘には実用上の意味がない。これを避けるには、たとえばカーソルが確定済文字列の直前・直後以外の位置に意図的に移動される都度、確定済文字列記憶部208の内容をクリアするようにすればよい。
【0080】
なお、直前に確定された語だけでなく、過去により遡って語句間の共起関係を見るようにしてもよい。たとえば読み文字列「おちゃが」「とても」がそれぞれ「お茶が」「とても」に確定された直後、読み文字列「あつい」について「暑い」が選択された場合に、共起用例ウィンドウにより「お茶がとても熱い」を表示して、現在の選択候補を「暑い」から「熱い」に修正できるようにする。これは上述のケース1のバリエーション(共起語の間に他の語が挟まったもの)であるが、ケース2やケース3についても同様である。
【0081】
さらに、共起関係を見るのは必ずしも確定された語句でなくともよい。たとえば「じんじいどう」がスペースキーの押下により「人事異動」と変換された状態で、Shift+右矢印キーを押下すると、「じんじ」文節は未確定のまま「いどう」文節の変換が指示できるようになるが、ここで「移動」を選択した場合に、未確定の「じんじ」についてとりあえず選択されている「人事」に合わせて、共起用例ウィンドウで「人事異動」を提示する。
【0082】
また、上述した実施の形態では共起辞書204に登録された共起関係のすべてについて、当該関係に矛盾する誤変換を共起用例ウィンドウにより指摘するようにしたが、登録された共起関係の中には確率的にその組み合わせの可能性が高いという程度のものであって、それ以外の組み合わせでも誤りとは言えないようなものも含まれている(本来は変換候補の順位決めの参考程度に使用される共起辞書を本発明にも使い回しているため)。
【0083】
そこで共起辞書204に登録された共起関係のうち、その組み合わせでなければ誤りとかなりの確からしさで断定できるようなものや、さらにその中でも操作者が誤りやすいと思われるものに限定して、当該関係を否定するような誤変換があった場合に指摘をおこなうようにしてもよい。
【0084】
なお、共起用例ウィンドウのデザインは図示するものに限らず、たとえば図9に示すように、優先確定を指示した場合に確定される文字列と通常の確定を指示した場合に確定される文字列とをあわせて表示するようにしてもよい。
【0085】
また、共起用例ウィンドウを表示したにもかかわらず操作者が優先確定指示を出さなかった場合には、以後同一の読み文字列の組み合わせで共起用例を否定するような変換候補の選択・確定があっても、共起用例ウィンドウによる指摘をおこなわないよう学習するようにしてもよい。あるいは、共起用例ウィンドウの表示中に操作者による所定の操作、たとえばCtrl+Delキーの意図的な押下があったことをもって、以後同様の指摘をしないよう学習するようにしてもよい。
【0086】
また、上述した実施の形態では文字列入力時に、リアルタイムに誤変換の指摘をおこなったが、バックエンドで誤変換の情報を累積しておいて、あるタイミングでまとめて操作者にフィードバックするようにしてもよい。こうしたフィードバックにより、日本語に関する操作者の知識を正してゆくあるいは豊かにしてゆくことが可能である。
【0087】
たとえば、文書を閉じる際や上書きする際などに誤変換らしい確定文字列をまとめて指摘し、自分が間違っていたなどの理由でこの情報を再利用したいと操作者が考える場合には、次回からも当該誤変換が指摘されるようそれらの確定文字列の組み合わせを登録しておけるようにする。
【0088】
なお、上述した読み入力部200、変換指示部201、確定指示部202、文字列変換部205、変換候補表示部206、誤変換判定部209および共起用例表示部210は、具体的にはHD105からRAM103に読み出されたプログラムをCPU101が実行することにより実現されるものである。このプログラムはHD105のほか、FD107、CD−RW113、MOなどの各種の記録媒体に格納して配布することができ、ネットワークを介して配布することも可能である。また、変換辞書203、共起辞書204、作成中文書記憶部207および確定済文字列記憶部208はRAM103により実現される。
【0089】
【発明の効果】
以上説明したように請求項1に記載の発明は、入力された文字列を他の文字列に変換する文字列変換装置において、第1の文字列の変換候補のうちいずれか一つを確定する第1の確定手段と、第2の文字列の変換候補のうちいずれか一つを選択する選択手段と、前記第1の確定手段により確定された変換候補と前記選択手段により選択された変換候補との間に共起関係があるか否かを判定する判定手段と、前記判定手段により前記変換候補の間に共起関係がないと判定された場合に、前記第2の文字列の変換候補のうち前記第1の確定手段により確定された変換候補と共起関係があるものを確定する第2の確定手段と、を備えたので、変換中の第2の文字列につき選択されている候補が、第1の文字列につきすでに確定されている候補との共起関係からみて同音異義語の変換ミスである可能性の高い場合には、選択中の候補の代わりにそれとは別の、より確からしい同音異義語が選択・確定され、これによって、操作者による同音異義語の誤選択を文字列入力時にリアルタイムに修正することが可能な文字列変換装置が得られるという効果を奏する。
【0090】
また、請求項2に記載の発明は、入力された文字列を他の文字列に変換する文字列変換装置において、第1の文字列の変換候補のうちいずれか一つを確定する第1の確定手段と、第2の文字列の変換候補のうちいずれか一つを選択する選択手段と、前記第1の確定手段により確定された変換候補と前記選択手段により選択された変換候補との間に共起関係があるか否かを判定する判定手段と、前記判定手段により前記変換候補の間に共起関係がないと判定された場合に、前記第1の文字列の変換候補のうち前記選択手段により選択された変換候補と共起関係があるものを確定する第2の確定手段と、を備えたので、第1の文字列につきすでに確定されている候補が、変換中の第2の文字列につき選択されている候補との共起関係からみて同音異義語の変換ミスである可能性の高い場合には、確定済の候補がそれとは別の、より確からしい同音異義語に置換され、これによって、操作者による同音異義語の誤選択や誤確定を文字列入力時にリアルタイムに修正することが可能な文字列変換装置が得られるという効果を奏する。
【0091】
また、請求項3に記載の発明は、入力された文字列を他の文字列に変換する文字列変換装置において、第1の文字列の変換候補のうちいずれか一つを確定する第1の確定手段と、第2の文字列の変換候補のうちいずれか一つを選択する選択手段と、前記第1の確定手段により確定された変換候補と前記選択手段により選択された変換候補との間に共起関係があるか否かを判定する判定手段と、前記判定手段により前記変換候補の間に共起関係がないと判定された場合に、前記第1の文字列の変換候補および前記第2の文字列の変換候補のうち相互に共起関係があるものを確定する第2の確定手段と、を備えたので、第1の文字列につきすでに確定されている候補と、変換中の第2の文字列につき選択されている候補のいずれも、相互間の共起関係からみて同音異義語の変換ミスである可能性の高い場合には、第1の文字列については確定済の候補がそれとは別の、より確からしい同音異義語に置換されるとともに、第2の文字列については選択中の候補の代わりに、それとは別のより確からしい同音異義語が選択・確定され、これによって、操作者による同音異義語の誤選択や誤確定を文字列入力時にリアルタイムに修正することが可能な文字列変換装置が得られるという効果を奏する。
【0092】
また、請求項4に記載の発明は、前記請求項1〜請求項3のいずれか一つに記載の発明において、さらに、前記第2の確定手段により確定される変換候補を表示する表示手段を備えたので、誤選択や誤確定の自動修正に先立って、当該処理を実行してもよいかどうかの最終確認が操作者に対してなされ、これによって、操作者による同音異義語の誤選択や誤確定を操作者の確認を得つつ文字列入力時にリアルタイムに修正することが可能な文字列変換装置が得られるという効果を奏する。
【0093】
また、請求項5に記載の発明は、前記請求項1〜請求項4のいずれか一つに記載の発明において、前記第1の文字列は前記第2の文字列の直前に確定された文字列であるので、時間的に連続して入力された文字列(通常は位置的にも連続(隣接)する文字列)について、相互間の共起関係を基礎として誤選択や誤確定の自動修正がおこなわれ、これによって、操作者による同音異義語の誤選択や誤確定を文字列入力時にリアルタイムに修正することが可能な文字列変換装置が得られるという効果を奏する。
【0094】
また、請求項6に記載の発明は、入力された文字列を他の文字列に変換する文字列変換方法において、第1の文字列の変換候補のうちいずれか一つを確定する第1の確定工程と、第2の文字列の変換候補のうちいずれか一つを選択する選択工程と、前記第1の確定工程で確定された変換候補と前記選択工程で選択された変換候補との間に共起関係があるか否かを判定する判定工程と、前記判定工程で前記変換候補の間に共起関係がないと判定された場合に、前記第2の文字列の変換候補のうち前記第1の確定工程で確定された変換候補と共起関係があるものを確定する第2の確定工程と、を含んだので、変換中の第2の文字列につき選択されている候補が、第1の文字列につきすでに確定されている候補との共起関係からみて同音異義語の変換ミスである可能性の高い場合には、選択中の候補の代わりにそれとは別の、より確からしい同音異義語が選択・確定され、これによって、操作者による同音異義語の誤選択を文字列入力時にリアルタイムに修正することが可能な文字列変換方法が得られるという効果を奏する。
【0095】
また、請求項7に記載の発明は、入力された文字列を他の文字列に変換する文字列変換方法において、第1の文字列の変換候補のうちいずれか一つを確定する第1の確定工程と、第2の文字列の変換候補のうちいずれか一つを選択する選択工程と、前記第1の確定工程で確定された変換候補と前記選択工程で選択された変換候補との間に共起関係があるか否かを判定する判定工程と、前記判定工程で前記変換候補の間に共起関係がないと判定された場合に、前記第1の文字列の変換候補のうち前記選択工程で選択された変換候補と共起関係があるものを確定する第2の確定工程と、を含んだので、第1の文字列につきすでに確定されている候補が、変換中の第2の文字列につき選択されている候補との共起関係からみて同音異義語の変換ミスである可能性の高い場合には、確定済の候補がそれとは別の、より確からしい同音異義語に置換され、これによって、操作者による同音異義語の誤選択や誤確定を文字列入力時にリアルタイムに修正することが可能な文字列変換方法が得られるという効果を奏する。
【0096】
また、請求項8に記載の発明は、入力された文字列を他の文字列に変換する文字列変換方法において、第1の文字列の変換候補のうちいずれか一つを確定する第1の確定工程と、第2の文字列の変換候補のうちいずれか一つを選択する選択工程と、前記第1の確定工程で確定された変換候補と前記選択工程で選択された変換候補との間に共起関係があるか否かを判定する判定工程と、前記判定工程で前記変換候補の間に共起関係がないと判定された場合に、前記第1の文字列の変換候補および前記第2の文字列の変換候補のうち相互に共起関係があるものを確定する第2の確定工程と、を含んだので、第1の文字列につきすでに確定されている候補と、変換中の第2の文字列につき選択されている候補のいずれも、相互間の共起関係からみて同音異義語の変換ミスである可能性の高い場合には、第1の文字列については確定済の候補がそれとは別の、より確からしい同音異義語に置換されるとともに、第2の文字列については選択中の候補の代わりに、それとは別のより確からしい同音異義語が選択・確定され、これによって、操作者による同音異義語の誤選択や誤確定を文字列入力時にリアルタイムに修正することが可能な文字列変換方法が得られるという効果を奏する。
【0097】
また、請求項9に記載の発明によれば、前記請求項6〜請求項8のいずれか一つに記載された方法をコンピュータに実行させることが可能なプログラムが得られるという効果を奏する。
【図面の簡単な説明】
【図1】この発明の実施の形態による文字列変換装置のハードウエア構成を示す説明図である。
【図2】この発明の実施の形態による文字列変換装置の機能的構成を示す説明図である。
【図3】この発明の実施の形態による共起辞書204の内容を模式的に示す説明図である。
【図4】この発明の実施の形態による共起用例ウィンドウの一例を示す説明図である。
【図5】この発明の実施の形態による共起用例ウィンドウの他の一例を示す説明図である。
【図6】この発明の実施の形態による共起用例ウィンドウの他の一例を示す説明図である。
【図7】この発明の実施の形態による共起用例ウィンドウの他の一例を示す説明図である。
【図8】この発明の実施の形態による文字列変換装置における、文字列変換処理の手順を示すフローチャートである。
【図9】この発明の実施の形態による共起用例ウィンドウの他の一例を示す説明図である。
【図10】本出願人が製造・販売するかな漢字変換ソフトウエア「ATOK」の同音語用例表示機能により表示される、同音語用例ウィンドウの一例を示す説明図である。
【符号の説明】
101 CPU
102 ROM
103 RAM
104 HDD
105 HD
106 FDD
107 FD
108 ディスプレイ
109 ネットワークI/F
110 通信ケーブル
111 キーボード
112 マウス
113 CD−RW
114 CD−RWドライブ
200 読み入力部
201 変換指示部
202 確定指示部
203 変換辞書
204 共起辞書
205 文字列変換部
206 変換候補表示部
207 作成中文書記憶部
208 確定済文字列記憶部
209 誤変換判定部
210 共起用例表示部
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a character string conversion device that converts an input character string into another character string, a character string conversion method, and a program that causes a computer to execute the method.
[0002]
[Prior art]
The plural homonyms that exist for the same reading character string must be used finely depending on the meaning and context. In conventional kana-kanji conversion software such as "ATOK" manufactured and sold by the present applicant, one of the homonyms is selected and determined according to the operator's instruction. Due to study, etc., erroneous conversions such as “personnel movement” and “artificial satellite” often occur.
[0003]
In order to prevent such erroneous conversion, ATOK determines the order of conversion candidates by raising the order of those that have a co-occurrence relationship with the most recently determined few words (AI example function). By this function, for example, if you convert the reading character string "Atsu" after "tea""ga","hot" becomes the first candidate, and if you convert the reading character string "hot" after "summer""ha", For example, “hot” is the first candidate, and the conversion candidate that is most likely in relation to other words that have been determined is preferentially presented.
[0004]
[Problems to be solved by the invention]
However, conversely, just because it is the first candidate does not necessarily mean that it has a co-occurrence relationship with other words, but it is also the case that the conversion candidate that was most recently determined for the same reading character string was just that. is there. That is, it cannot be said that the candidate presented with priority is always a word that is highly likely to be stochastically accurate.
[0005]
As described above, in the prior art, it is not possible to distinguish whether the higher-order conversion candidate has been prioritized by co-occurrence or simply by learning. However, there is a problem that even if an operation that is likely to be conversion is performed, it cannot be corrected.
[0006]
ATOK has a function of displaying the meaning and usage of each candidate in a separate window when a list of conversion candidates is displayed (same word example display function). FIG. 10 is an explanatory diagram showing an example of the homophone example window displayed by the homophone example display function.
[0007]
When it is difficult to select a homonym, the operator can refer to such homonym usage information, but as shown in the figure, actual usage examples are only a few examples per word. The operator must analogy. At the present time, information on proper use is not prepared for all candidates in the candidate list, and the above information is prepared only for words having a triangle mark on the right side in the figure.
[0008]
Also, the word processing software "Ichitaro" manufactured and sold by the applicant has a document proofing function called "Shuta", and the operator executes this function during document creation or after document completion. You can check the homonym errors in the document at once. However, many simple editors do not have this function, and software that mainly handles images and sounds does not have a proofreading function even if there are many opportunities for character input. is there.
[0009]
SUMMARY OF THE INVENTION The present invention solves the above-mentioned problem of the prior art, in which a character string conversion device, a character string conversion method, and a character string conversion method capable of correcting erroneous selection or erroneous determination of a homonym by an operator in real time when a character string is input. It is intended to provide a program for causing a computer to execute the program.
[0010]
[Means for Solving the Problems]
In order to solve the above-mentioned problem and achieve the object, a character string conversion device according to the first aspect of the present invention is a character string conversion device that converts an input character string into another character string. First determining means for determining one of the character string conversion candidates, selecting means for selecting one of the second character string conversion candidates, and determining by the first determining means Determining means for determining whether there is a co-occurrence relationship between the selected conversion candidate and the conversion candidate selected by the selecting means, and determining that no co-occurrence relation exists between the conversion candidates by the determining means And a second deciding means for deciding which of the conversion candidates of the second character string has a co-occurrence relationship with the conversion candidate decided by the first deciding means. Features.
[0011]
According to the first aspect of the present invention, the candidate selected for the second character string being converted is a homonymous term in view of the co-occurrence relationship with the candidate already determined for the first character string. If it is highly probable that there is a conversion error, a different, more likely homonym is selected and fixed in place of the selected candidate.
[0012]
According to a second aspect of the present invention, in the character string conversion apparatus for converting an input character string into another character string, any one of the first character string conversion candidates is provided. , A selection means for selecting one of the conversion candidates for the second character string, and a conversion candidate determined by the first determination means and a selection made by the selection means. Determining means for determining whether or not there is a co-occurrence relation between the conversion candidates and the first character string when the determination means determines that there is no co-occurrence relation between the conversion candidates And a second deciding means for deciding which one of the conversion candidates has a co-occurrence relationship with the conversion candidate selected by the selecting means.
[0013]
According to the second aspect of the present invention, the candidate already determined for the first character string is a homonymous term in view of the co-occurrence relationship with the candidate selected for the second character string being converted. If there is a high probability of a conversion error, the confirmed candidate is replaced with another, more likely homonym.
[0014]
According to a third aspect of the present invention, in the character string conversion apparatus for converting an input character string into another character string, any one of the first character string conversion candidates is provided. , A selection means for selecting one of the conversion candidates for the second character string, and a conversion candidate determined by the first determination means and a selection made by the selection means. Determining means for determining whether or not there is a co-occurrence relation between the conversion candidates and the first character string when the determination means determines that there is no co-occurrence relation between the conversion candidates And a second deciding unit for deciding which one of the conversion candidates and the second character string conversion candidate have a co-occurrence relationship with each other.
[0015]
According to the third aspect of the present invention, the co-occurrence relationship between the candidate already determined for the first character string and the candidate selected for the second character string being converted is mutually recognized. If it is highly probable that the homonym is incorrectly converted, the determined candidate for the first character string is replaced with another more likely homonym, and For the character string, another more likely homonym is selected and determined instead of the selected candidate.
[0016]
According to a fourth aspect of the present invention, there is provided the character string conversion apparatus according to any one of the first to third aspects, further comprising a conversion candidate determined by the second determining means. Is displayed on the display.
[0017]
According to the fourth aspect of the invention, prior to automatic correction of erroneous selection or erroneous determination, a final confirmation is made to the operator as to whether or not the processing may be executed.
[0018]
According to a fifth aspect of the present invention, in the character string conversion apparatus according to any one of the first to fourth aspects, the first character string is the same as the second character string. It is a character string determined immediately before.
[0019]
According to the fifth aspect of the present invention, a character string input continuously in time (usually a character string continuous (adjacent) in position) is erroneous based on the co-occurrence relationship between them. Automatic correction of selection and erroneous confirmation is performed.
[0020]
According to a sixth aspect of the present invention, in the character string conversion method for converting an input character string to another character string, any one of the first character string conversion candidates is used. , A selection step of selecting one of the conversion candidates of the second character string, and a conversion candidate determined in the first determination step and a selection of the conversion candidate selected in the selection step. A determining step of determining whether or not there is a co-occurrence relationship between the conversion candidate and the second character string when it is determined in the determining step that there is no co-occurrence relation between the conversion candidates. And a second determination step of determining a conversion candidate having a co-occurrence relationship with the conversion candidate determined in the first determination step.
[0021]
According to the invention described in claim 6, the candidate selected for the second character string being converted is a homonymous term in view of the co-occurrence relationship with the candidate already determined for the first character string. If it is highly probable that there is a conversion error, a different, more likely homonym is selected and fixed in place of the selected candidate.
[0022]
In the character string conversion method according to the present invention, in the character string conversion method for converting an input character string into another character string, any one of the first character string conversion candidates , A selection step of selecting one of the conversion candidates of the second character string, and a conversion candidate determined in the first determination step and a selection of the conversion candidate selected in the selection step. A determining step of determining whether there is a co-occurrence relationship between the conversion candidate and the first character string if it is determined in the determining step that there is no co-occurrence relation between the conversion candidates And a second deciding step of deciding which of the conversion candidates has a co-occurrence relationship with the conversion candidate selected in the selection step.
[0023]
According to the seventh aspect of the present invention, the candidate already determined for the first character string is a homonymous term in view of the co-occurrence relationship with the candidate selected for the second character string being converted. If there is a high probability of a conversion error, the confirmed candidate is replaced with another, more likely homonym.
[0024]
In the character string conversion method according to the present invention, in the character string conversion method for converting an input character string to another character string, any one of the first character string conversion candidates , A selection step of selecting one of the conversion candidates of the second character string, and a conversion candidate determined in the first determination step and a selection of the conversion candidate selected in the selection step. A determining step of determining whether there is a co-occurrence relationship between the conversion candidate and the first character string if it is determined in the determining step that there is no co-occurrence relation between the conversion candidates And a second deciding step of deciding which of the conversion candidates and the second character string conversion candidates have a co-occurrence relationship with each other.
[0025]
According to the eighth aspect of the present invention, the co-occurrence relationship between the candidate already determined for the first character string and the candidate selected for the second character string under conversion is mutually recognized. If it is highly probable that the homonym is incorrectly converted, the determined candidate for the first character string is replaced with another more likely homonym, and For the character string, another more likely homonym is selected and determined instead of the selected candidate.
[0026]
According to a program according to a ninth aspect of the present invention, the method according to any one of the sixth to eighth aspects is executed by a computer.
[0027]
BEST MODE FOR CARRYING OUT THE INVENTION
Exemplary embodiments of a character string conversion device, a character string conversion method, and a program for causing a computer to execute the method according to the present invention will be described in detail below with reference to the accompanying drawings.
[0028]
FIG. 1 is an explanatory diagram showing a hardware configuration of a character string conversion device according to an embodiment of the present invention. In FIG. 1, reference numeral 101 denotes a CPU for controlling the entire apparatus, 102 denotes a ROM storing a basic input / output program, and 103 denotes a RAM used as a work area of the CPU 101.
[0029]
An HDD (hard disk drive) 104 controls reading / writing of data from / to an HD (hard disk) 105 under the control of the CPU 101, and an HD 105 stores data written under the control of the HDD 104. I have.
[0030]
An FDD (Flexible Disk Drive) 106 controls reading / writing of data from / to an FD (Flexible Disk) 107 under the control of the CPU 101, and a detachable FD 107 stores data written under the control of the FDD 106. Are shown respectively.
[0031]
Reference numeral 108 denotes a display for displaying various data such as cursors, menus, windows, and characters and images, and reference numeral 109 denotes a connection to a network such as a LAN via a communication cable 110, and functions as an interface between the network and the CPU 101. The network I / F is shown respectively.
[0032]
Reference numeral 111 denotes a keyboard having a plurality of keys for inputting characters, numerical values, various instructions, and the like. 112 denotes a mouse for selecting and executing various instructions, selecting a processing target, moving a mouse pointer, and the like. Is shown. Reference numeral 113 denotes a CD-RW which is a removable recording medium, 114 denotes a CD-RW drive for controlling reading of data from / to the CD-RW 113, and 100 denotes a bus or a cable for connecting each of the above units. ing.
[0033]
Next, FIG. 2 is an explanatory diagram functionally showing the configuration of the character string conversion device according to the embodiment of the present invention. First, reference numeral 200 denotes a reading input unit, which is a functional unit that receives an input of a reading character string in Roman characters, converts the Roman characters into Hiragana, and delivers the converted characters to a character string converting unit 205 described later. When the reading character string is input in hiragana from the beginning, it is not necessary to convert from Roman characters to hiragana.
[0034]
Reference numeral 201 denotes a conversion instruction unit, which is a functional unit that receives an instruction to convert a character string of interest into another character string from an operator, and notifies a character string conversion unit 205 described below. This conversion instruction is performed, for example, by pressing a space key on keyboard 111.
[0035]
In the first conversion instruction, the character string conversion unit 205, which has received the notification from the conversion instruction unit 201, sets the first character among the conversion candidates of the read character string as the other character string (hereinafter, “first candidate”). "). Further, the second or later conversion instruction means switching of the selected conversion candidate (hereinafter, referred to as “selection candidate”), and the character string conversion unit 205 that has received the notification from the conversion instruction unit 201 selects the currently selected conversion candidate. Is selected instead of the conversion candidate of.
[0036]
Reference numeral 202 denotes a determination instruction unit, which is a functional unit that receives an instruction to determine a character string being converted from an operator and notifies the character string conversion unit 205 of the instruction. There are two types of confirmation instructions according to the present embodiment, a normal confirmation instruction and a priority confirmation instruction described later.
[0037]
The former is performed, for example, by pressing the Enter key or the down arrow key. In the case of the Enter key, all the phrases being converted are determined, and in the case of the Down arrow key, only the phrase of interest (the phrase where the cursor is located) is determined. . The latter is performed by, for example, the Shift + Enter key. The processing when this instruction is given will be described later.
[0038]
Reference numerals 203 and 204 denote dictionaries referred to by the character string conversion unit 205. Reference numeral 203 denotes a conversion dictionary in which a pre-conversion character string (reading) is associated with a post-conversion character string (notation). It is a co-occurrence dictionary associated with.
[0039]
FIG. 3 is an explanatory diagram schematically showing the contents of the co-occurrence dictionary 204. As shown in the drawing, the co-occurrence dictionary 204 is associated with readings and expressions of co-occurring words. Although two words are associated here, three or more words may be used. Here, for convenience of explanation, the conversion dictionary 203 and the co-occurrence dictionary 204 are separately organized. However, by integrating the contents of the co-occurrence dictionary 204 into the conversion dictionary 203, the two are integrated. May be.
[0040]
Reference numeral 205 denotes a character string conversion unit, which is a functional unit that converts an arbitrary character string into a different character string. Immediately after the reading character string is input from the reading input unit 200, when the conversion instruction unit 201 detects the input of the conversion instruction, the character string conversion unit 205 changes the break position of each phrase for the above reading character string. The conversion dictionary 203 is searched to obtain the most probable break positions and conversion candidates for each phrase.
[0041]
After that, the character string conversion unit 205 searches the co-occurrence dictionary 204, and finds a combination having a co-occurrence relationship among combinations of conversion candidates of each clause, that is, a phrase that is associated with the co-occurrence dictionary 204. If there is a combination, the order of those conversion candidates is raised to be the first candidate of each phrase. Then, the first candidate is selected for each phrase, and all the conversion candidates of each phrase are transferred to a conversion candidate display unit 206 described later.
[0042]
When a conversion instruction for the same phrase is input again from the conversion instruction unit 201, the character string conversion unit 205 switches the selection candidate of the phrase from the current one to the next lower one, and converts the fact to that fact. The candidate display unit 206 is notified.
[0043]
Also, when a normal confirmation instruction is input from the confirmation instruction unit 202, the character string conversion unit 205 sets the selection candidate at that time as a confirmation candidate to the document-in-creation storage unit 207 described below, Then, all the conversion candidates of the read character string including the fixed candidate are transferred to the fixed character string storage unit 208 described later. Note that the processing of the character string conversion unit 205 when a priority determination instruction is input from the determination instruction unit 202 will differ depending on the case, and will be described later.
[0044]
Reference numeral 206 denotes a conversion candidate display unit, which is a functional unit that displays a conversion candidate passed from the character string conversion unit 205 on a screen. The conversion candidate display unit 206 only replaces the read character string on the screen with the first candidate in the first conversion instruction, but replaces the first candidate with the second candidate in the second conversion instruction, A conversion candidate window (described later) listing conversion candidates for the read character string is displayed.
[0045]
Reference numeral 207 denotes a document storage unit under creation, which is a functional unit that stores the fixed candidates sequentially output from the character string conversion unit 205, that is, the entire document created up to that point.
[0046]
Reference numeral 208 denotes a determined character string storage unit, which is a functional unit that stores the read character string determined immediately before by the character string conversion unit 205 and all the conversion candidates. When the confirmed read character string and all of the conversion candidates are delivered from the character string conversion unit 205 that has been instructed by the confirmation instruction unit 202, the confirmed character string storage unit 208 stores the currently stored read character string. And the conversion candidate are discarded, and the read character string and the conversion candidate are stored instead.
[0047]
Reference numeral 209 denotes an erroneous conversion determination unit that is registered in the co-occurrence dictionary 204 based on the presence or absence of a co-occurrence relationship between the conversion candidate of the currently-read reading character string and the conversion candidate of the previously-read reading character string. This is a function unit that determines whether or not there is an erroneous conversion to a homonym that contradicts the co-occurrence relation. Reference numeral 210 denotes a co-occurrence example display unit, which is a functional unit that displays an optimal combination of conversion candidates in a co-occurrence example window when the erroneous conversion determination unit 209 determines that there is erroneous conversion.
[0048]
There are the following three cases in which the erroneous conversion determination unit 209 determines that there is erroneous conversion / has occurred, and thus the co-occurrence example window is displayed by the co-occurrence example display unit 210.
[0049]
(Case 1) The conversion candidate selected for the reading character string being converted does not have a co-occurrence relationship with the fixed candidate for the reading character string determined immediately before, and among the conversion candidates for the reading character string being converted. , If there is a co-occurrence relationship with the final candidate for the read character string that was determined immediately before
[0050]
For example, when the conversion instruction unit 201 detects that the space key has been pressed, that is, the conversion instruction unit 201 has detected that the reading character string “Jinjido” has been pressed, It is divided into two phrases "Ido" and converted into "HR" and "Transfer", respectively.
[0051]
At this time, since the cursor is located at the head of the "phrase" of the phrase, if the down arrow key is pressed in this state, the determination instruction unit 202 that has detected the operation will instruct the character string conversion unit 205 to determine the target phrase. It is transmitted and only "Jinji" is determined as "HR". That is, the fixed candidate "HR" is sent from the character string conversion unit 205 to the document storage unit 207 while the read character string "Jinji" and its conversion candidates "HR" and "Jinji" are stored in the fixed character string. It is sent to the unit 208.
[0052]
Immediately after this, the cursor moves to the “transfer” of the following phrase. If the space key is pressed in this state, the character string conversion unit 205 replaces the “transfer” of the first candidate with “transfer” of the second candidate. select. Further, a conversion candidate window 400 as shown in FIG. 4 is displayed by the conversion candidate display unit 206, and conversion candidates of the reading character string "Ido" are listed, and the currently selected second candidate is highlighted (inverted). Is displayed.
[0053]
The conversion candidate (including the selection candidate) of the reading character string being converted by the character string conversion unit 205 and the conversion candidate of the reading character string that has just been determined and held in the determined character string storage unit 208 (the determination candidate The conversion error determination unit 209 monitoring the relationship between the conversion character string “Ido” and the conversion candidate “Move” selected for the conversion character string “Ido”, ) Is not co-occurring with HR, and the conversion candidate of the reading character string being converted contains `` change '' which is co-occurring with HR, that is, It is detected that the example corresponds to the erroneous conversion of case 1.
[0054]
When such an erroneous conversion is detected, the erroneous conversion determination unit 209 displays a combination of conversion candidates that is plausible from the viewpoint of co-occurrence, in this case, a combination of “HR” and “transfer”. And prompts the operator to reconsider using the co-occurrence example window 401 as shown in FIG. The illustrated co-occurrence example window 401 continues to be displayed as long as a conversion candidate other than “transfer” and “Ido” is selected in the conversion candidate window 400 (only when “Transfer” and “Ido” are selected). Will be erased).
[0055]
(Case 2) The conversion candidate selected for the reading character string being converted does not have a co-occurrence relationship with the previously determined reading character string determination candidate, and the conversion candidate of the previously determined reading character string is not In the case where there is a co-occurrence with the conversion candidate selected for the reading character string being converted
[0056]
For example, immediately after the reading character string “Jinko” is determined as “artificial”, if there is a conversion instruction for the reading character string “Mitsudo”, the character string conversion unit 205 selects the first candidate “density”. . Then, the erroneous conversion determination unit 209 determines that the selected conversion candidate “density” has no co-occurrence relationship with the immediately preceding fixed candidate “artificial”, and that “density” is included in the other conversion candidates of “jinko”. When it is detected that there is a "population" in a co-occurrence relationship, that is, that the above example corresponds to the erroneous conversion of case 2, the co-occurrence example window as shown in FIG. Display 500.
[0057]
(Case 3) The conversion candidate selected for the reading character string being converted does not have a co-occurrence relationship with the fixed candidate of the reading character string determined immediately before, and is included in the conversion candidates of the reading character string being converted. , If there is a co-occurrence with the conversion candidate of the read character string determined immediately before
[0058]
For example, immediately after the reading character string “Jinko” is determined by “Population”, if there is a conversion instruction for the reading character string “Eisei”, the character string conversion unit 205 selects the first candidate “Hygiene”. . Then, the erroneous conversion determination unit 209 determines that the selected conversion candidate “sanitation” is not in a co-occurrence relationship with the immediately preceding fixed candidate “population” and is one of the conversion candidates “eisei”, When it is detected that there is a co-occurrence relationship with “artificial” which is one of the conversion candidates of “Jinko”, that is, that the above example corresponds to the erroneous conversion of case 3, the co-occurrence example display unit 210 displays Instruct the co-occurrence example window 600 as shown in FIG. 6 to be displayed.
[0059]
In Cases 1 to 3, erroneous homonymous words are selected and fixed such that the co-occurrence relationship should be established if the conversion candidates are properly selected and determined. If you have. Each of the co-occurrence example windows 401, 500, and 600 is for presenting to the operator a combination of words having a co-occurrence relationship, that is, a most probable combination of words from the co-occurrence relationship.
[0060]
When the Shift + Enter key is pressed while the co-occurrence example window is displayed, the word in the co-occurrence example window should be given priority over the selected or confirmed word by the confirmation instruction unit 202 that has detected the fact. (Priority determination instruction) is transmitted to the character string conversion unit 205. "Prefer" means that a conversion candidate being selected is selected and fixed in the co-occurrence example window instead of the selected conversion candidate. For a conversion candidate that has been determined, the candidate is used as a co-occurrence example. It means to replace with the conversion candidate in the window.
[0061]
That is, in case 1 shown in FIG. 4, the character string conversion unit 205 receiving the instruction from the determination instruction unit 202 replaces the selected “move” with the “transfer” in the co-occurrence example window 401. Is selected, and “transfer” is sent to the in-creation document storage unit 207 as a fixed candidate. In addition, the read character string “Ido” and its conversion candidates “transfer”, “move”, “different”, etc. are sent to the confirmed character string storage unit 208.
[0062]
Further, in case 2 shown in FIG. 5, the character string conversion unit 205 cancels the determination of the reading character string “jinko” determined immediately before to “artificial” and sets a new determination candidate for the phrase. The “population” in the co-occurrence example window 500 is sent to the document storage unit 207 during creation. Receiving this, the in-creation document storage unit 207 replaces “artificial”, which is the previous fixed candidate, with “population”, which is the current fixed candidate.
[0063]
As for the currently read character string “Mitsudo”, the character string conversion unit 205 uses “Density”, which is being selected and also displayed in the co-occurrence example window 500, as a determination candidate and stores the document being created. To the unit 207. Further, the read character string “Mitsudo” and the conversion candidate “density” are sent to the confirmed character string storage unit 208.
[0064]
That is, in case 1, only the conversion candidate that is likely to be considered from the viewpoint of co-occurrence is selected and determined for the phrase currently being converted. In case 2, the conversion candidate is traced back to the phrase that was determined immediately before. The determination is reversed, and the correct conversion candidate is selected and determined again.
[0065]
Further, in case 3 shown in FIG. 6, the character string conversion unit 205 cancels the determination of the read character string “Jinko” determined immediately before to “population”, and sets a new determination candidate of the phrase. The “artificial” in the co-occurrence example window 600 is sent to the document storage unit 207 during creation. Receiving this, the in-creation document storage unit 207 replaces “population”, which is the previous fixed candidate, with “artificial”, which is the current fixed candidate.
[0066]
Further, for the currently read character string “Eisei”, the character string conversion unit 205 selects “Satellite” in the co-occurrence example window 600 instead of “Hygiene” being selected, Is sent to the document-in-creation storage unit 207 as a determination candidate. Further, it transmits the read character string “eisei” and its conversion candidates “satellite”, “sanitary”, “eternal”,.
[0067]
That is, Case 3 is a mixed type of Case 1 and Case 2, and as in Case 1, a plausible conversion candidate is selected and confirmed from the viewpoint of co-occurrence for the phrase currently being converted. The correct conversion candidate is also selected and determined again for the phrase determined immediately before.
[0068]
FIG. 7 shows a state in which a conversion instruction has been input again from FIG. 6, and a conversion candidate window 700 listing conversion candidates for the read character string "eisei" is newly displayed. At this time, the selection candidate of “seisei” has been switched from “sanitary” to “satellite”, and the relationship between the immediately preceding fixed candidate and the current selection candidate has changed from case 3 to case 2; However, from the viewpoint of co-occurrence, there is a high possibility that the conversion is erroneous, so the co-occurrence example window 600 remains displayed from the state of FIG.
[0069]
FIG. 8 is a flowchart showing a procedure of a character string conversion process in the character string conversion device according to the embodiment of the present invention.
[0070]
After the reading character string is input from the reading input unit 200 (step S801), when a conversion instruction is input by pressing the space key or the like from the conversion instruction unit 201 (step S802: Yes), the character string conversion unit 205 The conversion candidate for each phrase in the character string is read from the conversion dictionary 203 (step S803), the priority of each candidate is determined with reference to the co-occurrence dictionary 204, and the first candidate is selected for each phrase. (Step S804). Then, the conversion candidate display unit 206 displays the first candidate on the screen instead of the read character string of each phrase (step S805).
[0071]
In parallel with the candidate display by the conversion candidate display unit 206, the erroneous conversion determination unit 209 stores the conversion candidate read by the character string conversion unit 205 in step S803 and the conversion candidate read in the confirmed character string storage unit 208. It is determined whether or not there is a relationship like the above-described cases 1 to 3 with the conversion candidate of the read character string determined immediately before (step S806).
[0072]
If the above relationship exists, that is, if a homonym that contradicts the co-occurrence relationship registered in the co-occurrence dictionary 204 has been selected and determined (step S806: Yes), the erroneous conversion determination unit 209 Delivers the correct combination of candidates to the co-occurrence example display unit 210 and displays the co-occurrence example window as shown in FIGS. 4 to 6 (step S807).
[0073]
Thereafter, the process returns to step S802, and if there is a conversion instruction again (step S802: Yes), there is a conversion candidate read in the previous loop, so step S803 is omitted, and the candidate with the next lower rank than the currently selected candidate is selected. Is selected (step S804). Since this is a conversion instruction for the same phrase again, the conversion candidate display unit 206 not only replaces the displayed first candidate with the second candidate but also opens a conversion candidate window to list other conversion candidates. It is displayed (step S805).
[0074]
At this time, the erroneous conversion determination unit 209 also monitors the relationship between the current conversion candidate and the immediately preceding conversion candidate. If the relationship as in Cases 1 to 3 continues to be satisfied (Step S806: Yes) ), The co-occurrence example window displayed in the previous loop is kept displayed (step S807).
[0075]
If a confirmation instruction is input from the confirmation instruction unit 202 instead of the conversion instruction again after returning to step S802 (step S802: No, step S808: Yes), the instruction is pressed by the Enter key or the down arrow key. (Step S809: Yes), the character string conversion unit 205 determines the candidate selected at that time (step S810).
[0076]
If the instruction is a priority determination instruction by pressing the Shift + Enter key (step S809: No), the character string conversion unit 205 converts a candidate in the co-occurrence example window into a character string being converted or a determined character according to the case. The determination is made prior to the character string (step S811). After normal determination or priority determination, the determination candidate is displayed on the screen (step S812), the currently displayed conversion candidate window and the co-occurrence example window are deleted (step S813), and the process returns to step S801 to perform new reading. Accept character string input.
[0077]
According to the above-described embodiment, when there is a candidate selection / candidate decision that denies a co-occurrence example registered in the co-occurrence dictionary 204 in advance, it is necessary to go beyond the phrase currently being converted. If there is, the erroneous selection and erroneous determination are corrected retroactively to the already determined phrase, so that a homophone error in kana-kanji conversion is prevented beforehand.
[0078]
In the above-described embodiment, the co-occurrence relationship between temporally consecutive phrases (between consecutively input phrases) is monitored, and the positional relationship between these phrases is not considered. Therefore, for example, immediately after "Mitsudo" is set to "Density", if the cursor is moved to just before "Density", "Jinko" is entered, and "Artificial" is selected from the conversion candidates, a seemingly Like 2, but in principle it is an erroneous transformation of Case 1 and the co-occurrence example window will suggest the correct combination of "population density".
[0079]
Focusing only on the temporal continuity in this way, for example, immediately after confirming "Jinji" as "HR", the cursor was moved to a position far away and "Ido" was converted to "Move" In such a case, a co-occurrence example window will be displayed, but such a point has no practical meaning. To avoid this, the contents of the determined character string storage unit 208 may be cleared each time the cursor is intentionally moved to a position other than immediately before or immediately after the determined character string.
[0080]
The co-occurrence relationship between words and phrases may be viewed retrospectively in addition to the word that was determined immediately before. For example, immediately after the reading character strings "Ochaga" and "Very" are respectively determined to be "Ochaga" and "Very", if "Hot" is selected for the reading character string "Atsu", the co-occurrence example window "Tea is very hot" is displayed so that the current selection can be corrected from "hot" to "hot". This is a variation of case 1 described above (another word interposed between co-occurring words), but the same applies to case 2 and case 3.
[0081]
Further, it is not always necessary to look at a co-occurrence relationship with a fixed phrase. For example, if "Shijijido" is converted to "Personnel transfer" by pressing the space key, if Shift + Right arrow key is pressed, the "Juji" clause is indeterminate and "Ido" clause conversion is instructed. However, if "Move" is selected here, "Personnel change" is presented in the co-occurrence example window in accordance with the currently selected "Personnel" for the undetermined "Jinji".
[0082]
In the above-described embodiment, for all the co-occurrence relations registered in the co-occurrence dictionary 204, an erroneous conversion inconsistent with the relation is pointed out in the co-occurrence example window. Some of the combinations are probable that the combination is highly probabilistic, and some other combinations are not considered to be an error. The co-occurrence dictionary used for the present invention is also used in the present invention).
[0083]
Therefore, of the co-occurrence relations registered in the co-occurrence dictionary 204, those which can be concluded with considerable certainty as errors unless they are combinations thereof, and those among which the operator is likely to make mistakes are limited. Alternatively, an indication may be given when there is an erroneous conversion that denies the relationship.
[0084]
The design of the co-occurrence example window is not limited to the illustrated one. For example, as shown in FIG. 9, a character string determined when priority determination is instructed and a character string determined when normal determination is instructed May be displayed together.
[0085]
If the operator does not give a priority confirmation instruction even though the co-occurrence example window is displayed, a conversion candidate that denies the co-occurrence example with the same combination of read character strings is selected and confirmed. Even if there is, learning may be performed so as not to point out in the co-occurrence example window. Alternatively, learning may be performed so that the same indication is not performed thereafter when a predetermined operation by the operator is performed while the co-occurrence example window is displayed, for example, when the Ctrl + Del key is intentionally pressed.
[0086]
Further, in the above-described embodiment, when a character string is input, an erroneous conversion is pointed out in real time. However, information on the erroneous conversion is accumulated in the back end, and the information is collectively fed back to the operator at a certain timing. You may. With such feedback, it is possible to correct or enrich the operator's knowledge of Japanese.
[0087]
For example, when closing a document or overwriting a document, it points out a confirmed character string that seems to be incorrectly converted, and if the operator wants to reuse this information because he or she was wrong, for example, Also, a combination of these confirmed character strings can be registered so that the erroneous conversion is pointed out.
[0088]
Note that the reading input unit 200, the conversion instruction unit 201, the confirmation instruction unit 202, the character string conversion unit 205, the conversion candidate display unit 206, the erroneous conversion determination unit 209, and the co-occurrence example display unit 210 are, specifically, the HD 105 This is realized by the CPU 101 executing a program read from the RAM 103 into the RAM 103. This program can be stored and distributed on various recording media such as the FD 107, the CD-RW 113, and the MO in addition to the HD 105, and can also be distributed via a network. The conversion dictionary 203, the co-occurrence dictionary 204, the document-in-creation storage unit 207, and the determined character string storage unit 208 are realized by the RAM 103.
[0089]
【The invention's effect】
As described above, according to the first aspect of the present invention, in a character string conversion device that converts an input character string to another character string, one of the first character string conversion candidates is determined. First determining means, selecting means for selecting any one of the second character string conversion candidates, conversion candidates determined by the first determining means, and conversion candidates selected by the selecting means Determining means for determining whether or not there is a co-occurrence relationship between the second character string and the conversion candidate of the second character string when the determination means determines that there is no co-occurrence relation between the conversion candidates. And second determination means for determining a conversion candidate that has a co-occurrence relationship with the conversion candidate determined by the first determination means, so that the candidate selected for the second character string being converted is selected. Is shared with the already determined candidate for the first string. If there is a high possibility that the homonym is erroneously converted from the viewpoint of the relation, another and more likely homonym is selected and fixed in place of the selected candidate, and the homonym by the operator is thereby determined. This has the effect of providing a character string conversion device that can correct erroneous selection of a synonym in real time when a character string is input.
[0090]
According to a second aspect of the present invention, in the character string conversion device for converting an input character string into another character string, the first character string conversion device determines one of the first character string conversion candidates. Determining means, selecting means for selecting any one of the conversion candidates for the second character string, and selecting between the conversion candidate determined by the first determining means and the conversion candidate selected by the selecting means. Determining means for determining whether or not there is a co-occurrence relationship between the first character string and the conversion candidates of the first character string when the determination means determines that there is no co-occurrence relation between the conversion candidates. And a second determination unit for determining a candidate that has a co-occurrence relationship with the conversion candidate selected by the selection unit. Same sound from the co-occurrence relationship with the candidate selected for the character string If it is likely that the synonym is incorrect, the confirmed candidate is replaced with another, more likely homonym, which allows the operator to incorrectly select or misidentify the homonym. There is an effect that a character string conversion device that can correct in real time when a character string is input can be obtained.
[0091]
According to a third aspect of the present invention, in the character string conversion device for converting an input character string into another character string, the first character string conversion device determines one of the first character string conversion candidates. Determining means, selecting means for selecting any one of the conversion candidates for the second character string, and selecting between the conversion candidate determined by the first determining means and the conversion candidate selected by the selecting means. Determining means for determining whether or not there is a co-occurrence relationship between the first character string and the conversion candidate for the first character string when the determining means determines that there is no co-occurrence relation between the conversion candidates. And second determination means for determining the conversion candidates of the second character string that have a co-occurrence relationship with each other, so that the candidate already determined for the first character string and the second conversion Any of the candidates selected for the two strings are co-occurring with each other If it is highly probable that the homonym is erroneously converted from the viewpoint of the relation, the determined candidate for the first character string is replaced with another more likely homonym, and For the character string of, in place of the currently selected candidate, another more likely homonym is selected and confirmed, which enables the operator to select or mistakenly select the homonym in real time when entering the character string. This provides an effect that a character string conversion device that can be corrected to the above is obtained.
[0092]
According to a fourth aspect of the present invention, in the invention of any one of the first to third aspects, a display unit for displaying a conversion candidate determined by the second determining unit is further provided. Before the automatic correction of erroneous selection or erroneous determination, a final confirmation is made to the operator as to whether or not the process can be executed. There is an effect that a character string conversion device capable of correcting an erroneous determination in real time at the time of character string input while obtaining the confirmation of the operator is provided.
[0093]
According to a fifth aspect of the present invention, in the first aspect of the present invention, the first character string is a character determined immediately before the second character string. Automatic correction of erroneous selections and erroneous determinations based on the co-occurrence relationship between character strings that are input consecutively in time (usually character strings that are continuous (adjacent) in position) because they are strings As a result, there is an effect that a character string conversion device capable of correcting an erroneous selection or erroneous determination of a homonym by an operator in real time when a character string is input is obtained.
[0094]
According to a sixth aspect of the present invention, in the character string conversion method for converting an input character string to another character string, the first character string conversion method includes the steps of: determining one of the first character string conversion candidates; A determination step, a selection step of selecting one of the conversion candidates of the second character string, and a step between the conversion candidate determined in the first determination step and the conversion candidate selected in the selection step. A determining step of determining whether or not there is a co-occurrence relationship, and when it is determined in the determining step that there is no co-occurrence relationship between the conversion candidates, A second determination step of determining a conversion candidate that has a co-occurrence relationship with the conversion candidate determined in the first determination step, so that the candidate selected for the second character string being converted is Changes in homonyms in terms of co-occurrence with already determined candidates for one character string If it is highly probable that a mistake is made, a different, more likely homonym is selected and confirmed in place of the selected candidate. There is an effect that a character string conversion method that can be corrected in real time at the time of input is obtained.
[0095]
According to a seventh aspect of the present invention, in the character string conversion method for converting an input character string to another character string, the first character string conversion method includes the step of determining one of the first character string conversion candidates. A determination step, a selection step of selecting one of the conversion candidates of the second character string, and a step between the conversion candidate determined in the first determination step and the conversion candidate selected in the selection step. A determining step of determining whether or not there is a co-occurrence relation between the conversion candidates of the first character string when it is determined that there is no co-occurrence relation between the conversion candidates in the determining step. And a second determining step of determining a candidate having a co-occurrence relationship with the conversion candidate selected in the selecting step. Conversion error of homonymous terms in view of co-occurrence relationship with candidate selected for character string If this is likely, the confirmed candidate is replaced with another, more likely homonym, which allows the operator to make a mistake in selecting or misidentifying the homonym in real time when entering the string. There is an effect that a character string conversion method that can be corrected to the above can be obtained.
[0096]
According to an eighth aspect of the present invention, in the character string conversion method for converting an input character string to another character string, the first character string conversion method includes the steps of: determining one of the first character string conversion candidates; A determination step, a selection step of selecting one of the conversion candidates of the second character string, and a step between the conversion candidate determined in the first determination step and the conversion candidate selected in the selection step. A determining step of determining whether or not there is a co-occurrence relation between the first character string and the conversion candidate of the first character string when it is determined in the determining step that there is no co-occurrence relation. And a second determination step of determining a conversion candidate of the second character string that has a co-occurrence relationship with each other. Any of the candidates selected for the second character string are viewed from the co-occurrence relationship If it is highly probable that the conversion of the phonetic is incorrect, the determined candidate for the first character string is replaced with another, more likely homonym, and the second character string is used. For, a different and more likely homonym is selected and confirmed in place of the selected candidate, thereby correcting the operator's erroneous selection or erroneous decision of the homonym in real time when entering a character string. There is an effect that a character string conversion method capable of performing the above is obtained.
[0097]
According to the ninth aspect of the present invention, there is provided an effect that a program capable of causing a computer to execute the method according to any one of the sixth to eighth aspects is obtained.
[Brief description of the drawings]
FIG. 1 is an explanatory diagram illustrating a hardware configuration of a character string conversion device according to an embodiment of the present invention.
FIG. 2 is an explanatory diagram showing a functional configuration of the character string conversion device according to the embodiment of the present invention.
FIG. 3 is an explanatory diagram schematically showing contents of a co-occurrence dictionary 204 according to the embodiment of the present invention.
FIG. 4 is an explanatory diagram showing an example of a co-occurrence example window according to the embodiment of the present invention;
FIG. 5 is an explanatory diagram showing another example of the co-occurrence example window according to the embodiment of the present invention;
FIG. 6 is an explanatory diagram showing another example of the co-occurrence example window according to the embodiment of the present invention;
FIG. 7 is an explanatory diagram showing another example of the co-occurrence example window according to the embodiment of the present invention;
FIG. 8 is a flowchart showing a procedure of a character string conversion process in the character string conversion device according to the embodiment of the present invention.
FIG. 9 is an explanatory diagram showing another example of the co-occurrence example window according to the embodiment of the present invention;
FIG. 10 is an explanatory diagram showing an example of a homophone example window displayed by a homophone example display function of kana-kanji conversion software “ATOK” manufactured and sold by the present applicant.
[Explanation of symbols]
101 CPU
102 ROM
103 RAM
104 HDD
105 HD
106 FDD
107 FD
108 Display
109 Network I / F
110 Communication cable
111 keyboard
112 mouse
113 CD-RW
114 CD-RW drive
200 reading input unit
201 Conversion instruction section
202 Confirmation instruction section
203 conversion dictionary
204 Co-occurrence Dictionary
205 Character string converter
206 Conversion candidate display section
207 Document storage under creation
208 Confirmed character string storage
209 Error conversion judgment unit
210 Co-occurrence example display

Claims (9)

入力された文字列を他の文字列に変換する文字列変換装置において、
第1の文字列の変換候補のうちいずれか一つを確定する第1の確定手段と、
第2の文字列の変換候補のうちいずれか一つを選択する選択手段と、
前記第1の確定手段により確定された変換候補と前記選択手段により選択された変換候補との間に共起関係があるか否かを判定する判定手段と、
前記判定手段により前記変換候補の間に共起関係がないと判定された場合に、前記第2の文字列の変換候補のうち前記第1の確定手段により確定された変換候補と共起関係があるものを確定する第2の確定手段と、
を備えたことを特徴とする文字列変換装置。
In a character string conversion device that converts an input character string into another character string,
First determining means for determining any one of the first character string conversion candidates;
Selecting means for selecting any one of the conversion candidates of the second character string;
Determining means for determining whether or not there is a co-occurrence relationship between the conversion candidate determined by the first determining means and the conversion candidate selected by the selecting means;
When the determination unit determines that there is no co-occurrence relationship between the conversion candidates, the conversion candidate determined by the first determination unit among the conversion candidates of the second character string has a co-occurrence relationship. Second determining means for determining an object;
A character string conversion device comprising:
入力された文字列を他の文字列に変換する文字列変換装置において、
第1の文字列の変換候補のうちいずれか一つを確定する第1の確定手段と、
第2の文字列の変換候補のうちいずれか一つを選択する選択手段と、
前記第1の確定手段により確定された変換候補と前記選択手段により選択された変換候補との間に共起関係があるか否かを判定する判定手段と、
前記判定手段により前記変換候補の間に共起関係がないと判定された場合に、前記第1の文字列の変換候補のうち前記選択手段により選択された変換候補と共起関係があるものを確定する第2の確定手段と、
を備えたことを特徴とする文字列変換装置。
In a character string conversion device that converts an input character string into another character string,
First determining means for determining any one of the first character string conversion candidates;
Selecting means for selecting any one of the conversion candidates of the second character string;
Determining means for determining whether or not there is a co-occurrence relationship between the conversion candidate determined by the first determining means and the conversion candidate selected by the selecting means;
When the determination unit determines that there is no co-occurrence relationship between the conversion candidates, the conversion candidates of the first character string that have a co-occurrence relationship with the conversion candidate selected by the selection unit are determined. Second determining means for determining,
A character string conversion device comprising:
入力された文字列を他の文字列に変換する文字列変換装置において、
第1の文字列の変換候補のうちいずれか一つを確定する第1の確定手段と、
第2の文字列の変換候補のうちいずれか一つを選択する選択手段と、
前記第1の確定手段により確定された変換候補と前記選択手段により選択された変換候補との間に共起関係があるか否かを判定する判定手段と、
前記判定手段により前記変換候補の間に共起関係がないと判定された場合に、前記第1の文字列の変換候補および前記第2の文字列の変換候補のうち相互に共起関係があるものを確定する第2の確定手段と、
を備えたことを特徴とする文字列変換装置。
In a character string conversion device that converts an input character string into another character string,
First determining means for determining any one of the first character string conversion candidates;
Selecting means for selecting any one of the conversion candidates of the second character string;
Determining means for determining whether or not there is a co-occurrence relationship between the conversion candidate determined by the first determining means and the conversion candidate selected by the selecting means;
When the determination unit determines that there is no co-occurrence relationship between the conversion candidates, the conversion candidate of the first character string and the conversion candidate of the second character string have a co-occurrence relationship with each other. Second determining means for determining the thing;
A character string conversion device comprising:
さらに、前記第2の確定手段により確定される変換候補を表示する表示手段を備えたことを特徴とする前記請求項1〜請求項3のいずれか一つに記載の文字列変換装置。4. The character string conversion device according to claim 1, further comprising a display unit for displaying a conversion candidate determined by the second determination unit. 前記第1の文字列は前記第2の文字列の直前に確定された文字列であることを特徴とする前記請求項1〜請求項4のいずれか一つに記載の文字列変換装置。The character string conversion device according to any one of claims 1 to 4, wherein the first character string is a character string determined immediately before the second character string. 入力された文字列を他の文字列に変換する文字列変換方法において、
第1の文字列の変換候補のうちいずれか一つを確定する第1の確定工程と、
第2の文字列の変換候補のうちいずれか一つを選択する選択工程と、
前記第1の確定工程で確定された変換候補と前記選択工程で選択された変換候補との間に共起関係があるか否かを判定する判定工程と、
前記判定工程で前記変換候補の間に共起関係がないと判定された場合に、前記第2の文字列の変換候補のうち前記第1の確定工程で確定された変換候補と共起関係があるものを確定する第2の確定工程と、
を含んだことを特徴とする文字列変換方法。
In a character string conversion method for converting an input character string to another character string,
A first determining step of determining any one of the first character string conversion candidates;
A selecting step of selecting any one of the conversion candidates of the second character string;
A determining step of determining whether or not there is a co-occurrence relationship between the conversion candidate determined in the first determining step and the conversion candidate selected in the selecting step;
When it is determined in the determining step that there is no co-occurrence relationship between the conversion candidates, the conversion candidate determined in the first determining step and the co-occurrence relationship among the conversion candidates of the second character string are A second determining step of determining a certain thing;
A character string conversion method comprising:
入力された文字列を他の文字列に変換する文字列変換方法において、
第1の文字列の変換候補のうちいずれか一つを確定する第1の確定工程と、
第2の文字列の変換候補のうちいずれか一つを選択する選択工程と、
前記第1の確定工程で確定された変換候補と前記選択工程で選択された変換候補との間に共起関係があるか否かを判定する判定工程と、
前記判定工程で前記変換候補の間に共起関係がないと判定された場合に、前記第1の文字列の変換候補のうち前記選択工程で選択された変換候補と共起関係があるものを確定する第2の確定工程と、
を含んだことを特徴とする文字列変換方法。
In a character string conversion method for converting an input character string to another character string,
A first determining step of determining any one of the first character string conversion candidates;
A selecting step of selecting any one of the conversion candidates of the second character string;
A determining step of determining whether or not there is a co-occurrence relationship between the conversion candidate determined in the first determining step and the conversion candidate selected in the selecting step;
If it is determined in the determining step that there is no co-occurrence relationship between the conversion candidates, the conversion candidates of the first character string that have a co-occurrence relationship with the conversion candidate selected in the selecting step A second determining step of determining;
A character string conversion method comprising:
入力された文字列を他の文字列に変換する文字列変換方法において、
第1の文字列の変換候補のうちいずれか一つを確定する第1の確定工程と、
第2の文字列の変換候補のうちいずれか一つを選択する選択工程と、
前記第1の確定工程で確定された変換候補と前記選択工程で選択された変換候補との間に共起関係があるか否かを判定する判定工程と、
前記判定工程で前記変換候補の間に共起関係がないと判定された場合に、前記第1の文字列の変換候補および前記第2の文字列の変換候補のうち相互に共起関係があるものを確定する第2の確定工程と、
を含んだことを特徴とする文字列変換方法。
In a character string conversion method for converting an input character string to another character string,
A first determining step of determining any one of the first character string conversion candidates;
A selecting step of selecting any one of the conversion candidates of the second character string;
A determining step of determining whether or not there is a co-occurrence relationship between the conversion candidate determined in the first determining step and the conversion candidate selected in the selecting step;
When it is determined in the determination step that there is no co-occurrence relationship between the conversion candidates, there is a mutual co-occurrence relationship between the first character string conversion candidate and the second character string conversion candidate. A second confirmation step of confirming the thing;
A character string conversion method comprising:
前記請求項6〜請求項8のいずれか一つに記載された方法をコンピュータに実行させるプログラム。A program for causing a computer to execute the method according to claim 6.
JP2002197806A 2002-07-05 2002-07-05 Character string converter, character string conversion method and program for making computer execute the method Pending JP2004038797A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002197806A JP2004038797A (en) 2002-07-05 2002-07-05 Character string converter, character string conversion method and program for making computer execute the method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002197806A JP2004038797A (en) 2002-07-05 2002-07-05 Character string converter, character string conversion method and program for making computer execute the method

Publications (1)

Publication Number Publication Date
JP2004038797A true JP2004038797A (en) 2004-02-05

Family

ID=31705479

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002197806A Pending JP2004038797A (en) 2002-07-05 2002-07-05 Character string converter, character string conversion method and program for making computer execute the method

Country Status (1)

Country Link
JP (1) JP2004038797A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020149417A (en) * 2019-03-14 2020-09-17 オムロン株式会社 Device, method, and program for inputting characters

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020149417A (en) * 2019-03-14 2020-09-17 オムロン株式会社 Device, method, and program for inputting characters
JP7147640B2 (en) 2019-03-14 2022-10-05 オムロン株式会社 Character input device, character input method, and character input program

Similar Documents

Publication Publication Date Title
US20210073467A1 (en) Method, System and Apparatus for Entering Text on a Computing Device
KR950008022B1 (en) Charactor processing method and apparatus therefor
US7683886B2 (en) Disambiguated text message review function
US20040021691A1 (en) Method, system and media for entering data in a personal computing device
JP5761687B2 (en) Formula output computer, formula output method, formula output program, and computer-readable recording medium recording formula output program
US9547639B2 (en) Typing error correction method and device implementing the same method
JP2006252201A (en) Source code analysis program
JP6210398B2 (en) Translation support device, translation support system, and program thereof
JP5637143B2 (en) Joint development support system, joint development support method and program
JP2004038797A (en) Character string converter, character string conversion method and program for making computer execute the method
KR20110026231A (en) Apparatus and method for inputting character and its program stored in recording medium
JP4189040B2 (en) Sentence proofreading apparatus and proofreading method
JP4245078B2 (en) Synonym dictionary creation support system, synonym dictionary creation support method, and synonym dictionary creation support program
JP4818202B2 (en) Character string input device and character string input control method
JP4192799B2 (en) Synonym dictionary creation support system, synonym dictionary creation support method, and synonym dictionary creation support program
JP2001092821A (en) Sentence proofreading device and computer-readable recording medium recording sentence proofreading program
JPH09190237A (en) Password input device
JP4337939B2 (en) Synonym dictionary creation support system, synonym dictionary creation support method, and synonym dictionary creation support program
JP2008192165A (en) Text proofreading device and text proofreading method
JP2728341B2 (en) Information processing device
KR100899449B1 (en) Method Of Searching Chinese Characters And System For Searching Chinese Characters
JPH0728800A (en) Method and device for character processing
JPH11134331A (en) Document preparing device and kana/chinese character converting method and recording medium for recording kana/chinese character conversion program
JP2003157166A (en) Command execution device, command execution method and program for executing the same method by computer
JP2006120174A (en) Sentence revision device and method

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040701

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050201

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050404

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060905