JP2007334534A - 文字列入力装置、文字列入力方法、および、プログラム - Google Patents

文字列入力装置、文字列入力方法、および、プログラム Download PDF

Info

Publication number
JP2007334534A
JP2007334534A JP2006164248A JP2006164248A JP2007334534A JP 2007334534 A JP2007334534 A JP 2007334534A JP 2006164248 A JP2006164248 A JP 2006164248A JP 2006164248 A JP2006164248 A JP 2006164248A JP 2007334534 A JP2007334534 A JP 2007334534A
Authority
JP
Japan
Prior art keywords
input
character string
dictionary
notation
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006164248A
Other languages
English (en)
Inventor
Takashi Mizobuchi
敬司 溝渕
Tatsuhiko Okada
達彦 岡田
Takenori Watari
健典 亘
Sadaji Takai
貞治 高井
Takamitsu Ishioka
隆光 石岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TS COMMUNICATIONS Ltd
NTT Data Group Corp
Original Assignee
TS COMMUNICATIONS Ltd
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TS COMMUNICATIONS Ltd, NTT Data Corp filed Critical TS COMMUNICATIONS Ltd
Priority to JP2006164248A priority Critical patent/JP2007334534A/ja
Publication of JP2007334534A publication Critical patent/JP2007334534A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】より効率的な文字列入力を実現する。
【解決手段】制御部100は、キーボード211による文字列入力がある場合、未確定文字列の読みに基づいて、辞書格納領域410に格納されている読み補完辞書を検索し、変換候補の読みを示すノードを抽出する。また、確定文字列がある場合は、前記確定文字列の表記に基づいて、辞書格納領域410に格納されている表記補完辞書を検索し、変換候補の表記を示すノードを抽出する。制御部100は、読み補完辞書の辞書データを検索して抽出したノードにリンクした表記補完辞書データ内のノードが示す文字列と、表記補完辞書の辞書データを検索して抽出したノードが示す文字列を変換候補としてディスプレイ装置311に表示出力する。入力装置210の操作によって、変換候補のいずれかが選択されると、制御部100は、選択された文字列を確定入力する。
【選択図】図1

Description

本発明は、文字列入力装置、文字列入力方法、および、プログラムに関し、特に、コールセンタなどにおける入力作業に好適な文字列入力装置、文字列入力方法、および、プログラムに関する。
コンピュータなどの装置に自然言語としての文字列を入力する場合、言語の種類に応じた入力変換をおこなうことで、キーボードなどから入力された文字列を自然言語に変換することが一般的におこなわれている。
このような入力変換としては、キーボードなどからの入力をキーとして辞書データを検索し、候補となる単語を抽出して画面に表示し、その中からユーザが選択することによって入力する方法が一般的である(例えば、特許文献1)。
また、先行して入力された単語との関係を考慮して、次に続く単語を検索して入力する方法なども提案されている(例えば、特許文献2)。
特開平10−222504号公報 特開2003−233605号公報
特許文献1のような、従来の一般的な手法では、入力中の未確定文字列について、見出し語の読みに基づいて構成された辞書データから変換候補の検索を行っている。しかしながら、入力中の文字列以前の文字列(確定文字列)については何ら考慮せずに、読みに基づいた変換候補をすべて表示するため、入力文字数が少ない場合などには、変換候補の数が非常に多くなってしまうという不都合があった。
一方、特許文献2に開示されているような手法では、先行して入力された単語との関係(頻度など)を用いて、次に入力されると思われる単語を変換候補として表示するが、確定文字列から予測される変換候補を表示することしかできないので、この手法でも、表示される変換候補の数が非常に多くなってしまう。
つまり、特許文献2に示されるような従来技術においては、変換候補を表示する際に、入力中の未確定文字列については何ら考慮されていない。これは、読みではなく、綴り(表記)に基づいた単語間の関係で辞書が構築されているため、入力中の未確定文字列と、入力済の確定文字列との関係を判断できないからである。
したがって、上述した従来技術を用いた入力変換では、確定済文字列と未確定文字列が混在する場合に、表示される変換候補の数が非常に多くなるため、変換候補の選択に時間がかかってしまい、効率的な入力をおこなうことができなかった。
このような不都合は、例えば、電話による応対の内容をリアルタイムに入力する必要のあるコールセンタの作業などにおいて問題となることが多く、より効率的な文字列入力を実現する手法の確立が望まれている。
本発明は上記実状に鑑みてなされたもので、より効率的な文字列入力をおこなうことができる文字列入力装置等を提供することを目的とする。
上記目的を達成するため、本発明の第1の観点にかかる文字列入力装置は、
入力された文字列に応じた変換候補を出力し、選択された変換候補に変換して文字列入力をおこなう文字列入力装置であって、
入力される文字列の読みに基づいて、互いに係り受け関係にある複数の単語の読みを示すノードが連結されたノード列を階層構造で構成した読み補完辞書を示す辞書データと、
前記読み補完辞書に含まれる単語の表記に基づいて、互いに係り受け関係にある複数の単語の表記を示すノードが連結されたノード列を、前記読み補完辞書の階層構造とリンクした階層構造で構成した表記補完辞書を示す辞書データと、
を格納した辞書手段と、
入力済の確定文字列の表記と、入力中の未確定文字列の読みとに基づいて、前記辞書手段の読み補完辞書と表記補完辞書とから変換候補を検索する変換候補検索手段と、
を備えることを特徴とする。
上記文字列入力装置において、
前記変換候補検索手段は、
前記未確定文字列の読みを前記読み補完辞書の係り側ノードから検索し、検索された係り側ノード及び/又は該係り側に連結された受け側ノードとリンクする前記表記補完辞書の係り側ノード及び/又は該係り側に連結された受け側ノードが示す文字列を変換候補として抽出する第1の変換候補抽出手段と、
前記確定文字列の表記を前記表記補完辞書の係り側ノードから検索し、検索された係り側ノード及び/又は該係り側に連結された受け側ノードが示す文字列を変換候補として抽出する第2の変換候補抽出手段と、をさらに備えていることが望ましい。
上記文字列入力装置において、
前記階層構造が互いにリンクした一対の前記読み補完辞書と前記表記補完辞書によって一組の辞書データが構成されていることが望ましく、この場合、
前記辞書手段は、入力内容に応じて1または複数組の前記辞書データを格納し、
前記変換候補検索手段は、入力内容に対応した前記辞書データを選択して変換候補を検索することが望ましい。
上記目的を達成するため、本発明の第2の観点にかかる文字列入力方法は、
コンピュータを用いて文字列を入力するための文字列入力方法であって、
未確定文字列がある場合、該未確定文字列の読みに基づいて、互いに係り受け関係にある複数の単語の読みを示すノードが連結されたノード列を階層構造で構成した読み補完辞書を示す辞書データを検索して変換候補の読みを示すノードを抽出するステップと、
確定文字列がある場合、該確定文字列の表記に基づいて、互いに係り受け関係にある複数の単語の表記を示すノードが連結されたノード列を、前記読み補完辞書の階層構造とリンクした階層構造で構成した表記補完辞書を示す辞書データを検索し、変換候補の表記を示すノードを抽出するステップと、
前記読み補完辞書の辞書データを検索して抽出したノードにリンクした前記表記補完辞書データ内のノードが示す文字列と、前記表記補完辞書の辞書データを検索して抽出したノードが示す文字列とを変換候補として出力するステップと、
前記出力された変換候補から選択された文字列を入力するステップと、
を備えることを特徴とする。
上記文字列入力方法は、
入力内容に応じて、変換候補の抽出に使用する前記読み補完辞書と前記表記補完辞書の組を選択するステップをさらに備えていることが望ましい。
上記目的を達成するため、本発明の第3の観点にかかるプログラムは、
コンピュータに、
入力される文字列の読みに基づいて、互いに係り受け関係にある複数の単語の読みを示すノードが連結されたノード列を階層構造で構成した読み補完辞書を示す辞書データと、
前記読み補完辞書に含まれる単語の表記に基づいて、互いに係り受け関係にある複数の単語の表記を示すノードが連結されたノード列を、前記読み補完辞書の階層構造とリンクした階層構造で構成した表記補完辞書を示す辞書データと、
を入力内容に対応づけて記憶装置に格納する機能と、
入力内容に基づいて、前記記憶装置に格納した辞書データから、使用する辞書データを選択する機能と、
未確定文字列がある場合、該未確定文字列の読みに基づいて、前記読み補完辞書を示す辞書データを検索して変換候補の読みを示す単語を抽出する機能と、
確定文字列がある場合、該確定文字列の表記に基づいて、前記表記補完辞書を示す辞書データを検索し、変換候補の表記を示す単語を抽出する機能と、
前記読み補完辞書の辞書データを検索して抽出した単語にリンクした前記表記補完辞書データ内の単語と、前記表記補完辞書の辞書データを検索して抽出した単語とを変換候補として出力する機能と、
前記出力された変換候補から選択された文字列を入力する機能と、
を実現させることを特徴とする。
本発明によれば、リンクされた読み補完辞書と表記補完辞書を用いて文字列入力をおこなうので、確定文字列と未確定文字列を考慮した変換候補を抽出することができ、効率的に文字列入力をおこなうことができる。
本発明にかかる実施の形態を、図面を参照して以下説明する。本実施の形態では、本発明を、例えば、コールセンタなどでの入力業務に用いる入力端末に適用した場合を例に説明する。
本実施の形態にかかる入力端末1は、例えば、ワークステーションやパーソナルコンピュータなどの情報処理装置から構成されるものとする。以下、本実施の形態にかかる入力端末1を、図1を参照して説明する。図1は、入力端末1の構成を示すブロック図である。図示するように、入力端末1は、制御部100、入力制御部200、出力制御部300、記憶部400、などから構成される。
制御部100は、例えば、CPU(Central Processing Unit:中央演算処理装置)やワークエリアとなるメモリなどから構成され、記憶部400に格納されているプログラムを実行することで、入力端末1の各部を制御するとともに、後述する各処理を実行する。
入力制御部200は、例えば、キーボード211やポインティングデバイス212などの入力装置210と入力端末1とを接続し、入力装置210の操作に応じた入力信号を制御部100に入力する。本実施の形態では、キーボード211を用いて文字列の入力がなされ、ポインティングデバイス212を用いて入力エリアの選択などがおこなわれるものとする。
出力制御部300は、例えば、ディスプレイ装置311などの出力装置310と入力端末1とを接続し、制御部100の処理結果などを出力装置310に出力する。本実施の形態では、予め用意されている入力画面がディスプレイ装置311に表示出力され、入力装置210を用いた入力操作が、表示された入力画面上でおこなわれるものとする。
記憶部400は、例えば、ハードディスク装置などの記憶装置から構成され、主に、本実施の形態にかかる文字列入力処理に必要な情報を格納する。本実施の形態では、記憶部400に、辞書格納領域410、プログラム格納領域440、などの記憶領域が用意されるものとする。
辞書格納領域410には、入力端末1を用いた文字列入力の際に用いられる辞書データが格納される。本実施の形態では、入力端末1を用いた文字列入力において、自然言語としての日本語入力がおこなわれるものとする。この場合、入力端末1は、いわゆるFEP(Front End Processor)の動作により、キーボード211からの入力に応じた入力変換をおこなう。よって、辞書格納領域410には、このような、日本語入力変換の際に参照される辞書データが格納される。この場合、入力端末1は、辞書格納領域410に格納されている辞書データを参照することで、変換候補(入力候補)の文字列を選択可能に表示出力する。
本実施の形態にかかる辞書データの例を、図2を参照して説明する。図示するように、辞書格納領域410には、基本辞書領域420と入力内容別辞書領域430とが用意される。
基本辞書領域420は、入力端末1での日本語入力の際に参照される辞書データのうち、一般的な辞書データ(以下、「基本辞書データ」とする)を格納する領域である。この基本辞書データには、種々の単語と、その品詞や読みなどを示す情報とが対応づけられている。すなわち、通常の入力用FEPなどで用いられる一般的な辞書データが、基本辞書データとして基本辞書領域420に格納されている。
入力内容別辞書領域430は、入力端末1が用いられる業務内容などに基づいて、入力内容に応じて用意された辞書データを格納する領域である。例えば、入力端末1をコールセンタ業務に用いる場合、入力項目が予め規定されているので、特定の入力項目での入力に用いられる単語群から構成される辞書データが入力内容別辞書領域430に格納される。すなわち、入力内容別辞書領域430には、入力内容毎に用意された専用辞書データが格納されていることになる。
一例として、図2に示すような、応対入力辞書データ431や住所入力辞書データ432などが入力内容別辞書領域430に格納される。このような入力内容別辞書データは、入力画面の入力エリアと対応づけられている。例えば、図3に示すような入力画面ISの場合、応対入力辞書データ431は、電話応対での応対内容を入力するための入力エリアA1と対応づけられ、住所入力辞書データ432は、住所情報を入力するための入力エリアA2と対応づけられていることになる。すなわち、図3に示したような入力画面ISにおいては、入力エリアによって入力される内容が規定できるので、特定の入力エリアと辞書データとを対応づけることで、入力内容別辞書領域430には、入力内容に応じた辞書データが格納されることになる。
このような入力内容別に用意された辞書データのそれぞれには、入力される読みに基づいて構成された「読み補完辞書データ」と、変換後の表記(綴り)に基づいて構成された「表記補完辞書データ」と、が一対となって含まれている。すなわち、図2に示すように、応対入力辞書データ431には、読み補完辞書データ431Aと表記補完辞書データ431Bとが含まれ、住所入力辞書データ432には、読み補完辞書データ432Aと表記補完辞書データ432Bが含まれている。
入力内容別に用意された辞書データのそれぞれは、このような一対の異なる辞書データによって構成されており、応対入力辞書データ431と住所入力辞書データ432のそれぞれを1組の辞書データとすることができる。よって、仮に、応対入力辞書データ431と住所入力辞書データ432のみが入力内容別辞書領域430に格納されているのであれば、入力内容別辞書領域430には2組の辞書データが格納されていることになる。
このような入力内容別辞書データの構成を、図4を参照して説明する。ここでは、例として、応対入力辞書データ431の構成を示す。図4において、図4(a)は、読み補完辞書データ431Aの構成例を示し、図4(b)は、表記補完辞書データ431Bの構成例を示す。なお、本実施の形態では、携帯電話のユーザサポート業務をおこなうコールセンタでの電話応答時に頻出する語彙で応対入力辞書データ431が構成されている例を図4に示す。
図4(a)を参照して、読み補完辞書データ431Aの構成例を説明する。図示するように、読み補完辞書データ431Aは、辞書の要素である単語の「読み」を結節点(ノード)とした、樹状の階層構造(木構造)のバイナリデータによって構成されている。そして、主語となる係り側の単語(ノード)のそれぞれに、係り受けの関係の受け側となる文節を構成する助詞と述語を示す単語(ノード)が連結された構成(ノード列)となっている。この構成により、文法的に互いに係り受け関係にある単語が、相関的な位置で連結されている状態を示すデータによって辞書が構築されていることになる。ここで、読み補完辞書データ431Aは、入力される単語の「読み」に基づく辞書であるので、各ノードには、読みを示すひらがなによって見出し語が示されている。
このような読み補完辞書データ431Aと対をなす表記補完辞書データ431Bの構成例を図4(b)に示す。図示するように、表記補完辞書データ431Bは、読み補完辞書データ431Aと同一の階層構造(木構造)によって構成されており、読み補完辞書データ431Aの各ノードに示された読みに対応する表記(綴り)が、表記補完辞書データ431Bの各ノードの見出し語となっている。
つまり、読み補完辞書データ431Aに含まれている係り側の単語と、それに連結される受け側の単語群を構成しているノードを、各ノードの表記(綴り)に基づいて構成した辞書データである。例えば、読み補完辞書データ431Aにおいて、読みが「けいたい」であるノードにリンクする表記補完辞書データ431Bでのノードでは、その表記である「携帯」が示されている。
ここで、読み補完辞書データ431Aおよび表記補完辞書データ431Bの各ノードに付されている丸記号は、読み補完辞書データ431Aと表記補完辞書データ431Bのノード間のリンクを示すリンクポインタである。つまり、読み補完辞書データ431Aと表記補完辞書データ431Bとの間において、同じ記号(アルファベット)のリンクポインタが設定されているノード同士は相互に参照可能であることを示している。これにより、一対の読み補完辞書データ431Aと表記補完辞書データ431Bとは、ノード単位でリンクされていることになる。
プログラム格納領域440には、制御部100が実行するプログラムが格納される。そして、制御部100が、プログラム格納領域440に格納されているプログラムを実行することで、本実施の形態にかかる文字列入力処理を実行する際の機能が実現される。制御部100によって実現される機能を図5に示す。
図5は、制御部100によって実現される機能を示す機能ブロック図である。図示するように、制御部100は、入力内容判別部110、辞書選択部120、入力状態検出部130、変換候補抽出部140、変換候補出力部150、文字列入力部160、などとして機能する。
入力内容判別部110は、入力制御部200との協働により、入力画面IS上の入力エリアのいずれに入力がおこなわれているかを判別することにより、入力内容を判別する。
辞書選択部120は、入力内容判別部110により判別された入力内容に基づいて、特定の入力内容であれば、入力内容別辞書領域430に格納されている入力内容別辞書データから、入力内容に対応する辞書データの組を選択する。
入力状態検出部130は、辞書選択部120によって辞書が選択された場合の入力状態を検出する。すなわち、そのとき入力がおこなわれている入力エリアにおける確定文字列の有無や未確定文字列の有無を検出する。ここで、確定文字列とは、すでに入力済の文字列であるものとし、未確定文字列とは、入力中の文字列であるものとする。入力状態検出部130は、文字列入力部160(詳細後述)による確定入力の動作に基づいて確定文字列の有無を判別するとともに、入力制御部200からの入力信号に基づいて未確定文字列の有無を判別するものとする。また、確定文字列が存在する場合は、その文字列から、変換候補を抽出する際に検索キーとなる文字列(以下、「確定語」とする)を抽出する。
変換候補抽出部140は、辞書選択部120によって辞書が選択された場合、当該入力によって変換が確定されていない文字列、すなわち入力中の文字列(以下、「未確定文字列」とする)に応じた変換候補を、辞書選択部120が選択した辞書データの読み補完辞書データと表記補完辞書データから抽出する。この場合、入力状態検出部130によって確定文字列が検索されている場合は、検索された文字列を示す表記補完辞書データ上のノードにリンクした読み補完辞書データのノードを検索することで、入力された未確定文字列に対応する変換候補の抽出をおこなう。
変換候補出力部150は、出力制御部300との協働により、変換候補抽出部140が抽出した変換候補となる文字列を選択可能にディスプレイ装置311に表示出力する。
文字列入力部160は、入力制御部200などとの協働により、変換候補出力部150が表示出力した変換候補のうち、入力装置210によって選択された文字列を、未確定文字列に対応した変換後の文字列として入力する。この場合、出力制御部300との協働により、選択された文字列を、現在入力作業をおこなっている入力エリアに表示させる。
本実施の形態では、制御部100がプログラムを実行することで、図5に示す各機能構成が論理的に実現されるが、これらの機能を、例えば、ASIC(Application Specific Integrated Circuit:特定用途向け集積回路)などの物理的な構成によって実現してもよい。
以上のような構成を有する入力端末1の動作を以下説明する。ここでは、入力端末1を用いて文字列入力をおこなう場合に実行される「文字列入力処理」を、図6に示すフローチャートを参照して説明する。この処理は、例えば、図3に示すような入力画面ISを表示する操作がおこなわれたことを契機に開始されるものとする。
処理が開始されると、入力制御部200から制御部100への入力信号に基づいて、入力内容判別部110が、表示した入力画面IS上のいずれかの入力エリアが指定されたかを判別する(ステップS001)。すなわち、入力端末1のオペレータによるポインティングデバイス212の操作によって、入力画面IS上に用意された入力エリアのうち、入力対象となる入力エリアが選択されたか否かを判別する。
いずれかの入力エリアが指定されると(ステップS001:Yes)、入力内容判別部110は、指定された入力エリアが特定の入力エリアであるか否かを判別する(ステップS002)。本実施の形態では、入力内容別辞書を用いた変換入力の対象となっている入力エリアを特定の入力エリアとし、応対内容を入力するための入力エリアA1と住所を入力するための入力エリアA2(図3参照)が該当するものとする。
指定された入力エリアが、このような特定の入力エリアではない場合(ステップS002:No)、入力内容別辞書を用いない通常の入力処理がおこなわれる(ステップS020)。この場合、基本辞書領域420の基本辞書データなどを用いて、従来の入力変換動作によって文字列入力がおこなわれる。
一方、特定の入力エリアが指定された場合(ステップS002:Yes)、入力内容判別部110は、指定された入力エリアがいずれであるかを辞書選択部120に通知する。ここでは、入力エリアA1が指定された場合には、識別子「A1」を通知し、入力エリアA2が指定された場合には、識別子「A2」を通知することとする。
入力内容判別部110からの通知に応じて、辞書選択部120は、入力内容別辞書領域430にアクセスし、通知された識別子に対応する辞書データを選択する(ステップS003)。図2に示すように、入力内容別辞書領域430に格納されている複数組の入力内容別辞書データには、対応する入力エリアを示す識別子(図2の例では「A1」と「A2」)が付与されている。よって、辞書選択部120は、通知された識別子が付与されている辞書データを選択する。以下、本実施の形態では、入力エリアA1に文字列入力をおこなうものとする。よって、ここでは、応対入力辞書データ431が選択される。
使用する辞書データを選択すると、辞書選択部120は、選択した辞書データがいずれであるかを入力状態検出部130と変換候補抽出部140に通知する。
辞書選択部120からの通知に応じて、入力状態検出部130は、当該入力エリアに確定文字列があるか否かを判別する(ステップS004)。
その入力エリアを指定した時点では、通常、確定文字列は存在しない。この場合(ステップS004:No)、入力状態検出部130は、入力制御部200からの入力信号に基づいて、未確定文字列の有無、すなわち入力中の文字列があるか否かを判別する(ステップS005)。ここでは、入力端末1のオペレータが、文字列を入力するためにキーボード211を操作することで発生する入力信号に基づいて入力中の文字列があるか否かが判別される。
ここで、未確定文字列があると判別した場合(ステップS005:Yes)、入力状態検出部130は、その旨を変換候補抽出部140に通知する。入力状態検出部130からの通知に基づいて、変換候補抽出部140は、入力中の未確定文字列(未確定語)に基づいて変換候補を抽出するための「変換候補抽出処理(1)」を実行する(ステップS100)。この処理を、図7に示すフローチャートを参照して説明する。
処理が開始されると、変換候補抽出部140は、ステップS003で選択された応対入力辞書データ431に含まれる辞書データのうち、入力される文字列の「読み」に基づいて構築されている読み補完辞書データ431Aにアクセスする(ステップS101)。これは、未確定語は「読み」を表す文字列であるので、「読み」に基づいて構成されている読み補完辞書データ431Aを用いて変換候補の抽出をおこなうためである。
ここで、読み補完辞書データ431Aは、図4(a)に示すように、互いに係り受け関係にある単語同士の接続が木構造(階層構造)となるように構成されている。このような構成の辞書データに含まれる単語群と未確定語とのマッチングをおこなうことによって、未確定語に基づく変換候補を抽出するが、本実施の形態では、対象が未確定語である場合、そのマッチング対象を、木構造を構成している係り側単語(主語)のノードとする(ステップS102)。
係り側の単語をマッチング対象に指定すると、変換候補抽出部140は、対象となるノードを指定するためのポインタnに初期値1を設定する(ステップS103)。このポインタnには、1〜対象ノード数の数値が代入されることで、対象とするノードを指定するものである。なお、係り側ノードは、例えば、五十音順にソートされているものとする。
変換候補抽出部140は、n番目のノード(ここでは1番目のノード)と未確定語とのマッチングをおこなう(ステップS104)。
ここでは、理解を容易にするため、図4(a)に示した読み補完辞書データ431Aの例を用いて動作を説明する。図4(a)においては、係り側のノードとして「けいたい」(リンクポインタが「a」)と「けいたいでんわ」(リンクポインタが「b」)が示されている。以下、ノード「けいたい」を1番目のノードとし、「けいたいでんわ」を2番目のノードとして説明する。
1番目のノードとのマッチングにおいて、変換候補抽出部140はまず、全長一致があるか否かを判別する(ステップS105)。ここで、「全長一致」とは、そのノードの見出し語のすべてが、マッチング対象の未確定語に含まれていることをいう。図4(a)の例の場合、1番目のノードの見出し語が「けいたい」であるから、未確定語の中に「けいたい」のすべてが含まれていれば「全長一致している」ということになる。
例えば、入力中の未確定語が「けいたい」もしくは「けいたいでんわ」であるとすると、見出し語「けいたい」のすべてが未確定語の中に含まれている。この場合、その未確定語と1番目の係り側ノード「けいたい」とは全長一致していることになる。
このような全長一致となる場合(ステップS105:Yes)、変換候補抽出部140はさらに、当該ノードの見出し語の文字数と未確定語の文字数とが一致しているか否かを判別する(ステップS106)。例えば、入力中の未確定語が「けいたい」であれば、当該ノードの見出し語「けいたい」と全長一致し、かつ、文字数も一致する。一方、未確定語が「けいたいでんわ」であれば、当該ノードの見出し語「けいたい」と全長一致はするが文字数は一致しないことになる。
ここで、全長一致、かつ、文字数も一致する場合(ステップS106:Yes)、変換候補抽出部140は、現在対象としている係り側ノードと、その係り側ノードに連結されている受け側ノードの組み合わせを特定する(ステップS107)。
つまり、未確定語が「けいたい」で、マッチング対象の係り側ノードが「けいたい」の場合、図4(a)に示すような、「<けいたい>+<の>+<がめん>」、「<けいたい>+<を>+<おとした>」、「<けいたい>+<が>+<こわれた>」、「<けいたい>+<が>+<たかい>」、「<けいたい>…」、などといった、係り側の見出し語「けいたい」から派生している階層構造に含まれる各組み合わせが、ここで特定されることになる。
このように、読みに基づいた、係り側ノードと受け側ノードの組み合わせを特定すると、変換候補抽出部140は、表記補完辞書データ431Bにアクセスし、読みベースで特定した各ノードにリンクされている、表記に基づくノード(以下、「表記ノード」とする)を特定し(ステップS108)、特定した表記ノードを変換候補として抽出する(ステップS109)。
ここでは、読み補完辞書データ431A上で特定した各ノードのリンクポインタに基づいて、表記補完辞書データ431B上で同じリンクポインタが付されているノードを特定する。例えば、読みベースで特定された「<けいたい>+<の>+<がめん>」の場合、図4(a)に示すように、各ノードのリンクポインタはそれぞれ、「a」、「c」、「g」となる。これと同じリンクポインタが付されている表記ノードは、図4(b)に示すように、<携帯>、<の>、<画面>である。よって、これらの表記ノードを接続した「携帯の画面」という文字列が変換候補として抽出される。同様にして、他の組み合わせについても、読みに対応する表記が特定され、変換候補として抽出される。
すなわち、入力中の未確定語と読みベースの係り側ノードとが完全一致する場合は、その係り側ノードから派生する受け側ノードのすべての組み合わせを表記した文字列が変換候補として抽出されることになる。抽出された変換候補を示す文字列は、例えば、制御部100のワークエリアに保持される。
一方、入力中の未確定語と係り側ノードの見出し語とが全長一致するが、文字数が一致しない場合(ステップS106:No)、変換候補抽出部140は、その係り側ノードに対応する表記ノードの見出し語を変換候補として抽出する(ステップS108、S109)。
例えば、マッチング対象ノードが1番目の「けいたい」であるときに、未確定語が「けいたいでんわ」である場合、変換候補抽出部140は、当該係り側ノードである「けいたいでんわ」のリンクポインタ(「b」)と同じリンクポインタが付されている表記ノードを表記補完辞書データ431Bから特定して、変換候補として抽出する。この場合、図4(b)に示すように、リンクポインタが「b」の表記ノードは「携帯電話」であるので、これを変換候補とする。
つまり、文字数が一致しない全長一致の場合は、その未確定語の読みを補完して変換候補とし、制御部100のワークエリアに保持する。
また、マッチング対象の係り側ノードと未確定語とが部分一致する場合(ステップS105:No、S110:Yes)も、その未確定語の読みを補完して変換候補とする(ステップS108、S109)。抽出した変換候補は、制御部100のワークエリアに保持する。
例えば、1番目の係り側ノード「けいたい」がマッチング対象のときに、入力中の未確定語が「けい」であるとすると、その中に「けいたい」のすべてが含まれないので、全長一致ではなく部分一致していることになる。この場合、当該ノード「けいたい」にリンクされた表記ノードである「携帯」を変換候補として抽出することになる。
このようにして、ポインタnで指定された係り側ノードと入力中の未確定語とのマッチングによって変換候補抽出がおこなわれると、次のノードがある場合は(ステップS111:No)、ポインタnを+1することで(ステップS112)、当該未確定語と次のノードとのマッチングがおこなわれる(ステップS104以降)。
なお、マッチングにおいて、全長一致も部分一致もない場合(ステップS110:No)は、当該係り側ノードに基づく変換候補抽出はおこなわれない。例えば、未確定語が「どこの」である場合に、係り側ノード「けいたい」がマッチング対象に指定された場合、両者間には部分一致がないので、当該ノードからは適切な変換候補は得られない。つまり、先頭の読みが一致しない語のノードについては順次スキップすることになる。
このようにして、全ノードについてマッチングをおこなうと(ステップS111:Yes)、変換候補抽出部140は、その旨を変換候補出力部150に通知する。変換候補抽出部140からの通知に応じて、変換候補出力部150は、出力制御部300を制御し、ステップS109で抽出されワークエリアに保持されている変換候補を選択可能にディスプレイ装置311に表示出力する(ステップS113)。
オペレータは、キーボード211などを操作し、表示された変換候補のうち好適な候補を選択する。この選択操作に応じた入力信号が入力制御部200から制御部100に入力されると(ステップS114:Yes)、文字列入力部160によって、選択された変換候補の確定入力がおこなわれ(ステップS115)、図6に示す文字列入力処理のフローに戻る。
ここでは、変換候補出力部150によって表示されている選択候補のいずれが選択されたかを文字列入力部160が判別し、出力制御部300を制御することで、選択された変換候補を確定文字列として入力エリアに表示する。また、文字列入力部160は、このようにして確定入力した確定文字列を、制御部100のワークエリアに保持しておく。
なお、未確定文字列に入力誤りがあるなどによって、変換候補の選択がされず、入力取消操作などがおこなわれると(ステップS114:No、S116:Yes)、確定入力をおこなわずに処理を終了し、図6に示す文字列入力処理のフローに戻る。
変換候補抽出処理(1)からリターンした文字列入力処理(図6)では、所定の終了指示や入力エリアの変更が無ければ(ステップS006:No、S007:No)、ステップS004以降の処理が繰り返しおこなわれる。ここで、指定された入力エリアにおいて、上述した変換候補抽出処理(1)によって確定入力がなされなければ、確定文字列がないので(ステップS004:No)、未確定文字列に応じて、上述した変換候補抽出処理(1)が実行される(ステップS005:Yes、S100)。
一方、変換候補抽出処理(1)によって、確定入力がなされていれば、当該入力エリアに確定文字列が存在することになる(ステップS004:Yes)。この場合、入力状態検出部130は、入力済の確定文字列のうち、直前の文節を示す文字列(以下、「確定語」とする)を抽出する(ステップS008)。
ここでは、文字列入力部160によってワークエリアに保持された確定文字列について、例えば、直前に確定入力された文字列を確定語として抽出する。例えば、入力エリア上の確定文字列が「ユーザです。携帯が壊れました。どこのショップに」である場合において、直前に確定入力された文字列が「ショップに」であれば、当該文字列を抽出し、変換候補の検索キーとする。このような場合、文字列入力部160は、確定入力した文字列を入力状態検出部130に通知するものとし、入力状態検出部130は、直前に確定された文字列としてワークエリアに保持しておく。
確定語を抽出すると、入力状態検出部130は、確定文字列がある場合に変換候補を抽出するための「変換候補抽出処理(2)」を実行する(ステップS200)。この処理を、図8に示すフローチャートを参照して説明する。
処理が開始されると、入力状態検出部130はまず、出力制御部300からの入力信号に基づいて、入力中の未確定語の有無を判別する(ステップS201)。ここで、入力中の未確定語がある場合(ステップS201:Yes)、入力状態検出部130は、文字列入力処理(図6)のステップS008で抽出した確定語に、入力中の未確定語を接続した文字列を検索キーとする(ステップS202)。
一方、未確定語がない場合(ステップS201:No)は、抽出した確定語をそのまま検索キーとする。入力状態検出部130は、このような確定語を含む検索キーを変換候補抽出部140に通知する。
入力状態検出部130からの通知に応じて、変換候補抽出部140は、文字列入力処理(図6)のステップS003で選択された入力内容別辞書の表記補完辞書データ(本例では、表記補完辞書データ431B)にアクセスし(ステップS203)、係り側ノードをマッチング対象に指定する(ステップS204)。
そして、上述した変換候補抽出処理(1)の場合と同様に、1番目の係り側ノードから順に検索キーとのマッチングをおこなう(ステップS205、S206)。
マッチングにおいて、変換候補抽出部140は、確定語を含む検索キーが、指定された係り側表記ノードと全長一致するかを判別する(ステップS207)。すなわち、指定された係り側表記ノードのすべてが検索キーに含まれているか否かを判別する。
そして、全長一致する場合(ステップS207:Yes)、変換候補抽出部140はさらに、検索キーのうちで全長一致した部分の文字数と、指定された係り側表記ノードの文字数とが一致するか否かを判別する(ステップS208)。
例えば、検索キーが「携帯」で、見出し語が「携帯」の係り側表記ノードが指定された場合、全長一致し、かつ、文字数も一致することになる。一方、検索キーが「携帯の」である場合は、係り側表記ノードの「携帯」と全長一致するが、文字数は一致しないことになる。
全長一致し、かつ、文字数も一致する場合(ステップS207:Yes、S208:Yes)、変換候補抽出部140は、当該係り側ノードに接続されている受け側ノードのすべてを変換候補として抽出する(ステップS209)。例えば、図4(b)に示す辞書データの例において、検索キーが「携帯」と係り側ノード「携帯」とのマッチングをおこなった場合は、「<の>+<画面>」、「<を>+<落とした>」、「<が>+<壊れた>」、「<が>+<高い>」、などの受け側ノードの組み合わせを示す文字列「の画面」、「を落とした」、「が壊れた」、「が高い」などが変換候補として抽出される。
一方、係り側表記ノードと全長一致するが、文字数は一致しない場合(ステップS207:Yes、S208:No)、変換候補抽出部140は、当該係り側ノードに接続されている受け側ノードをマッチング対象に指定して(ステップS210)、さらなるマッチングをおこなう。
ここでは、検索キーを構成する文字列のうち、係り側表記ノードと一致しない部分と、受け側ノードとのマッチングをおこなって、部分一致があるか否かを判別する(ステップS211)。
例えば、検索キーが「携帯の」で、現在指定されているn番目の係り側表記ノードが「携帯」である場合、係り側表記ノード「携帯」に連結されている受け側ノードの組み合わせは、図4(b)に示すように、「<の>+<画面>」、「<を>+<落とした>」、「<が>+<壊れた>」、「<が>+<高い>」、などとなる。このような受け側ノードの組み合わせと、検索キーを構成する文字列のうちで係り側ノードと一致しない部分(すなわち「の」)とのマッチングをおこなうことで、部分一致するか否かを判別する。
この場合、検索キーの「の」と、受け側ノード「<の>+<画面>」とが部分一致することになる。このように部分一致した場合(ステップS211:Yes)、変換候補抽出部140は、検索キーと部分一致した受け側ノードから一致部分を除いた部分(「不一致ノード」とする。ここでは、「画面」が相当する)を変換候補として抽出する(ステップS212)。
このようにして、ステップS209もしくはステップS212において変換候補を抽出すると、変換候補抽出部140は、抽出した変換候補を示す文字列をワークエリアに保持する。そして、さらなる係り側ノードがある場合(ステップS213:No)、再度係り側ノードをマッチング対象に指定するとともに(ステップS214)、次の係り側ノードを指定して(ステップS215)、上述したような検索キーとのマッチングをおこなう(ステップS206以降)。
なお、このようなマッチング動作において、係り側ノードの全長が検索キーに含まれない場合(ステップS207:No)は、当該ノードと検索キーとのマッチングはおこなわずに、次のノードをマッチング対象に指定する(ステップS215)。
また、係り側ノードとの全長一致はあるが、受け側ノードとの部分一致がない場合(ステップS211:No)は、マッチング対象を係り側ノードにした上で(ステップS214)、次のノードをマッチング対象に指定する(ステップS215)。
このようにして、表記補完辞書データ431Bにおけるすべての係り側ノードと検索キーとのマッチングをおこなうと(ステップS213:Yes)、変換候補抽出部140、変換候補出力部150、文字列入力部160により、上述した変換候補抽出処理(1)におけるステップS113〜S116の処理(図7参照)をおこなって(ステップS216)、図6に示す文字列入力処理のフローに戻る。
すなわち、ステップS209及び/又はステップS212で抽出した変換候補を選択可能に表示出力し、選択された変換候補の文字列を確定文字列として確定入力する。また、入力取消がある場合は、確定入力をおこなわずに、文字列入力処理(図6)のフローに戻る。
文字列入力処理(図6)では、以上説明した各変換候補抽出処理(ステップS100、ステップS200)を繰り返し実行することで、指定された入力エリア内での文字列入力がおこなわれる。ここで、オペレータが、ポインティングデバイス212などを操作することで、入力画面IS(図3参照)上の他の入力エリアを指定すると、その操作に応じた入力信号が、入力制御部200から制御部100に入力される。この場合、入力状態検出部130は、入力エリアが変更されたと判別し(ステップS007:Yes)、ステップS002以降の処理をおこなう。すなわち、変更後の入力エリアが特定の入力エリアであれば(ステップS002:Yes)、対応する入力内容別辞書データを用いて上述した各変換候補抽出処理(ステップS100、ステップS200)がおこなわれ、特定の入力エリアでなければ、通常の入力処理がおこなわれる(ステップS020)。
このような処理は、所定の終了指示が入力されるまで繰り返し実行され(ステップS006:No)、終了指示の入力とともに文字列入力処理は終了する(ステップS006:Yes)。
以上説明した処理による文字列入力時の画面表示例を、図9を参照して説明する。ここでは、図3に示す入力画面ISの応対内容入力エリアA1に文字列を入力する場合の例を示す。
まず、図9(a)に示すように、入力エリア内に「けい」が入力された場合、上述した変換候補抽出処理(1)の動作(図7参照)により、「けい」と部分一致する読み補完辞書データ431Aの係り側ノードリンクされた表記ノードの見出し語(「携帯」、「携帯電話」など)が変換候補として表示される。
ここで、変換候補から「携帯」が選択された場合の例を図9(b)に示す。この場合は、図示するように、選択された「携帯」が確定語として入力エリアに表示されるとともに、上述した変換候補抽出処理(2)の動作(図8参照)により、確定語「携帯」と全長一致する係り側表記ノードに接続されている受け側ノードの見出し語によって構成される文字列(「の画面」、「を落とした」、「が壊れた」、「が高い」、など)が変換候補として表示される。すなわち、確定語と係り受け関係にある受け側の文節が、確定語に続くと思われる変換候補として表示される。
変換候補のいずれかが選択された場合(ここでは、「の画面」が選択されたものとする)、確定入力され、図9(c)に示すような確定文字列が入力エリアに表示される。この場合、オペレータが実際に入力した文字列は、最初の「けい」のみであり、その後は変換候補を選択するのみで「携帯の画面」という文字列が入力されたことになる。
この例では、図9(b)に示すように、確定語が発生した時点で、それに続く変換候補が表示されるが、その段階でオペレータがさらに文字入力をおこなうことがある。この場合、図9(d)に示すように、確定語「携帯」の後に「が」が入力されたとすると、これらを結合した「携帯が」を検索キーとして変換候補抽出処理(2)がおこなわれる(図8参照)。この場合、表記補完辞書データ431Bの係り側ノード「携帯」に連結されている受け側ノードと「の」が部分一致するので、それに続く述語のノードである「壊れた」、「高い」などが変換候補として表示される。
変換候補のいずれかが選択された場合(ここでは、「壊れた」が選択されたものとする)、確定入力され、図9(e)に示すような確定文字列が入力エリアに表示される。この場合、オペレータが実際に入力した文字列は、最初の「けい」と確定語「携帯」の後に入力した「が」であり、上述した「けい」のみの入力よりも入力した文字数は多いが、図9(b)と図9(d)との比較からわかるように、選択候補の数が減少するので入力効率は低下しない。これは、受け側ノードに含まれる「が」が入力されたことで、木構造のより深部まで特定することができ、変換候補をさらに絞り込むことができるためである。
図9の例では、最初に入力した未確定語が部分一致する場合を示したが、入力中の未確定語が係り側ノードと全長一致する場合の表示例を、図10を参照して説明する。ここでは、図9(a)で示した「けい」まで入力された状態からさらにオペレータが入力し、「けいたい」と入力した場合の表示例を説明する。
この場合、「けいたい」と入力された時点で図10(a)に示すような変換候補表示がおこなわれる。ここでは、「けいたい」と全長一致する係り側ノード「けいたい」に続くすべての受け側ノードと、「けいたい」と部分一致する係り側ノード「けいたいでんわ」のそれぞれにリンクする表記補完辞書データ431Bの表記ノードが変換候補として表示される。
すなわち、係り側ノードと全長一致する場合には、未確定語全体を一語の単語とした変換候補と、未確定語全体が単語の一部となる変換候補が表示される。そして、前者の場合は、その単語に続くと思われる文節までを含んだ変換候補を表示し、後者の場合は、該当する単語自体を変換候補として表示する。
そして、このような変換候補から、文節まで含む候補が選択されると、確定入力となり、図10(b)に示すように確定文字列が入力エリアに表示される。この例では、「けいたい」と入力しただけで「携帯の画面」という文字列が入力されたことになる。
一方、入力した「けいたい」と部分一致する単語を示す変換候補「携帯電話」が選択された場合は、その「携帯電話」を確定語とした変換候補抽出処理(2)の動作により、図10(c)に示すように、「携帯電話」に続くと思われる文節の変換候補(「の機種変更」、「の料金」、「の料金プラン」など)が表示される。
そして、いずれかの変換候補が選択されると、図10(d)に示すように確定文字列として入力エリアに表示される。
図10の例では、実際に入力した文字列は「けいたい」のみであり、その後は変換候補の選択のみで、「携帯の画面」や「携帯電話の機種変更」などの文字列が入力できたことになる。
以上説明したように、本発明を上記各実施の形態の如く適用することにより、少ない入力動作で文字列入力をおこなうことができるので、短時間で正確な入力をおこなうことができ、より効率的な文字列入力を実現することができる。
ここで、入力中の未確定語から変換候補を検索するための読み補完辞書データと、入力済の確定語に基づいて変換候補を検索するための表記補完辞書データとを用意し、それぞれの階層構造をリンクさせているので、入力中の文章に合った変換候補を抽出できる。すなわち、効果的な変換候補の絞り込みがされているので、表示される変換候補の数を少なくすることができ、選択にかかる時間を減少させることができる。
この場合において、入力内容に応じて読み補完辞書と表記補完辞書の組を用意し、入力内容に応じて辞書を選択するので、その時々の入力内容で頻出する語彙のみを対象とした変換候補の抽出がおこなわれる。これにより、変換候補がさらに絞り込まれるので、入力にかかる作業時間をより減少させることができる。
すなわち、本発明を適用することにより、辞書検索の効率が向上する。よって、例えば、辞書データをサーバなどに格納し、通信ネットワークで接続されたクライアントにおける文字列入力をサーバ上の辞書データを用いておこなう構成としても、高速な処理をおこなうことができ、効率的な文字列入力を実現することができる。
上述したように、互いにリンクしている読み補完辞書データと表記補完辞書データは、入力内容に応じた入力エリアなどに対応づけて用意されるが、使用目的に応じて予め用意しておくことができる他、入力端末1のオペレータなどによって、新たに作成したり追加してもよい。
この場合、例えば、図11に示すような登録画面を用いて入力内容別辞書データの作成・追加をおこなうことができる。すなわち、図11(a)に示すような登録画面から、対応づける入力エリアを指定し、図11(b)に示すような登録画面から、その入力エリアでの入力時に効率的に入力したい文節の「読み」と「表記」のそれぞれを、「主語」(係り側)、「助詞」(受け側)、「述語」(受け側)毎に入力して登録する。
このような登録による辞書作成は、例えば、入力状態検出部130によっておこなう。この場合、入力状態検出部130は、図12に示すような「辞書作成処理」を実行すればよい。
つまり、図11(b)に示す登録画面から登録対象とする文節の読みと表記が入力されたことを契機に、入力状態検出部130が処理を開始し、図11(a)に示す登録画面で指定された入力エリアに対応する読み補完辞書データにアクセスする(ステップS301)。ここでは、例えば、応対内容入力エリア(A1)が指定された場合、対応する読み補完辞書データ431Aにアクセスする。
そして、図11(b)の登録画面で入力された「主語」の読みを見出し語とする係り側ノードがあるか検索する(ステップS302)。主語と同一の係り側ノードがある場合(ステップS302:Yes)、その係り側ノードに直接連結されている受け側ノードに、図11(b)の登録画面で入力された「助詞」の読みが見出し語となっているものがあるか検索する(ステップS303)。
入力された助詞と同一の受け側ノードがある場合(ステップS303:Yes)、図11(b)の登録画面で入力された「述語」の読みを見出し語とする受け側ノードを新規作成し、検索された助詞のノードに連結されるノードとして追加する(ステップS304)。
この場合、新規作成した述語ノードに新たなリンクポインタを割り当てるとともに(ステップS305)、その直前のノード(この場合、助詞のノード)に割り当てられている既存のリンクポインタを特定する(ステップS306)。
次に、ステップS301でアクセスした読み補完辞書データと対をなす表記補完辞書データにアクセスし(ステップS307)、ステップS306で特定したリンクポインタが付されているノード(この場合、助詞ノード)を特定する。すなわち、ステップS304で読みベースの述語ノードが追加された木構造に対応する表記ベースの木構造を特定する(ステップS308)。そして、図11(b)で入力された「述語」の表記を見出し語とする述語ノードを新規作成し、ステップS308で特定した助詞ノードに連結させる(ステップS309)。これにより、登録対象の主語と助詞とがすでに登録済であれば、述語の読みと表記を既存の木構造に追加し、互いにリンクされる。
ここで、登録対象の主語は登録済であるが、助詞については未登録である場合(ステップS303:No)、上記と同様の方法により、登録対象の「助詞」と「述語」のノードを新規作成して、既存の係り側ノードに連結させて(ステップS310)、互いにリンクさせればよい(ステップS305〜S309)。
一方、登録対象の主語が未登録である場合(ステップS302:No)は、当該主語を見出し語とする係り側ノードを読み補完辞書データに新規作成し(ステップS311)、助詞と述語のノードもそれぞれ新規作成して、作成した係り側ノードに連結させる(ステップS312)。そして、各ノードにリンクポインタを割り当てる(ステップS313)。次に、表記補完辞書データにアクセスし(ステップS314)、図11(b)の登録画面で入力された主語、助詞、述語それぞれの表記を見出し語とする表記ノードを新規作成し、ステップS313で読みノードに割り当てたリンクポインタを、作成した表記ノードのそれぞれに割り当てることで、読み補完辞書データに作成した新規の木構造に対応する表記ノードの木構造が表記補完辞書データに作成される(ステップS315)。
上記実施の形態は一例であり、本発明の適用範囲はこれに限られない。すなわち、種々の応用が可能であり、あらゆる実施の形態が本発明の範囲に含まれる。
例えば、上記実施の形態では、一対の読み補完辞書データと表記補完辞書データとを入力エリアと対応づけることで、入力内容別の辞書データを構築したが、入力内容に応じて選択可能であれば、対応づけるものは入力エリアに限られない。例えば、文字列入力をおこなう入力画面や使用するアプリケーションと辞書データとを対応づけてもよい。
上記実施の形態では、受け側ノードとして、「助詞」と「述語」の2つのノードが含まれるものとしたが、係り側ノードと係り受け関係にあれば、受け側ノードの数はこれに限られず任意である。
上記実施の形態では、入力内容別辞書データとして、応対入力辞書データの例を主に示したが、互いに係り受け関係にある単語の階層構成とすることができるのであれば、種々の内容について入力内容別辞書データを構築することができる。例えば、都道府県名とそれに続く下位の地域名とを階層構造とすることで、住所入力に用いる辞書データを構築することができる他、姓とこれに続く名の組み合わせで階層構造とすることで、人名入力に用いる辞書データを構築することができる。つまり、対象とする複数の単語が相関的な位置をもって連結させることが可能であれば、種々の内容に応じた入力内容別辞書データを構築することができる。
また、上記実施の形態では、キーボード211によって文字列が入力される場合を例示したが、文字列が入力できるのであれば、その入力方法はこれに限られず任意である。例えば、音声認識によって文字列入力をおこなう場合にも、本発明を適用することで、より効率的な文字列入力を実現することができる。
上記実施の形態では、電話応答の内容をリアルタイムで入力する必要のあるコールセンタの入力端末に本発明を適用した場合を例示した。本発明は、このような高速な入力作業が求められる分野に特に好適ではあるが、これに限られるものではなく、文字列入力をおこなう種々の場面で用いられる入力装置等に本発明を適用可能であり、いずれの場合であっても、より効率的な文字列入力を実現することができる。
上記実施の形態にかかる入力端末1は、専用装置から構成可能であるだけでなく、汎用のコンピュータ装置などを用いて構成することもできる。すなわち、例えば、パーソナルコンピュータなどの汎用装置に、上記実施の形態で示したようなプログラムを適用することで、上述した入力端末1として機能させることができる。
このようなプログラムの提供方法は任意であり、例えば、CD−ROMなどの記憶媒体に格納して配布可能であることはもとより、プログラムデータを搬送波に重畳することで、所定の通信媒体(例えば、インターネットなど)を介して配布することもできる。
本発明の実施の形態にかかる入力端末の構成を示すブロック図である。 図1に示す辞書格納領域の構成を示すブロック図である。 本発明の実施の形態にかかる入力画面の例を示す図である。 図2に示す入力内容別辞書領域に格納される辞書データの例を示す図であり、(a)は読み補完辞書データのデータ構成例を示し、(b)は表記補完辞書データのデータ構成例を示す。 図1に示す制御部によって実現される機能構成を示す機能ブロック図である。 本発明の実施の形態にかかる「文字列入力処理」を説明するためのフローチャートである。 図6に示す文字列入力処理で実行される「変換候補抽出処理(1)」を説明するためのフローチャートである。 図6に示す文字列入力処理で実行される「変換候補抽出処理(2)」を説明するためのフローチャートである。 図6に示す文字列入力処理を実行した時の画面表示例を示す図であり、(a)は部分一致する未確定語が入力されたときの表示例を示し、(b)は図9(a)で表示された変換候補が選択された場合の表示例を示し、(c)は図9(b)で表示された変換候補が選択された場合の表示例を示し、(d)は図9(b)の状態で未確定語が入力された場合の表示例を示し、(e)は図9(d)で表示された変換候補が選択された場合の表示例を示す。 図6に示す文字列入力処理を実行した時の画面表示例を示す図であり、(a)は全長一致する未確定語が入力されたときの表示例を示し、(b)は図9(a)で表示された変換候補が選択された場合の表示例を示し、(c)は図9(a)で表示された他の変換候補が選択された場合の表示例を示し、(d)は図9(c)で表示された変換候補が選択された場合の表示例を示す。 本発明の実施の形態にかかる辞書登録画面の表示例を示す図であり、(a)は対応する入力エリアを選択するための画面表示例を示し、(b)は登録する内容を入力するための画面表示例を示す。 本発明の実施の形態にかかる「辞書作成処理」を説明するためのフローチャートである。
符号の説明
1 入力端末
100 制御部
110 入力内容判別部
120 辞書選択部
130 入力状態検出部
140 変換候補抽出部
150 変換候補出力部
160 文字列入力部
200 入力制御部
210 入力装置
211 キーボード
212 ポインティングデバイス
300 出力制御部
311 ディスプレイ装置
400 記憶部
410 辞書格納領域
420 基本辞書領域
430 入力内容別辞書領域
431 応対入力辞書データ
431A 読み補完辞書データ
431B 表記補完辞書データ
432 住所入力辞書データ
432A 読み補完辞書データ
432B 表記補完辞書データ
440 プログラム格納領域
IS 入力画面
A1 入力エリア
A2 入力エリア

Claims (6)

  1. 入力された文字列に応じた変換候補を出力し、選択された変換候補に変換して文字列入力をおこなう文字列入力装置であって、
    入力される文字列の読みに基づいて、互いに係り受け関係にある複数の単語の読みを示すノードが連結されたノード列を階層構造で構成した読み補完辞書を示す辞書データと、
    前記読み補完辞書に含まれる単語の表記に基づいて、互いに係り受け関係にある複数の単語の表記を示すノードが連結されたノード列を、前記読み補完辞書の階層構造とリンクした階層構造で構成した表記補完辞書を示す辞書データと、
    を格納した辞書手段と、
    入力済の確定文字列の表記と、入力中の未確定文字列の読みとに基づいて、前記辞書手段の読み補完辞書と表記補完辞書とから変換候補を検索する変換候補検索手段と、
    を備えることを特徴とする文字列入力装置。
  2. 前記変換候補検索手段は、
    前記未確定文字列の読みを前記読み補完辞書の係り側ノードから検索し、検索された係り側ノード及び/又は該係り側に連結された受け側ノードとリンクする前記表記補完辞書の係り側ノード及び/又は該係り側に連結された受け側ノードが示す文字列を変換候補として抽出する第1の変換候補抽出手段と、
    前記確定文字列の表記を前記表記補完辞書の係り側ノードから検索し、検索された係り側ノード及び/又は該係り側に連結された受け側ノードが示す文字列を変換候補として抽出する第2の変換候補抽出手段と、をさらに備える、
    ことを特徴とする請求項1に記載の文字列入力装置。
  3. 前記階層構造が互いにリンクした一対の前記読み補完辞書と前記表記補完辞書によって一組の辞書データが構成され、
    前記辞書手段は、入力内容に応じて1または複数組の前記辞書データを格納し、
    前記変換候補検索手段は、入力内容に対応した前記辞書データを選択して変換候補を検索する、
    ことを特徴とする請求項1または2に記載の文字列入力装置。
  4. コンピュータを用いて文字列を入力するための文字列入力方法であって、
    未確定文字列がある場合、該未確定文字列の読みに基づいて、互いに係り受け関係にある複数の単語の読みを示すノードが連結されたノード列を階層構造で構成した読み補完辞書を示す辞書データを検索して変換候補の読みを示すノードを抽出するステップと、
    確定文字列がある場合、該確定文字列の表記に基づいて、互いに係り受け関係にある複数の単語の表記を示すノードが連結されたノード列を、前記読み補完辞書の階層構造とリンクした階層構造で構成した表記補完辞書を示す辞書データを検索し、変換候補の表記を示すノードを抽出するステップと、
    前記読み補完辞書の辞書データを検索して抽出したノードにリンクした前記表記補完辞書データ内のノードが示す文字列と、前記表記補完辞書の辞書データを検索して抽出したノードが示す文字列とを変換候補として出力するステップと、
    前記出力された変換候補から選択された文字列を入力するステップと、
    を備えることを特徴とする文字列入力方法。
  5. 入力内容に応じて、変換候補の抽出に使用する前記読み補完辞書と前記表記補完辞書の組を選択するステップをさらに備える、
    ことを特徴とする請求項4に記載の文字列入力方法。
  6. コンピュータに、
    入力される文字列の読みに基づいて、互いに係り受け関係にある複数の単語の読みを示すノードが連結されたノード列を階層構造で構成した読み補完辞書を示す辞書データと、
    前記読み補完辞書に含まれる単語の表記に基づいて、互いに係り受け関係にある複数の単語の表記を示すノードが連結されたノード列を、前記読み補完辞書の階層構造とリンクした階層構造で構成した表記補完辞書を示す辞書データと、
    を入力内容に対応づけて記憶装置に格納する機能と、
    入力内容に基づいて、前記記憶装置に格納した辞書データから、使用する辞書データを選択する機能と、
    未確定文字列がある場合、該未確定文字列の読みに基づいて、前記読み補完辞書を示す辞書データを検索して変換候補の読みを示す単語を抽出する機能と、
    確定文字列がある場合、該確定文字列の表記に基づいて、前記表記補完辞書を示す辞書データを検索し、変換候補の表記を示す単語を抽出する機能と、
    前記読み補完辞書の辞書データを検索して抽出した単語にリンクした前記表記補完辞書データ内の単語と、前記表記補完辞書の辞書データを検索して抽出した単語とを変換候補として出力する機能と、
    前記出力された変換候補から選択された文字列を入力する機能と、
    を実現させることを特徴とするプログラム。
JP2006164248A 2006-06-14 2006-06-14 文字列入力装置、文字列入力方法、および、プログラム Pending JP2007334534A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006164248A JP2007334534A (ja) 2006-06-14 2006-06-14 文字列入力装置、文字列入力方法、および、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006164248A JP2007334534A (ja) 2006-06-14 2006-06-14 文字列入力装置、文字列入力方法、および、プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2008323769A Division JP4765107B2 (ja) 2008-12-19 2008-12-19 文字列入力装置、および、プログラム

Publications (1)

Publication Number Publication Date
JP2007334534A true JP2007334534A (ja) 2007-12-27

Family

ID=38933971

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006164248A Pending JP2007334534A (ja) 2006-06-14 2006-06-14 文字列入力装置、文字列入力方法、および、プログラム

Country Status (1)

Country Link
JP (1) JP2007334534A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009301198A (ja) * 2008-06-11 2009-12-24 Mitsubishi Electric Corp 入力予測装置
JP4514826B1 (ja) * 2009-05-12 2010-07-28 株式会社エヌ・ティ・ティ・データ 文字列入力装置及び文字列入力方法
JP2010237963A (ja) * 2009-03-31 2010-10-21 Ntt Data Corp 文字列入力装置、文字列入力方法、および、プログラム
JP2010266948A (ja) * 2009-05-12 2010-11-25 Ntt Data Corp 文字列入力装置、文字列入力方法、および、プログラム
JP2010266951A (ja) * 2009-05-12 2010-11-25 Ntt Data Corp 文字列入力装置、文字列入力方法、およびプログラム
JP2010266947A (ja) * 2009-05-12 2010-11-25 Ntt Data Corp 候補語抽出装置、候補語抽出方法及び候補語抽出プログラム
JP2010266949A (ja) * 2009-05-12 2010-11-25 Ntt Data Corp 文字列入力装置、文字列入力方法、およびプログラム
JP2010266969A (ja) * 2009-05-12 2010-11-25 Ntt Data Corp 文字検索装置、文字検索システム、文字検索方法、入力端末装置、検索サーバおよびプログラム
JP2010266950A (ja) * 2009-05-12 2010-11-25 Ntt Data Corp 文字列入力装置、文字列入力方法、および、プログラム
JP2012150759A (ja) * 2011-01-21 2012-08-09 Fuji Xerox Co Ltd 文章入力支援システム、文章入力支援装置、参照情報作成装置及びプログラム

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009301198A (ja) * 2008-06-11 2009-12-24 Mitsubishi Electric Corp 入力予測装置
JP2010237963A (ja) * 2009-03-31 2010-10-21 Ntt Data Corp 文字列入力装置、文字列入力方法、および、プログラム
JP4514826B1 (ja) * 2009-05-12 2010-07-28 株式会社エヌ・ティ・ティ・データ 文字列入力装置及び文字列入力方法
JP2010266946A (ja) * 2009-05-12 2010-11-25 Ntt Data Corp 文字列入力装置及び文字列入力方法
JP2010266948A (ja) * 2009-05-12 2010-11-25 Ntt Data Corp 文字列入力装置、文字列入力方法、および、プログラム
JP2010266951A (ja) * 2009-05-12 2010-11-25 Ntt Data Corp 文字列入力装置、文字列入力方法、およびプログラム
JP2010266947A (ja) * 2009-05-12 2010-11-25 Ntt Data Corp 候補語抽出装置、候補語抽出方法及び候補語抽出プログラム
JP2010266949A (ja) * 2009-05-12 2010-11-25 Ntt Data Corp 文字列入力装置、文字列入力方法、およびプログラム
JP2010266969A (ja) * 2009-05-12 2010-11-25 Ntt Data Corp 文字検索装置、文字検索システム、文字検索方法、入力端末装置、検索サーバおよびプログラム
JP2010266950A (ja) * 2009-05-12 2010-11-25 Ntt Data Corp 文字列入力装置、文字列入力方法、および、プログラム
JP2012150759A (ja) * 2011-01-21 2012-08-09 Fuji Xerox Co Ltd 文章入力支援システム、文章入力支援装置、参照情報作成装置及びプログラム

Similar Documents

Publication Publication Date Title
JP2007334534A (ja) 文字列入力装置、文字列入力方法、および、プログラム
US20020126097A1 (en) Alphanumeric data entry method and apparatus using reduced keyboard and context related dictionaries
CN110390085B (zh) 文本相似度的分析方法、分析装置、存储介质和电子设备
JP2010134922A (ja) 類似語決定方法およびシステム
CN107679122B (zh) 一种模糊搜索方法及终端
JP2010140475A (ja) 入力順非依存式文字入力機構を提供するための方法、装置、およびコンピュータプログラム
WO2010124513A1 (zh) 功能实时联想型交互系统及方法
JP6085149B2 (ja) 機能実行指示システム、機能実行指示方法及び機能実行指示プログラム
CN117313675A (zh) 文本修改方法、装置、计算机设备及计算机可读存储介质
CN105988992B (zh) 图标推送方法及装置
JP6538563B2 (ja) 入力支援装置、入力支援方法及びプログラム
JP4765107B2 (ja) 文字列入力装置、および、プログラム
CN104641367B (zh) 用于格式化电子字符序列的格式化模块、系统和方法
JP2009093581A (ja) 類義語検索管理システム
CN114296561A (zh) 用户词库的获取方法、候选词的生成方法及装置
JP6221275B2 (ja) 文字入力用のプログラムおよび文字入力装置
JP5337575B2 (ja) 候補語抽出装置、候補語抽出方法及び候補語抽出プログラム
JP2008117310A (ja) 辞書検索装置および辞書検索処理プログラム
KR100834279B1 (ko) 모바일 단말기의 문자 입력 처리방법 및 이를 수행하기위한 모바일 단말기
JP5481095B2 (ja) 文字列入力装置、文字列入力方法、およびプログラム
JP2010266969A (ja) 文字検索装置、文字検索システム、文字検索方法、入力端末装置、検索サーバおよびプログラム
CA2627836C (en) Use of multiple data sources for spell check function, and associated handheld electronic device
JP5337559B2 (ja) 文字列入力装置、文字列入力方法、および、プログラム
JP5481094B2 (ja) 文字列入力装置、文字列入力方法、および、プログラム
CN118114660A (zh) 文本检测方法、系统及计算机可读存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080424

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20080424

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20080522

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080603

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080801

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081021

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090317