JP2004334690A - 文字データ入出力装置、文字データ入出力方法、文字データ入出力プログラム、およびコンピュータ読み取り可能な記録媒体 - Google Patents

文字データ入出力装置、文字データ入出力方法、文字データ入出力プログラム、およびコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP2004334690A
JP2004334690A JP2003131890A JP2003131890A JP2004334690A JP 2004334690 A JP2004334690 A JP 2004334690A JP 2003131890 A JP2003131890 A JP 2003131890A JP 2003131890 A JP2003131890 A JP 2003131890A JP 2004334690 A JP2004334690 A JP 2004334690A
Authority
JP
Japan
Prior art keywords
character data
prediction candidate
input
output
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003131890A
Other languages
English (en)
Inventor
Hirokatsu Akiyama
広勝 秋山
Takeshi Hirose
岳史 廣瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2003131890A priority Critical patent/JP2004334690A/ja
Publication of JP2004334690A publication Critical patent/JP2004334690A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Input From Keyboards Or The Like (AREA)
  • Machine Translation (AREA)

Abstract

【課題】予測可能な文字列を増やし、ユーザの文字入力負担を軽減する。
【解決手段】文字入力装置1は、出力文字列の候補を予測候補文字列として作成する予測候補作成部6と、予測候補作成部6から取得される予測候補文字列を、ユーザに提示するとともにユーザの指示に従い選択して出力文字列として出力する文字列変換部4とを備え、予測候補作成部6は、入力文字列に関連する関連文字列を文字入力装置1外部にネットワークを介して接続された情報記憶装置から検索し、検索結果として得られる関連文字列を情報記憶装置から取得する情報検索部14を備えているとともに、情報検索部14が取得した関連文字列に基づき予測候補文字データを作成する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、文字入出力装置に関し、すでに入力された文字列または、入力しようとする文字列に関連あると思われる文章を通信手段を用いて外部機器より取得し、その文章に含まれる文字列をもとに、以降に入力されると予測される文字列を予測する文字データ入出力装置、文字データ入出力方法、文字データ入出力プログラム、およびコンピュータ読み取り可能な記録媒体に関する。
【0002】
【従来の技術】
文章を入力する際に、ユーザがすでに入力したデータを活用して入力負荷を軽減する従来技術として、たとえば、特許文献1には、入力中の文字列から作成文章に関連するテキスト情報を取得し、そのテキスト情報から話題予測データを作成することにより、入力中の文字列に基づき、入力しようとする文字列を予測する処理が提案されている。
【0003】
さらに、特許文献2によれば、文字列を予測するためのデータを格納した予測入力メモリに、受信メールにおける自立語を抽出して格納した予測キーデータテーブルと、送信を完了した返信メールにおける文字列を格納した予測候補データテーブルとを設け、同じidコードによって関連づけておく。
【0004】
そして、ある受信メールを受信して返信メールを作成する際には、予測キーデータテーブルに格納された文字列に対応する文字列を予測候補データテーブル中の自立語の中から検索して予測候補とすることが開示されている。
【0005】
【特許文献1】
特開2000−285112号公報(公開日2000年10月13日)
【0006】
【特許文献2】
特開2001−273291号公報(公開日2001年10月5日)
【0007】
【発明が解決しようとする課題】
しかしながら、特許文献1では、入力されるであろう文字列を、仮名漢字変換で入力した「履歴データ」およびあらかじめ用意した基本予測データという限定された内容から予測している。
【0008】
また、特許文献2では、送受信した電子メールの内容という限定された内容から文字列を予測している。すなわち、予測される文字列が、過去にユーザが最低1度は利用あるいは閲覧した文字列、または、装置があらかじめ用意したデータに限られるという問題点がある。
【0009】
このように、従来技術では、ユーザが知らない、あるいは未閲覧の文字列、または、装置が作られたときに存在しなかった単語文字列は、予測用辞書に含まれないので、予測可能な文字に制限があるという問題があった。
【0010】
本発明は、上記従来の問題点に鑑みなされたものであって、その目的は、予測可能な文字列を増やし、ユーザの文字入力負担を軽減し得る文字データ入出力装置、文字データ入出力方法、文字データ入出力プログラム、およびコンピュータ読み取り可能な記録媒体を提供することを目的としている。
【0011】
【課題を解決するための手段】
上記課題を解決するために、本発明の文字データ入出力装置は、入力文字データを出力文字データに変換する文字データ入出力装置において、上記出力文字データの候補を予測候補文字データとして作成する予測候補作成手段と、上記予測候補作成手段から取得される上記予測候補文字データを、ユーザに提示するとともにユーザの指示に従い選択して出力文字データとして出力する文字データ変換手段とを備え、上記予測候補作成手段は、上記入力文字データに関連する関連文字データを上記文字データ入出力装置外部にネットワークを介して接続された情報記憶装置から検索する検索手段と、上記検索手段の検索結果として得られる関連文字データを上記情報記憶装置から取得する関連文字データ取得手段とを備えているとともに、上記関連文字データ取得手段が取得した上記関連文字データに基づき、上記予測候補文字データを作成するものであることを特徴としている。
【0012】
上記構成によれば、予測候補作成手段が作成する予測候補文字データは、関連文字データに基づき作成される。この関連文字データは、検索手段が本発明の文字データ入出力装置(以下、単に本装置とする)外部にネットワークを介して接続された情報記憶装置を検索した結果から、関連文字データ取得手段により取得されるものであるので、本装置外の情報であるといえる。すなわち、予測候補作成手段は、本装置外の情報に基づき、予測候補文字データを作成する。
【0013】
したがって、文字データ変換手段は、過去に本装置内で処理したことの無いような文字データであっても、本装置外部から取得し、予測候補文字データとしてユーザに提示することができる。これにより、ユーザは、過去に入力したことがないような予測候補文字データを出力文字データとして選択することができるとともに、その予測候補文字データを入力する手間が省略される。それゆえ、ユーザの文字入力負担を軽減することができる。
【0014】
さらに、本発明の文字データ入出力装置は、上記構成の文字データ入出力装置において、上記予測候補文字データが上記出力文字データとして上記文字データ変換手段により選択された結果から、該予測候補文字データが上記出力文字データとして選択される可能性を学習する予測候補学習手段と、上記予測候補学習手段の学習結果に基づいて、上記予測候補文字データを格納する予測候補格納手段とを備えていることを特徴としている。
【0015】
上記構成によれば、上記予測候補格納手段には、予測候補学習手段の学習結果に基づいて予測候補文字データが格納される。この学習結果は、予測候補文字データが出力文字データとして選択される可能性についてのものであるから、予測候補格納手段は、予測候補文字データを、出力文字データとして選択される可能性にしたがって格納することができる。
【0016】
たとえば、予測候補文字データが出力文字データとして選択された頻度が高ければ、その予測候補文字データは出力文字データとして選択される可能性が高いといえる。そこで、予測候補学習手段に予測候補文字データが出力文字データとして選択された頻度を学習させ、その頻度が所定基準にあるもののみを、予測候補格納手段に格納する。これにより、予測候補格納手段には、出力文字データとして選択される可能性が高い予測候補文字データのみを格納させておくことができる。
【0017】
このように、上記構成の文字データ入出力装置によれば、装置外から取得した関連文字データに基づき作成された予測候補文字データについて、出力文字データとして選択される可能性が高いと判断されるものを、予測候補格納手段に格納することができる。これにより、予測候補格納手段に一旦格納された予測候補文字データは、再度装置外部から関連文字データを取得することなく以降の文字入力の際にユーザに提示することができる。よって、本装置内の処理を簡略化することができる。
【0018】
また、本発明の文字データ入出力方法は、入力文字データを出力文字データに変換する文字データ入出力方法において、上記出力文字データの候補を予測候補文字データとして作成する第1ステップと、上記第1ステップにより作成された上記予測候補文字データを、ユーザに提示するとともにユーザの指示に従い選択して出力文字データとして出力する第2ステップとを備え、上記第1ステップは、上記入力文字データに関連する関連文字データをネットワークを介して接続された情報記憶装置から検索する第3ステップと、上記第3ステップの検索結果として得られる関連文字データを上記情報記憶装置から取得する第4ステップとを備えているとともに、上記第4ステップにて取得された上記関連文字データに基づき、上記予測候補文字データを作成するステップであることを特徴としている。
【0019】
上記構成の文字データ入出力方法によれば、本発明の文字データ入出力装置における予測候補作成手段、文字データ変換手段、検索手段、および関連文字データ取得手段と同一の機能を、それぞれ第1ステップ、第2ステップ、第3ステップおよび第4ステップにより実現している。
【0020】
よって、本発明の文字データ入出力方法によれば、上記構成の文字データ入出力装置と同様の作用効果を得ることができる。
【0021】
また、本発明の文字データ入出力プログラムは、上記構成の文字データ入出力方法における各ステップをコンピュータに実行させるものである。
【0022】
上記プログラムをコンピュータシステムにロードすることによって、上記文字データ入出力方法を実現することが可能となる。
【0023】
また、本発明のコンピュータ読み取り可能な記録媒体は、上記構成の文字データ入出力プログラムを記録しているものである。
【0024】
上記記録媒体に記録されたプログラムをコンピュータシステムにロードすることによって、上記文字データ入出力プログラムを実現することが可能となる。
【0025】
【発明の実施の形態】
〔実施の形態1〕
本発明の実施の一形態について、図1ないし図10に基づいて説明する。
【0026】
図1に示すように、本実施の形態の文字入出力装置(文字データ入出力装置)1は、文字列入力部2と、文字入力制御部3とを備えている。
【0027】
文字列入力部2は、文字列(文字データ)を入力したり、後述する予測候補を出力文字列として選択するためのものであり、キーボード、マウス、ペン・タブレット、トラックボールなどの入力装置で構成される。なお、「予測候補」とは、既に入力された文字列、あるいは入力中の文字列に基づき予測された、出力文字列の候補をいう。
【0028】
文字入力制御部3は、文字列入力部2から入力された文字列を仮名漢字変換して外部へ出力したり、文字列入力部2を介してユーザに選択された予測候補を入力文字列として外部に出力するためのものであり、CPU(Central Processing Unit)などによって構成される。なお、予測候補の選択処理については後述する。
【0029】
文字入力制御部3の構成をより具体的に説明する。文字入力制御部3は、文字列変換部(文字データ変換手段)4と、辞書部5と、予測候補作成部(予測候補作成手段)6とを備えている。
【0030】
文字列変換部4は、文字入力制御部3における仮名漢字変換処理および予測候補の選択処理を統括的に行うものである。具体的には、文字列変換部4は、文字列入力部2を介して入力された文字列を、辞書部5に格納された後述の仮名漢字変換辞書11に基づき変換する。
【0031】
さらに、文字列変換部4は、予測候補取得部7および予測候補選択部8を備えている。また、予測候補取得部7は、優先度判定部9と、予測候補学習部(予測候補学習手段)10とを備えている。
【0032】
予測候補取得部7は、予測候補を取得するとともに、その予測候補を表示装置等に表示させるものである。なお、予測候補取得部7が予測候補を取得する手順は本実施の形態の文字入出力装置1の特徴点であるので、後述する。また、予測候補選択部8は、表示された予測候補のうち、文字列入力部2からの入力に基づいて少なくとも1つの予測候補を選択するものである。
【0033】
また、優先度判定部9は、予測候補取得部7が取得する予測候補をユーザの選択のために表示する際、予測候補毎に表示優先度を判定するものである。予測候補取得部7は、優先度判定部9に判定された優先度を参照することにより、ユーザが選択しやすいように予測候補を表示することが可能となる。
【0034】
なお、優先度は、入力された文字列と予測候補との間における、意味内容の関係や、過去に予測候補が入力文字列として選択された頻度等により決定される。
【0035】
予測候補学習部10は、ユーザが予測候補を選択した結果を、事後的に予測候補の取得処理や表示処理に役立てるために学習するものである。
【0036】
上記構成により、文字列変換部4は、文字入力制御部3における仮名漢字変換処理および予測候補の選択処理を統括的に行う。
【0037】
また、辞書部5は、仮名漢字変換辞書11と、予測候補辞書(予測候補格納手段)12とを格納するものであり、HD(Hard Disk)等の記憶媒体から構成される。
【0038】
仮名漢字変換辞書11は、単語の読み、表記および助詞の接続情報などの各種辞書情報を記憶するものである。
【0039】
予測候補辞書12は、たとえば特公平1−31229号公報に記載されている、ユーザが過去に入力した履歴を格納したような「入力履歴辞書」とすることが可能である。あるいは、予測候補辞書12は、特公平5−87857号公報に記載されているように、単語間の共起関係と該共起関係に基づく用例候補、および単語の属する意味関係(話題情報)と該意味関係に基づく意味候補などを格納した、いわゆる「用例辞書」として構成することができる。なお、「共起」とは、ある単語と他の単語とが同一の文書データ中に含まれることである。そして、「共起関係」とは、共起の頻度によって定められるあるキーワードと他のキーワードとの遠近の程度のことである。
【0040】
ここで、入力履歴辞書の具体例について説明する。図2は、ユーザにより入力された文章の一例を示す図であり、図3は、図2のように入力された文章を基にして作成された入力履歴辞書の概念を示す図である。図3に示すように、入力履歴辞書は、入力された文章における文節毎に、読み31とその読みに対する表記32とを対応づけて格納することにより構成される。なお、図3に示した入力履歴辞書の構成は一例に過ぎず、他の構成でもよい。
【0041】
また、共起関係毎に分類した用例辞書の一例を、図4に示す。図4に示すように、用例辞書は、共起関係の先行する文節の情報41と、後続する文節の情報42とにより構成される。
【0042】
また、予測候補辞書12は、予測候補取得部7が予測候補を取得するために用いるものである。予測候補を取得する手順の詳細については後述する。
【0043】
文字入出力装置1の構成の説明に戻る。図1に示すように、予測候補作成部6は、インターネット等のネットワークを介して文字入出力装置1の外部の情報にアクセスすることにより、予測候補(予測候補文字データ)を作成するものである。具体的に説明すると、予測候補作成部6は、文字列抽出部13と、情報検索部(検索手段、関連文字データ取得手段)14と、形態素解析部15と、予測候補格納部(予測候補格納手段)16とを備えている。
【0044】
文字列抽出部13は、ユーザが今から入力するであろう単語に関連すると思われる文字列を予測候補関連文字列として抽出するものである。予測候補関連文字列は、たとえば、ユーザが最後に入力確定した文字列であったり、ユーザがそれまで入力した文字列の意味情報の総和であるいわゆる意味ベクトルのようなものであってもよい。なお、文字列抽出部13は、たとえば、コンピュータのROMやHDからなる内部記憶媒体に格納されたプログラムコードにより構成される。
【0045】
情報検索部14は、インターネットなどの通信手段を用いて機器外の情報を検索するものである。具体的に説明すると、情報検索部14は、図5に示すように、インターネット上の検索ページにアクセスし、文字列抽出部13で抽出された予測候補関連文字列を検索キーワードとして情報検索を行う。さらに、情報検索部14は、検索ページにより検索されたウェブページにアクセスし、該ウェブページにおける文書情報を取得する、
形態素解析部15は、情報検索部14により取得されたウェブページの文書情報を、文節毎に分割し、それぞれの読み仮名を取り出すいわゆる「形態素解析」を行うものである。
【0046】
予測候補格納部16は、形態素解析部15により形態素解析された結果を格納するものであり、FRAM(Ferroelectric Random Access Memory)、SRAM等の不揮発性メモリ、あるいはDRAM(Dynamic Random Access Memory)等の揮発性メモリを問わず、随時書き換え可能なRAMを用いるとよい。
【0047】
上記構成により、文字入力制御部3は、文字列入力部2から入力された文字列を仮名漢字変換して外部へ出力したり、文字列入力部2を介してユーザに選択された予測候補を入力文字列として外部に出力する。出力先としては、CRTディスプレイ、LCD(液晶ディスプレイ)、PD(プラズマディスプレイ)などの表示装置の制御部であってもよいし、コンピュータ上において動作する種々のアプリケーションであってもよい。
【0048】
次に、予測候補作成部6が外部情報にアクセスして予測候補を作成する手順について、図6のフローチャートを用いてより具体的に説明する。なお、外部情報にアクセスして予測候補を作成する点は、本実施の形態の文字入出力装置1の特徴点の一つといえる。
【0049】
先ず、予測候補作成処理が開始されると、文字列抽出部13は、ユーザが今から入力するであろう文字列に関係すると推測される予測候補関連文字列を抽出する(ステップ1、以下単にステップを「S」と記載する)。文字列を抽出する手順の一例を以下に説明する。
【0050】
先ず、文字列抽出部13は、予測候補作成処理を開始する直前に文字列入力部2より入力され変換候補が確定された文字列を、予測候補関連文字列として取り出す(S2)。たとえば、図2のような文章を入力していた場合は、最後に確定された文字列は「人工衛星には」であるから、「人工衛星には」という文字列が予測候補関連文字列として取り出される。
【0051】
なお、予測候補関連文字列は、特許公報第2978044号のように、過去入力されてきた各単語が持つ意味素性の累積情報を基にする、いわゆる意味ベクトルを利用して設定されてもよい。意味ベクトルを利用して文字列を決定する場合、検索した文章の意味ベクトルを算出し、その意味ベクトルと、過去入力されてきた各単語が持つ意味素性の累積情報を基にする意味ベクトルとから判断して、類似度の高い候補が、検索文章の優先度が高いものとする方式でもよい。
【0052】
その後、情報検索部14は、予測候補関連文字列としての確定文字列を検索キーワードに設定して、インターネット上の検索ページにより情報検索を行う(S3)。
【0053】
なお、S3を実行する回数は、あらかじめ計測された情報検索部14の通信速度に適した検索回数とする。すなわち、S3を実行するタイミングは、通信速度が速い場合は、各文字列を入力した後に設定してもよい。また、通信速度が遅いときは、所定個数の単語を入力した後に検索したり、ユーザの文字入力の間隔が一定以上空いたときに検索したりすることで、頻繁な通信による検索を減らすことも可能である。
【0054】
その後、情報検索部14は、S3で検索した結果としてのウェブページへのリンクがあるか否かを判断する(S4)。ウェブページへのリンクがあるとき、情報検索部14は後述のS5の処理を実行し、リンクが無いときは予測候補辞書処理を終了する(S6)。ここで、ウェブページへのリンクとは、検索結果として得られるウェブページのURLを意味している。
【0055】
S4の処理の後に実行されるS5の処理において、情報検索部14は、リンク先のウェブページに文書ファイルがあるか否かを判断する。ここで、文書ファイルとは、ウェブページに存在する漢字仮名交じり文の文章データである。なお、上記の漢字仮名交じり文には、数値表、記号表中で用いられる説明などのデータを含むものとする。
【0056】
S5において文書ファイルがないと判断した場合、情報検索部14は再度S4の処理を実行する。一方、S5において文書ファイルがあると判断した場合、情報検索部14は、文書ファイルを検索結果として得られたウェブページから取得する(S7)。S7の後、形態素解析部15は、S8にて得られた文書ファイルの形態素解析を実行する。
【0057】
なお、S5において複数の文書ファイルがあると判断された場合、S7において、情報検索部14は、それらの文書ファイルの一部を取得してもよいし、全部の文書ファイルを取得してもよい。
【0058】
ここで、S7にて取得される文書ファイルの一例を図7に示し、図7の文書ファイルを形態素解析して読みと表記に分割した一例を図8に示す。図8に示すように、S7にて取得された文書ファイルは、形態素解析により、文節毎に表記81と読み82とに分割されている。なお、形態素解析の手法は従来から知られる一般的な方法でよく、ここでは詳細に説明しないこととする。
【0059】
また、形態素解析の結果、読みと表記とに分割できないもの、つまり形態素解析で正しく解析できない場合は、後で使う処理には使わないものとする。さらに、図8では、一文節ごとに形態素解析を行った結果を示しているが、もちろん、一単語ごとに形態素解析を行ってもよい。
【0060】
S8の形態素解析終了後、予測候補作成部6は、形態素解析により得られた表記および読みの情報を、予測候補として予測候補格納部16に格納する(S9)。なお、形態素解析により得られる表記および読みの情報は、読みから表記が検索できる一般的な辞書構造とされるのが好ましい。
【0061】
S9の処理の後、情報検索部14は、S5に戻り、未取得の文書ファイルがあるか否かを判断する。未取得の文書ファイルがあれば、S7〜S9の処理が再度実行される。最終的にS5において未取得の文書ファイルが無いと判断され、S4において検索結果も無いと判断されれば、予測候補作成処理は終了する(S6)。
【0062】
上記のS1〜S9を踏むことにより、文字入出力装置1の外部から取得された情報に基づいて作成される予測候補が、予測候補格納部16に格納される。そして、本実施の形態の文字入出力装置1は、予測候補取得部7が、予測候補辞書12に格納された予測候補のみならず、予測候補格納部16に格納された予測候補を参照して予測候補を取得する点にも特徴がある。以下、この特徴点をより具体的に説明する。
【0063】
予測候補取得部7は、予測候補格納部16に格納された予測候補を参照することにより、予測候補辞書12に予め予測候補として格納されていない文字列であっても、予測候補として取得することが可能である。ここで、予測候補辞書12には、ユーザが過去に入力、閲覧等した文書データに基づいた予測候補が格納されている。
【0064】
すなわち、文字入力の際、予測候補取得部7は、ユーザが過去に入力したことのない文字列であっても、予測候補として表示することが可能となる。よって、ユーザは、未だ入力したことのないような文字列であっても予測候補として選択することができるので、文字入力の際の負担が軽減される。
【0065】
予測候補取得部7により予測候補格納部16に格納された予測候補が表示された状態を図9に示す。なお、図9は、図8に示された形態素解析結果に基づき表示された状態を示している。
【0066】
図9に示すように、文字列抽出部13により抽出された文字「人工衛星には」を用いて、情報検索部14および形態素解析部15により文字入出力装置1の外部から得られた予測候補が、ウインドウ91内に表示されている。ユーザは、ウインドウ91に表示された予測候補を文字列入力部2を用いて選択することができる。
【0067】
もちろん、ウインドウ91に予測候補を表示する際には、優先度判定部9により判定された優先度に基づく表示を行うことにより、ユーザが予測候補を選択しやすくなる。
【0068】
なお、図9においては、形態素解析部15により形態素解析された用語(図8参照)を全て表示しているが、必ずしも全ての単語を表示する必要はない。たとえば、優先度判定部9により予測候補格納部16に格納された予測候補の優先度を判定するとともに、優先度が所定基準以上のもののみを表示してもよい。
【0069】
あるいは、文字列入力部2からの入力に応じて、優先度判定部9により順次表示する文字列を絞り込んでいってもよい。たとえば、図9に示すような状態で予測候補が表示されている場合において、図10に示すようにユーザが文字「い」を入力したら、ウインドウ91(図9)に表示されていた予測候補のうち、読みが「い」から始まる予測候補「イコノス」・「イリジウム」だけが予測候補としてウインドウ92に表示されるようにしてもよい。
【0070】
このようにして、予測候補取得部7は、予測候補格納部16に格納された予測候補を表示する。さらに、予測候補取得部7は、予測候補学習部10(図1参照)を利用して、以下に説明する予測候補辞書12の更新処理を行うことが可能である。
【0071】
すなわち、予測候補格納部16に格納された予測候補が入力文字列として選択された場合、予測候補学習部10はその予測候補を予測候補辞書12に追加する処理を行う。これにより、予測候補辞書12に、文字入出力装置1の外部から取得された予測候補を格納することができる。
【0072】
特に、インターネットを介して予測候補を取得すれば、文字入出力装置1の製造時において予測候補辞書12に格納することができなかった最新語を、予測候補として予測候補辞書12に追加することができる。よって、予測候補辞書12が経時的に陳腐化してしまうことを防止できる。
【0073】
また、予測候補学習部10を利用して、予測候補格納部16に格納された予測候補の書き換え処理を実行することも可能である。たとえば、予測候補学習部10からの指示に基づき、入力文字列として選択されなかった予測候補が予測候補格納部16から削除されるように構成する。これにより、予測候補格納部16の記憶領域を有効活用し、予測候補格納部16により多くの新たな予測候補を格納することができる。
【0074】
〔実施の形態2〕
本発明の他の実施の形態について、図11に基づいて説明する。図11に示すように、本実施の形態の文字入出力システム20は、実施の形態1の文字入出力装置1における予測候補作成部6が、インターネット等のネットワークを介して文字入力制御部3に接続される予測候補作成サーバ(予測候補作成手段)21として置き換えられた構成である。また、文字入出力システム20は、実施の形態1において予測候補作成部6に設けられる文字列抽出部13(図1参照)を、文字列変換部4に備えている。
【0075】
なお、その他の文字入出力システム20の主要構成は、実施の形態1における文字入出力装置1と略同様である。よって、同一の機能を有するブロックに同一の参照番号を付すことにより、各ブロックの機能についての詳細な説明を省略する。
【0076】
本実施の形態の文字入出力システム20は、予測候補作成サーバ21を文字入力制御部3にネットワーク接続する構成としている点に特徴がある。この特徴点を以下具体的に説明する。
【0077】
予測候補作成サーバ21は、情報検索部14と、形態素解析部15と、予測候補格納部16とを備えている。
【0078】
情報検索部14は、文字列抽出部13により抽出された予測候補関連文字列を、インターネットを経由して取得する。その後、実施の形態1と同様の手順により、情報検索部14は、予測候補関連文字列に基づいて、インターネット上の検索ページを用いたウェブページ検索を行い、文書ファイルを取得する。
【0079】
さらに、形態素解析部15は、上述のように取得された文書ファイルを形態素解析して読みと表記とに分割する。さらに、予測候補作成サーバ21は、形態素解析の結果を予測候補として予測候補格納部16に格納する。そして、本実施の形態の予測候補取得部7は、予測候補格納部16に格納された予測候補を、インターネット経由で参照してユーザに提示する。
【0080】
このように、本実施の形態の文字入出力システム20は、予測候補作成サーバ21を備える構成とすることにより、情報検索部14、形態素解析部15、および予測候補格納部16の機能と、文字列変換部4の機能とが分離して構成されている。
【0081】
したがって、本実施の形態の文字入出力システム20では、実施の形態1の文字入力制御部3における予測候補作成部6の機能が、予測候補作成サーバ21により実現されている。したがって、本実施の形態では、文字入力制御部3の処理を実施の形態1よりも簡略化することが可能となる。
【0082】
また、予測候補作成サーバ21はインターネットに接続された構成であるので、複数の文字入力制御部3から異なる予測候補関連文字列を取得することが可能となる。したがって、予測候補作成サーバ21は、より多様な予測候補関連文字列に基づいてインターネット検索を行い、多様な予測候補を予測候補格納部16に格納することができる。
【0083】
したがって、予測候補取得部7は、より多様な予測候補を予測候補格納部16から取得することが可能となるので、予測候補としてユーザに提示できる文字列のバリエーションを増やすことができる。よって、ユーザの文字入力の際の負担をより軽減することができる。
【0084】
もちろん、予測候補が入力文字列として選択された結果を、予測候補学習部10から予測候補作成サーバ21にインターネット経由で与えてもよい。特に、複数の予測候補学習部から、予測候補の選択結果をインターネット経由で予測候補作成サーバ21に与えることが好ましい。
【0085】
これにより、予測候補作成サーバ21は、多様な予測候補の選択結果を取得することができる。このように取得された多様な選択結果に基づき、予測候補作成サーバ21は、インターネット経由で取得した予測候補がユーザに選択される可能性をより的確に判断することが可能となる。
【0086】
さらに、このように判断された選択可能性に基づき、予測候補格納部16に格納された予測候補の更新処理を行えば、ユーザに選択される可能性が高い予測候補だけを的確に予測候補格納部16に格納しておくことができる。
【0087】
このように、本実施の形態の文字入出力システム20によれば、予測候補取得部7は、精選された予測候補のみが格納された予測候補格納部16を参照することが可能となるので、ユーザに選択される可能性が高い選択候補のみをユーザに提示することができる。
【0088】
つまり、本実施の形態の予測候補作成サーバ21は、文字列変換部4とネットワーク接続されているので、1対多での処理機能を備える必要がある。したがって、1つの予測候補作成サーバ21に対し、複数の文字列変換部4をネットワーク接続することが可能となる。つまり、複数の文字列変換部4が存在する場合において、各システムに対応して備えられるべき予測候補作成手段を共通化することができる。
【0089】
なお、本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【0090】
最後に、文字入力制御部3の各ブロックは、ハードウェアロジックによって構成してもよいし、次のようにCPUを用いてソフトウェアによって実現してもよい。
【0091】
すなわち、文字入力制御部3は、文字入力制御部3の各機能を実現する文字入力プログラムの命令を実行するCPU(central processing unit )、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである文字入力プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記文字入力装置1に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。この場合、記録媒体から読み出されたプログラムコード自体が上述した機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
【0092】
例えば、上記記録媒体としては、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
【0093】
さらに、システムあるいは装置を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。
【0094】
また、上述した機能は、コンピュータが読み出した上記プログラムコードを実行することによって実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOSなどが実際の処理の一部または全部を行うことによっても実現される。
【0095】
なお、本発明の文字データ入出力装置は、これから入力すると予測される候補を格納した予測候補辞書と、文字列を入力する文字列入力部と、上記文字列入力部より入力された文字列以降に入力されると予測される予測候補を上記予測候補辞書から検索する予測候補検索部と、入力された文字列及び検索された予測候補を表示する表示部と、表示された予測候補の1つを入力する文字列として選択する予測候補選択部を備え、上記予測候補辞書を生成するに当たっては、入力されると予測される文字列に関連があると予測される文字列を抽出する予測候補関連文字列抽出部と、予測候補関連文字列抽出部によって抽出された文字列を用いて機器内に無い情報をネットワーク等の通信機能を利用し検索する機器外情報検索部と、機器外から検索した文章およびデータ内に含まれる漢字交じり文を形態素解析し、文節候補とその文節に対する読み情報を予測候補辞書として生成する予測候補辞書生成部を備えている構成であってもよい。
【0096】
さらに、本発明の文字データ入出力装置は、上記予測候補検索部が、上記予測候補辞書生成部で生成された、読みと表記が対となった予測候補を短縮変換の候補として予測候補を検索できる構成であってもよい。
【0097】
【発明の効果】
以上のように、本発明の文字データ入出力装置は、出力文字データの候補を予測候補文字データとして作成する予測候補作成手段と、上記予測候補作成手段から取得される上記予測候補文字データを、ユーザに提示するとともにユーザの指示に従い選択して出力文字データとして出力する文字データ変換手段とを備え、上記予測候補作成手段が、入力文字データに関連する関連文字データを上記文字データ入出力装置外部にネットワークを介して接続された情報記憶装置から検索する検索手段と、上記検索手段の検索結果として得られる関連文字データを上記情報記憶装置から取得する関連文字データ取得手段とを備えているとともに、上記関連文字データ取得手段が取得した上記関連文字データに基づき、上記予測候補文字データを作成するものである。
【0098】
上記構成によれば、予測候補作成手段が作成する予測候補文字データは、関連文字データに基づき作成される。この関連文字データは、検索手段が文字データ入出力装置外部にネットワークを介して接続された情報記憶装置を検索した結果から、関連文字データ取得手段により取得されるものであるので、本装置外の情報であるといえる。すなわち、予測候補作成手段は、本装置外の情報に基づき、予測候補文字データを作成する。
【0099】
したがって、文字データ変換手段は、過去に本装置内で処理したことの無いような文字データであっても、本装置外部から取得し、予測候補文字データとしてユーザに提示することができる。これにより、ユーザは、過去に入力したことがないような予測候補文字データを出力文字データとして選択することができるとともに、その予測候補文字データを入力する手間が省略される。それゆえ、ユーザの文字入力負担を軽減することができるという効果を奏する。
【0100】
さらに、本発明の文字データ入出力装置は、上記構成の文字データ入出力装置において、上記予測候補文字データが上記出力文字データとして上記文字データ変換手段により選択された結果から、該予測候補文字データが上記出力文字データとして選択される可能性を学習する予測候補学習手段と、上記予測候補学習手段の学習結果に基づいて、上記予測候補文字データを格納する予測候補格納手段とを備えているものである。
【0101】
上記構成によれば、装置外から取得した関連文字データに基づき作成された予測候補文字データについて、出力文字データとして選択される可能性が高いと判断されるものを、予測候補格納手段に格納することができる。これにより、予測候補格納手段に一旦格納された予測候補文字データは、再度装置外部から関連文字データを取得することなく以降の文字入力の際にユーザに提示することができる。よって、本装置内の処理を簡略化することができるという効果を奏する。
【0102】
また、本発明の文字データ入出力方法は、入力文字データを出力文字データに変換する文字データ入出力方法において、上記出力文字データの候補を予測候補文字データとして作成する第1ステップと、上記第1ステップにより作成された上記予測候補文字データを、ユーザに提示するとともにユーザの指示に従い選択して出力文字データとして出力する第2ステップとを備え、上記第1ステップは、上記入力文字データに関連する関連文字データをネットワークを介して接続された情報記憶装置から検索する第3ステップと、上記第3ステップの検索結果として得られる関連文字データを上記情報記憶装置から取得する第4ステップとを備えているとともに、上記第4ステップにて取得された上記関連文字データに基づき、上記予測候補文字データを作成するステップである方法である。
【0103】
上記構成の文字データ入出力方法によれば、本発明の文字データ入出力装置における予測候補作成手段、文字データ変換手段、検索手段、および関連文字データ取得手段と同一の機能を、それぞれ第1ステップ、第2ステップ、第3ステップおよび第4ステップにより実現している。
【0104】
よって、本発明の文字データ入出力方法によれば、上記構成の文字データ入出力装置と同様の作用効果を得ることができる。
【0105】
また、本発明の文字データ入出力プログラムは、上記構成の文字データ入出力方法における各ステップをコンピュータに実行させるものである。
【0106】
上記プログラムをコンピュータシステムにロードすることによって、上記文字データ入出力方法を実現することが可能となるという効果を奏する。
【0107】
また、本発明のコンピュータ読み取り可能な記録媒体は、上記構成の文字データ入出力プログラムを記録しているものである。
【0108】
上記記録媒体に記録されたプログラムをコンピュータシステムにロードすることによって、上記文字データ入出力プログラムを実現することが可能となるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の文字データ入出力装置の一実施形態にかかる文字入出力装置の構成を示すブロック図である。
【図2】図1の文字入出力装置に入力された文章の一例を示す図である。
【図3】図2の入力文章を基に作成された入力履歴辞書の構成を示す図である。
【図4】図2の入力文章を共起関係毎に分類した用例辞書の構成を示す図である。
【図5】図1の文字入出力装置における情報検索部がインターネットを介した情報検索を行う状態を示す図である。
【図6】図1の文字入出力装置における予測候補作成部が予測候補を作成する手順を示すフローチャートである。
【図7】図1の文字入出力装置における予測候補作成部により装置外から取得される文書ファイルの例を示す図である。
【図8】図7の文書ファイルを形態素解析して読みと表記に分割した結果を示す図である。
【図9】図1の予測候補格納部に格納された予測候補が表示された状態を示す図である。
【図10】図9に表示された予測候補を絞り込んで表示した状態を示す図である。
【図11】本発明の他の実施形態にかかる文字入出力システムの構成を示すブロック図である。
【符号の説明】
1 文字入出力装置(文字データ入出力装置)
4 文字列変換部(文字データ変換手段)
6 予測候補作成部(予測候補作成手段)
10 予測候補学習部(予測候補学習手段)
12 予測候補辞書(予測候補格納手段)
14 情報検索部(検索手段、関連文字データ取得手段)
16 予測候補格納部(予測候補格納手段)

Claims (5)

  1. 入力文字データを出力文字データに変換する文字データ入出力装置において、
    上記出力文字データの候補を予測候補文字データとして作成する予測候補作成手段と、
    上記予測候補作成手段から取得される上記予測候補文字データを、ユーザに提示するとともにユーザの指示に従い選択して出力文字データとして出力する文字データ変換手段とを備え、
    上記予測候補作成手段は、
    上記入力文字データに関連する関連文字データを上記文字データ入出力装置外部にネットワークを介して接続された情報記憶装置から検索する検索手段と、
    上記検索手段の検索結果として得られる関連文字データを上記情報記憶装置から取得する関連文字データ取得手段とを備えているとともに、
    上記関連文字データ取得手段が取得した上記関連文字データに基づき、上記予測候補文字データを作成するものであることを特徴とする文字データ入出力装置。
  2. 上記予測候補文字データが上記出力文字データとして上記文字データ変換手段により選択された結果から、該予測候補文字データが上記出力文字データとして選択される可能性を学習する予測候補学習手段と、
    上記予測候補学習手段の学習結果に基づいて、上記予測候補文字データを格納する予測候補格納手段とを備えていることを特徴とする請求項1に記載の文字データ入出力装置。
  3. 入力文字データを出力文字データに変換する文字データ入出力方法において、
    上記出力文字データの候補を予測候補文字データとして作成する第1ステップと、
    上記第1ステップにより作成された上記予測候補文字データを、ユーザに提示するとともにユーザの指示に従い選択して出力文字データとして出力する第2ステップとを備え、
    上記第1ステップは、
    上記入力文字データに関連する関連文字データをネットワークを介して接続された情報記憶装置から検索する第3ステップと、
    上記第3ステップの検索結果として得られる関連文字データを上記情報記憶装置から取得する第4ステップとを備えているとともに、
    上記第4ステップにて取得された上記関連文字データに基づき、上記予測候補文字データを作成するステップであることを特徴とする文字データ入出力方法。
  4. 請求項3に記載の文字データ入出力方法における各ステップをコンピュータに実行させるための文字データ入出力プログラム。
  5. 請求項4に記載の文字データ入出力プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2003131890A 2003-05-09 2003-05-09 文字データ入出力装置、文字データ入出力方法、文字データ入出力プログラム、およびコンピュータ読み取り可能な記録媒体 Withdrawn JP2004334690A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003131890A JP2004334690A (ja) 2003-05-09 2003-05-09 文字データ入出力装置、文字データ入出力方法、文字データ入出力プログラム、およびコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003131890A JP2004334690A (ja) 2003-05-09 2003-05-09 文字データ入出力装置、文字データ入出力方法、文字データ入出力プログラム、およびコンピュータ読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2004334690A true JP2004334690A (ja) 2004-11-25

Family

ID=33506949

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003131890A Withdrawn JP2004334690A (ja) 2003-05-09 2003-05-09 文字データ入出力装置、文字データ入出力方法、文字データ入出力プログラム、およびコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP2004334690A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113432A (ja) * 2008-11-05 2010-05-20 Yahoo Japan Corp 変換候補表示装置、および変換候補表示装置の制御方法
JP4891438B2 (ja) * 2007-08-27 2012-03-07 ソニー エリクソン モバイル コミュニケーションズ, エービー キーパッドテキスト入力の多義性解消
JP2012164353A (ja) * 2005-08-24 2012-08-30 Yahoo Inc 検索クエリ完成前の代替クエリの連想
US9405857B2 (en) 2005-08-24 2016-08-02 Jollify Management Limited Speculative search result on a not-yet-submitted search query
JP2019179445A (ja) * 2018-03-30 2019-10-17 正晃テック株式会社 病理診断文入力支援プログラム、病理診断文入力支援方法および病理診断文入力支援システム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012164353A (ja) * 2005-08-24 2012-08-30 Yahoo Inc 検索クエリ完成前の代替クエリの連想
US9405857B2 (en) 2005-08-24 2016-08-02 Jollify Management Limited Speculative search result on a not-yet-submitted search query
JP4891438B2 (ja) * 2007-08-27 2012-03-07 ソニー エリクソン モバイル コミュニケーションズ, エービー キーパッドテキスト入力の多義性解消
JP2010113432A (ja) * 2008-11-05 2010-05-20 Yahoo Japan Corp 変換候補表示装置、および変換候補表示装置の制御方法
JP2019179445A (ja) * 2018-03-30 2019-10-17 正晃テック株式会社 病理診断文入力支援プログラム、病理診断文入力支援方法および病理診断文入力支援システム
JP7036378B2 (ja) 2018-03-30 2022-03-15 正晃テック株式会社 病理診断文入力支援プログラム、病理診断文入力支援方法および病理診断文入力支援システム

Similar Documents

Publication Publication Date Title
US9262403B2 (en) Dynamic generation of auto-suggest dictionary for natural language translation
US20070179932A1 (en) Method for finding data, research engine and microprocessor therefor
JP2741575B2 (ja) 文字認識文字補完方法及びコンピュータ・システム
JPH11110416A (ja) データベースからドキュメントを検索するための方法および装置
JP2006004427A (ja) 日本語などの複雑言語のコンテンツを検索するシステム及び方法
JP6462970B1 (ja) 分類装置、分類方法、生成方法、分類プログラム及び生成プログラム
JP2006099428A (ja) 文書要約作成システム、方法、及びプログラム
JP5331023B2 (ja) 重要語抽出装置、重要語抽出方法及び重要語抽出プログラム
JP2004334690A (ja) 文字データ入出力装置、文字データ入出力方法、文字データ入出力プログラム、およびコンピュータ読み取り可能な記録媒体
JPH08129554A (ja) 関係表現抽出装置および関係表現検索装置
JP3937741B2 (ja) 文書の標準化
JP5285491B2 (ja) 情報検索システム、方法及びプログラム、索引作成システム、方法及びプログラム、
JP2010146061A (ja) 例文表示装置、例文表示方法および例文表示プログラム
JP2009104475A (ja) 類似文書検索装置、類似文書検索方法およびプログラム
JP6181890B2 (ja) 文献解析装置、文献解析方法およびプログラム
JP2831837B2 (ja) 文書検索装置
JP3056810B2 (ja) 文書検索方法および装置
JP2010061532A (ja) 電子辞書、電子辞書の検索方法及び電子辞書の検索プログラム
JP2006039811A (ja) ドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置
JP2007233724A (ja) 文書検索システム、その方法及びプログラム
JP4139805B2 (ja) 字句をデータに変換する装置、方法及びプログラム
JP4051369B2 (ja) 字句をデータに変換する装置、方法及びプログラム
JPH1115826A (ja) 文書解析装置及び方法
JP6511874B2 (ja) コンピュータプログラム、検索装置及び検索方法
JP2006172029A (ja) 検索結果提示方法

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060801