JP2010039721A - データ入力装置、方法、及びプログラム - Google Patents

データ入力装置、方法、及びプログラム Download PDF

Info

Publication number
JP2010039721A
JP2010039721A JP2008201214A JP2008201214A JP2010039721A JP 2010039721 A JP2010039721 A JP 2010039721A JP 2008201214 A JP2008201214 A JP 2008201214A JP 2008201214 A JP2008201214 A JP 2008201214A JP 2010039721 A JP2010039721 A JP 2010039721A
Authority
JP
Japan
Prior art keywords
data
search
conversion
user
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008201214A
Other languages
English (en)
Inventor
Kensuke Masugata
謙介 舛形
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP2008201214A priority Critical patent/JP2010039721A/ja
Priority to US12/535,209 priority patent/US20100030760A1/en
Publication of JP2010039721A publication Critical patent/JP2010039721A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2428Query predicate definition using graphical user interfaces, including menus and forms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】データ入力の利便性を向上させる技術を提供する。
【解決手段】入力受付部12は、ユーザインタフェイス110を介して、ユーザから変換元データの入力を受け付けた場合には、辞書データベースを利用する通常変換処理部70で変換先データの候補を表示する。ユーザインタフェイス110を介して、ユーザから検索データの入力を受け付けた場合には、検索サービス等を利用する検索変換処理部20で検索結果データ、または変換先データの候補を表示する。
【選択図】図1

Description

本発明は、データ入力技術に関し、特に、ユーザから受け付けたデータを他のデータに変換して入力するデータ入力装置、方法、及びプログラムに関する。
日本語の文字列を入力する際に、ユーザが入力した読みを漢字に変換して入力するプログラムが広く利用されている(例えば、特許文献1参照)。
特開2004−139402号公報
従来の変換では、例えば仮名漢字変換による入力の場合、ユーザが所望する漢字の読みを知らなければ入力できない。また、インターネット上に存在する検索サイト等を利用すれば所望する文字列を多彩な方法で調べられるが、その場合には、Webブラウザ等のアプリケーションを別に起動し、検索サービス等を利用して検索結果を表示させた後に、Webブラウザから目的のアプリケーションに対してコピーアンドペーストをするような付加的な作業が発生してしまい煩雑である。そこで、より利便性の高いデータ入力の技術が求められている。
本発明はこうした状況に鑑みてなされたものであり、その目的は、データ入力の利便性を向上させる技術を提供することにある。
本発明のある態様は、データ入力装置に関する。このデータ入力装置は、ユーザからデータの入力を受け付ける入力受付部と、ユーザから受け付けた入力データを変換することにより生成されたデータを出力する通常変換処理部と、ユーザから受け付けた入力データをもとに検索を行った結果から生成されたデータを出力する検索変換処理部と、を備え、前記通常変換処理部は、入力データをもとに、辞書データベースを参照して変換先データの候補を抽出する候補抽出部と、変換先データの候補を表示し、ユーザから変換先データの選択を受け付ける候補表示部と、を含み、前記検索変換処理部は、入力データをもとに、検索サービスに検索要求を行い、検索結果データを得る通信部と、検索結果データ、若しくは検索結果データを所定の条件に従って加工した変換先データの候補を表示する検索変換表示部と、を含むことを特徴とする。
前記検索変換表示部は、検索データ入力画面を表示し、または検索結果データを表示するためのブラウザの表示を行ってもよく、前記入力受付部は、ブラウザ内に表示された検索結果からユーザが任意に指定した1以上のデータを受け付けてもよい。
データ出力位置の前後の文脈に対する適合性の高さに従って、前記検索結果データの並び順序を決定する検索変換順序決定部を更に備えてもよく、前記検索変換表示部は、検索変換順序決定部により決定された並び順序に従って検索結果データをブラウザに表示してもよい。
前記通信部は、パス情報をもとに、ディレクトリ管理サービスにディレクトリ検索要求を行い、検索結果データとして検索データの下位のパス情報を得てもよく、前記検索変換表示部は、下位のパス情報をディレクトリツリー画面で表示してもよく、前記入力受付部は、ディレクトリツリー画面内のパス情報からユーザが任意に指定したパス情報を受け付けてもよい。
前記通信部より検索結果データを受け付け、所定の条件に従って検索結果データから変換先データの候補を抽出する検索変換候補抽出部と、検索変換候補抽出部により複数の変換先データの候補が抽出された場合、所定の条件に従って複数の変換先データの候補の表示順序を決定する検索変換順序決定部を更に備えてもよく、前記検索変換表示部は、検索変換順序決定部により決定された表示順序に従って変換先データの候補を表示し、ユーザから変換先データの選択を受け付けてもよい。
前記検索変換候補抽出部は、データ出力位置の前後の文脈に対する適合性の高さに従って検索結果データから変換先データの候補を抽出してもよく、前記検索変換順序決定部は、データ出力位置の前後の文脈に対する適合性の高さに従って変換先データの候補の並び順序を決定してもよい。
前記通信部は、翻訳サービスに翻訳要求を行い、翻訳結果データを得てもよく、前記検索変換候補抽出部は、データ出力位置の前後の文脈への適合性の高さに従って翻訳結果データから変換先データの候補を抽出してもよい。
前記通信部は、検索サービスに複数の類義語データの検索要求を行い、各々の類義語データの検索結果データを得てもよく、前記検索変換候補抽出部は、検索結果データから類義語データを変換先データの候補として抽出してもよく、前記検索変換順序決定部は、検索結果データの中の各々の類義語データに対する検索ヒット数に従って変換先データの候補の並び順序を決定してもよい。
前記通信部は、検索サービスに1以上の数式関連データの検索要求を行い、各々の数式関連データの検索結果データを得てもよく、前記検索変換候補抽出部は、検索結果データから数式データを変換先データの候補として抽出してもよく、前記検索変換順序決定部は、データ出力位置の前後の文脈への適合性の高さに基づき変換先データの候補の並び順序を決定してもよい。
本発明の別の態様は、データ入力方法に関する。このデータ入力方法は、ユーザからデータの入力を受け付けるステップと、ユーザから受け付けた入力データを変換することにより生成されたデータを出力する通常変換ステップと、ユーザから受け付けた入力データをもとに検索を行った結果から生成されたデータを出力する検索変換ステップと、を備え、前記通常変換ステップは、入力データをもとに、辞書データベースを参照して変換先データの候補を抽出するステップと、変換先データの候補を表示し、ユーザから変換先データの選択を受け付けるステップと、を含み、前記検索変換ステップは、入力データをもとに、検索サービスに検索要求を行い、検索結果データを得るステップと、検索結果データ、若しくは検索結果データを所定の条件に従って加工した変換先データの候補を表示するステップと、を含むことを特徴とする。
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システムなどの間で変換したものもまた、本発明の態様として有効である。
本発明によれば、データ入力の利便性を向上させる技術を提供することができる。
実施の形態では、ユーザが入力するデータを変換先データに変換して出力するデータ入力装置において、ユーザが入力するデータを変換元データとして変換先データに変換して出力する通常変換機能に加え、ユーザが入力するデータを検索データとして検索処理をした結果からユーザの指定により変換先データに変換して出力する検索変換機能を更に提供する技術を提案する。
従来、例えば読み仮名漢字変換において、ユーザは所望する漢字の読み仮名を知らなければ、所望する漢字を出力することは困難であった。しかし、本実施の形態で提案する技術により、ユーザは所望する漢字の読み仮名を知らない場合でも、キーワードを入力し検索変換を行うことで、検索結果から所望の漢字を選択し、出力することができる。これにより、データ入力の利便性の大幅な向上を実現する。
図1は、実施の形態に係るデータ入力装置10の構成を示した機能ブロック図である。データ入力装置10は、ユーザによるアプリケーション120に対するデータの入力を支援する。すなわち、ユーザがアプリケーション120に対してデータを入力する際に、ユーザがユーザインタフェイス110を介して入力したデータから想起される変換先データの候補の中からユーザが指定したデータを、出力部18を介してアプリケーション120に対して出力する。
データ入力装置10は、入力受付部12、校正支援部16、出力部18、検索変換処理部20、通常変換処理部70を備える。これらの構成は、ハードウエアコンポーネントでいえば、任意のコンピュータのCPU、メモリ、メモリにロードされたプログラムなどによって実現されるが、ここではそれらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者には理解されるところである。後述する図2、図3においても同様である。
入力受付部12は、ユーザインタフェイス110を介して、ユーザからデータを受け付け、ユーザの要求に従って通常変換処理部70、または検索変換処理部20に処理を要求する。すなわち、ユーザの要求が通常変換処理である場合には、入力受付部12は、入力データを変換元データとして、通常変換処理部70に処理を要求する。一方でユーザの要求が検索変換処理である場合には、入力受付部12は、入力データを検索データ、または翻訳元データとして検索変換処理部20に処理を要求する。
校正支援部16は通常変換処理部70及び検索変換処理部20に対し、データの校正を支援する。例えば、ユーザが誤った変換元データを入力していると推定される場合には誤りを指摘する。出力部18は、ユーザインタフェイス110を介してユーザにより選択された変換先データをアプリケーション120に出力する。検索変換処理部20及び通常変換処理部70の詳細については後述する。
図2は、通常変換処理部70の詳細な構成を示した機能ブロック図である。通常変換処理部70は、読み仮名漢字変換を含む通常変換処理をする。通常変換処理は主に、データ入力装置10が備える辞書機能を利用して入力データを変換する。通常変換処理部70は、候補抽出部72、辞書データベース74、順序決定部76、候補表示部78を有する。
辞書データベース74は、変換元データと変換先データとを対応付けて保持する。例えば、アプリケーション120に漢字を出力するために使用する辞書データベース74は、変換元データとして漢字の読みを、変換先データとして漢字を保持する。
候補抽出部72は、辞書データベース74を参照して、入力受付部12より受け付けた変換元データに対応する変換先データの候補を抽出する。順序決定部76は、候補抽出部72により複数の変換先データの候補が抽出された場合、所定の条件に従って、複数の変換先データの候補の表示順序を決定する。ここで所定の条件とは、ユーザの過去の変換履歴による順序付けであってもよく、後述する文脈解析部48を利用した順序付けであってもよい。候補表示部78は、順序決定部76により決定された表示順序に従って変換先データの候補を表示し、ユーザから変換先データの選択を受け付ける。
図3は、検索変換処理部20の詳細な構成を示した機能ブロック図である。検索変換処理部20は、検索サービスや翻訳サービスを利用した検索変換処理をする。検索変換処理は主に、データ入力装置10の外部のデータ提供サービスを利用して入力データを変換する。検索変換処理部20は、検索データ変換部30、通信部22、検索結果データ変換部40、検索変換表示部60を有する。
検索データ変換部30は、入力受付部12より受け付けた検索データをもとに、他の検索データを取得する。例えば、検索データ変換部30は、数式変換部32、数式データベース34を含んでもよい。この場合、数式データベース34は、数式に関するキーワードと数式データとを対応付けて保持する。検索データとして「二次方程式の解」を受け付けた場合、数式変換部32は数式データベース34を参照して、二次方程式の解の公式等の数式データを取得する。
別の例として、検索データ変換部30は、類義語変換部36、類義語データベース38を含んでもよい。この場合、類義語データベース38は、例えば、「インタフェース」・「インターフェース」・「インターフェイス」等の類義語データをお互いに関連づけて保持する。検索データとして「インタフェース」を受け付けた場合、類義語変換部36は、類義語データベース38を参照してそれらの類義語データを取得する。
通信部22は、検索データ、または翻訳元データを受け付けて、ローカルマシン100内のディレクトリ管理サービス130、通信ネットワーク200上に存在する検索サービス300、翻訳サービス400、ディレクトリ管理サービス500、に対し検索要求や翻訳要求を行い、検索結果データや翻訳結果データを受け取る。なお、図では一般的な構成として、検索サービス300及び翻訳サービス400を通信ネットワーク上に図示しているが、これに限定されずローカルマシン内に存在してもよい。
検索結果データ変換部40は、通信部22の出力である検索結果データ、または翻訳結果データを受け付け、所定の条件に従って変換先データの候補を抽出し、所定の条件に従って変換先データの候補の表示の順序を決定する。検索結果データ変換部40は、検索変換候補抽出部42、検索変換順序決定部44、数式抽出部46、文脈解析部48、検索ヒット数取得部50を含む。
検索変換候補抽出部42は、所定の条件に従って検索結果データ、または翻訳結果データから変換先データの候補を抽出する。一般に検索結果データそのものは、変換先データの候補以外に多くのデータ、例えば文字列、を含むが、検索変換候補抽出部42は、後述する文脈解析部48を利用して、検索結果データから変換先データの候補を取得する。検索変換順序決定部44は、検索変換候補抽出部42により複数の変換先データの候補が抽出された場合、所定の条件に従って複数の変換先データの候補の表示順序を決定する。数式抽出部46は、検索結果データから数式を抽出する。この場合、数式データベース34を参照して、検索結果データから数式を抽出してもよい。検索ヒット数取得部50は、検索結果データから検索ヒット数を取得する。
文脈解析部48は、データ出力位置の前後の文脈に対する適合性の高さを判別する。文脈解析部48は、データの出力対象であるアプリケーション120と通信し、データ出力位置の前後の文字列を取得することで、出力すべき文字列を判定してもよい。例えば、アプリケーション120より取得したデータ出力位置の前後の文字列を形態素解析し、適合する文字列の品詞を判別してもよいし、主語・述語の関係や、修飾・被修飾の関係といった係り受けの構造をもとに適合する文字列を絞り込んでもよい。
検索変換表示部60は、通信部22より受け取った検索結果データ、または検索結果データ変換部40より受け取った変換先データの候補を表示する。検索変換表示部60は、ブラウザ表示部62、ディレクトリ表示部64、検索変換候補表示部66、を含む。
ブラウザ表示部62は、ユーザの検索データを入力するためのブラウザを表示し、または通信部22より受け取った検索結果データをそのブラウザに表示する。ディレクトリ表示部64は、通信部22より受け取った検索結果データをディレクトリツリー画面で表示する。検索変換候補表示部66は、検索変換順序決定部44により決定された表示順序に従って変換先データの候補を表示し、ユーザから変換先データの選択を受け付ける。
これまで示した機能ブロックがどのように連携し、データ入力の利便性の向上を実現するかを、以下具体的にユーザインタフェイスを示して説明する。
図4は、データ入力装置10を利用して文字列を入力するユーザインタフェイスを示す図である。同図は、ディスプレイ140に表示されたアプリケーション150にて文章作成中のユーザが、文字列「北海道の」と文字列「は透明度が高い湖です。」の間のデータ出力位置152に適切な湖の名前を入れたいが、その読み仮名がわからない、という問題を解決する例である。同図では、ユーザはデータ入力装置の検索装置160を起動し、ブラウザ170を表示させ、そのテキストフィールド172に検索データ「北海道 透明度」を入力した状態を示している。
この例において、データ入力装置の検索装置160が起動されると、入力受付部12が検索要求を受け付け、ブラウザ表示部62がブラウザ170を起動する。次にテキストフィールド172に文字列が入力され、検索実行ボタン174が押下されると、入力受付部12はその文字列を検索データとして受け付ける。通信部22は検索データをもとに検索サービスに検索要求し、その検索結果データを得る。そしてブラウザ表示部62はブラウザ170に検索結果データを表示する。ユーザはブラウザ170に表示された文字列から任意の文字列を指定することができる。
図5は、図4の次のステップのユーザインタフェイス説明するための図である。同図では、ブラウザ表示部62がブラウザ170に検索結果データを表示し、ユーザが任意の文字列176「摩周湖」を指定した状態を示している。なお、この状態において、ユーザは任意の文字列を指定することができる。
図6は、図5の次のステップのユーザインタフェイス説明するための図である。同図では、ユーザが指定した文字列154「摩周湖」が未確定文字列として表示された状態を示している。この場合、文字列154を一旦未確定文字列とすることで、校正支援機能によりデータ入力の利便性を更に高めてもよいし、文字列154を再度検索データとしてデータ入力装置10が取り込み検索変換処理を行ってもよい。または、未確定文字列とすることなく、確定文字列として出力してもよい。他の実施例においても同様である。
なお、ブラウザ表示部62は、検索変換候補抽出部42が、文脈解析部48を利用して検索結果データから抽出した、データ出力位置152の前後の文脈に、より適合するデータのみを表示するようにしてもよい。また、ブラウザ表示部62は、検索変換順序決定部44が、文脈解析部48を利用して決定した、データ出力位置152の前後の文脈に、より適合する検索結果データの並び順序で表示するようにしてもよい。また、ブラウザ表示部62は、検索変換候補抽出部42が抽出したデータを、検索変換順序決定部44が決定した並び順序で表示するようにしてもよい。
文脈解析部48の具体的な解析例について、図4の場合で示す。この場合、文脈解析部48は、データ出力位置の前に修飾語「北海道の」があり、データ出力位置の後に助詞「は」があるため、データ出力位置には主語となる名詞が入ると判別できる。さらに、述語が「湖です」となっているため、文脈解析部48は、○○湖のような、湖の名称が入ると判別できる。したがって図5の場合では、「摩周湖」及び「支笏湖」の文字列を含む項目が上位に表示されることになる。
このような技術により、ユーザは所望する漢字の読みがわからない場合であっても、所望する漢字を発見して出力することができる。また、他のWebブラウザを立ち上げて検索しコピーアンドペーストした場合には利用できない校正支援機能も利用することができる点で、データ入力の利便性の向上を実現できる。
図7も、データ入力装置10を利用して文字列を入力するユーザインタフェイスを示す図である。同図では、アプリケーション150にて文章作成中のユーザが、所望のパス文字列の一部を文字列156として入力した状態で、データ入力装置の検索装置160を起動し、ディレクトリツリー画面190にユーザが入力したパス文字列の下位のディレクトリ及びファイルが表示された状態を示している。
パス文字列の一部がユーザにより入力され、データ入力装置の検索装置160が起動されると、入力受付部12は、そのパス文字列を検索データとして受け付ける。通信部22はその検索データをもとにディレクトリ管理サービス130、またはディレクトリ管理サービス500に検索要求し、その検索結果を得る。ディレクトリ表示部64はディレクトリツリー画面190に検索結果である下位のパス情報を表示する。この場合、ディレクトリ管理サービスは、ディレクトリまたはファイルの管理サービスには限られない。例えば、ディレクトリサーバに対し、LDAP(Lightweight Directory Access Protocol)を利用して、通信ネットワーク上に存在する資源のURI(Uniform Resource Identifier)を検索し、その結果を表示してもよい。
図8は、図7の次のステップのユーザインタフェイス説明するための図である。同図は、ユーザがディレクトリツリー画面190よりtest¥confを指定し、アプリケーション150に文字列154「c¥test¥conf」が出力された状態を示している。
このような技術により、ユーザは所望のパス文字列の一部の入力という小さい労力で所望するパス文字列を出力でき、かつ、スペルミス等の入力誤りをなくすことができる点で、データ入力の利便性の向上を実現できる。
図9も、データ入力装置10を利用して文字列を入力するユーザインタフェイスを示す図である。同図は、アプリケーション150にて、頭語を「拝啓」とする文章を作成中のユーザが、結語部分を入力したいが、その読み仮名がわからない、という問題を解決する例である。同図では、ユーザが検索データとして文字列156「結語 拝啓」を入力した上で、データ入力装置の検索装置160を起動し、その検索データをもとに検索変換処理された結果である変換先データの候補180が表示された状態を示している。この状態で、ユーザは変換先データの候補180から任意の文字列を選択することができる。
この例では、ユーザが所望する漢字に関連する文字列を入力し、検索装置160を起動すると、入力受付部12はその文字列を検索データとして受け付ける。通信部22は検索データをもとに検索サービスに検索要求し、その検索結果データを得る。検索変換候補抽出部42は、文脈解析部48を利用して、データ出力位置の前後の文脈に、より適合する検索結果データを変換先データの候補として抽出する。検索変換順序決定部44は、文脈解析部48を利用して、データ出力位置の前後の文脈に、より適合する変換先データの候補の並び順序を決定する。検索変換候補表示部66は、検索変換順序決定部44により決定された表示順序に従って変換先データの候補180を表示し、ユーザから変換先データの選択を受け付ける。なお、変換先データの候補180を表示する技術は限定されない。例えば、通常変換処理における変換先データの候補の表示ウィンドウを利用してもよいし、OS(Operating System)が提供する標準ウィンドウを利用してもよいし、ブラウザを利用してもよい。他の実施例においても同様である。
文脈解析部48の具体的な解析例について、図9の場合で示す。この場合、データ出力位置が「拝啓」を頭語とする文章の終了部分であるので、文脈解析部48は、検索結果データの中で結語に該当する文字列について適合性が高いと判別してもよい。更に結語の中でも、頭語「拝啓」に対応する文字列が、より適合性が高いと判別してもよい。
このような技術により、ユーザは所望する漢字の読みがわからない場合であっても、所望する漢字に関連する文字列の入力という小さい労力で所望する漢字を出力することができる。また、他のWebブラウザを立ち上げて検索しコピーアンドペーストした場合には利用できない校正支援機能も利用することができる点で、データ入力の利便性の向上を実現できる。
図10も、データ入力装置10を利用して文字列を入力するユーザインタフェイスを示す図である。同図は、アプリケーション150にて、ユーザが和文「リンゴは赤い。」に対応する英文を入力したいが、その入力ができない、という問題を解決する例である。同図では、ユーザが、翻訳元データとして「りんごは赤い」という和文の文字列156を入力した上で、データ入力装置の翻訳装置162を起動し、翻訳元データをもとに翻訳された結果である変換先データの候補180が表示された状態を示している。この状態で、ユーザは変換先データの候補180から任意の文字列を選択することができる。
この例では、ユーザが翻訳元データを入力し翻訳装置162を起動すると、入力受付部12はその翻訳元データを受け付ける。通信部22はその翻訳元データをもとに翻訳サービスに翻訳要求し、その翻訳結果データを得る。検索変換候補抽出部42は、文脈解析部48を利用して、データ出力位置の前後の文脈に、より適合する翻訳結果データを変換先データの候補として抽出する。検索変換順序決定部44は、文脈解析部48を利用して、データ出力位置の前後の文脈に、より適合する変換先データの候補の並び順序を決定する。検索変換候補表示部66は、検索変換順序決定部44により決定された表示順序に従って変換先データの候補を表示し、ユーザから変換先データの選択を受け付ける。
文脈解析部48の具体的な解析例について、図10の場合で示す。この場合、文脈解析部48は、文字出力位置の前にある日本語文字列「りんご」に該当する英単語「apple」と、「赤い」に該当する英単語「red」を含む英文を適合性が高いと判別してもよい。
このような技術により、ユーザは所望する他言語のスペルがわからない場合であっても、自言語の入力という小さい労力で所望する他言語の文章を出力することができる。また、単純な辞書による単語単位の変換と異なり、コロケーションを考慮した自然な文章の出力が容易となる。更に、他のWebブラウザを立ち上げて翻訳しコピーアンドペーストした場合には利用できない校正支援機能も利用することができる点で、データ入力の利便性の向上を実現できる。
図11も、データ入力装置10を利用して文字列を入力するユーザインタフェイスを示す図である。同図は、アプリケーション150にて、ユーザが類義語を有する文字列「インタフェース」、「インターフェース」、「インターフェイス」等のうち、最も一般的な用語を入力したい、という問題を解決する例である。同図では、ユーザが検索データとして類義語を有する「インタフェース」という文字列156を入力した上で、データ入力装置の検索装置160を起動し、検索変換処理の結果である検索データ及び検索データの類義語データが変換先データの候補180として各々の検索ヒット数とともに表示されている状態を示している。この状態で、ユーザは検索ヒット数を参照し、検索ヒット数が多いものを最も一般的な用語として選択することができる。
この例では、ユーザが類義語を有する文字列を入力し検索装置160を起動すると、入力受付部12はその文字列を検索データとして受け付ける。類義語変換部36は類義語データベース38を参照し検索データと関連づけられた類義語データを取得する。通信部22は検索データと類義語をもとに検索サービスに検索要求し、その検索結果データを得る。検索変換候補抽出部42は、検索結果データから検索データ及び類義語データを変換先データの候補として抽出する。検索変換順序決定部44は、検索ヒット数取得部50を利用し、検索データに対する検索結果データの検索ヒット数、及び類義語データに対する検索結果データの検索ヒット数に従って変換先データの候補の並び順を決定する。検索変換候補表示部66は、検索変換順序決定部44により決定された表示順序に従って変換先データの候補を各々の検索ヒット数とともに表示し、ユーザから変換先データの選択を受け付ける。
このような技術により、ユーザは類義語を有する文字列を入力する際に、類義語各々の検索ヒット数を入力時に知ることができ、より適切な文字列選択ができる点で、データ入力の利便性の向上を実現できる。
図12も、データ入力装置10を利用して文字列を入力するユーザインタフェイスを示す図である。同図では、アプリケーション150にて、ユーザが所望する数式に関連する「二次方程式の解」という文字列156を入力した上で、データ入力装置の検索装置160を起動し、検索データをもとに検索された結果である数式を含む変換先データの候補180が表示されている状態を示している。この状態で、ユーザは所望の数式を選択し、出力することができる。
この例では、ユーザが数式に関連する文字列を入力し、検索装置160を起動すると、入力受付部12はその文字列を検索データとして受け付ける。数式変換部32は数式データベース34を参照し検索データと関連づけられた数式データを取得する。通信部22は検索データと取得した数式データをもとに検索サービスに検索要求し、その検索結果データを得る。検索変換候補抽出部42は数式抽出部46を利用し、検索結果データから数式データを抽出する。検索変換順序決定部44は文脈解析部48を利用して、データ出力位置の前後の文脈に、より適合する変換先データの候補の並び順序を決定する。検索変換候補表示部66は、検索変換順序決定部44により決定された表示順序に従って変換先データの候補を表示し、ユーザから変換先データの選択を受け付ける。
文脈解析部48の具体的な解析例について、図12の場合で示す。この場合、文脈解析部48は、データ出力位置の前の文字列を取得して「a」、「b」、「c」、「x」を含む数式の適合度が高いと判別してもよい。また、文脈解析部48は検索データと関連づけられた数式データを数式データベースから取得し、その形式に近い数式の適合度が高いと判別してもよい。
一般的に数式を記述する技術としては、TeXやMathML(Mathematics Markup Language)等が用いられているが、それらによる記述は一般的に複雑である。検索変換を利用する技術により、ユーザは数式に関連するキーワードを投入することで、数式そのもののデータを出力することができる。例えば、ユーザが所望する数式に近い数式データを選択し出力した後に、その数式データに修正を加えることにより所望の数式とすることができる。これによりTexやMathMLを用いて最初から数式を記述することと比較して容易な数式の記述が可能となり、データ入力の利便性の向上を実現できる。
以上、本発明を実施の形態をもとに説明した。
従来のデータ入力装置では、入力データから出力データへの変換の精度を向上する、言い換えれば、ユーザが所望する出力データを作成する、ことを実現するためには、辞書の情報量が鍵を握っていた。緻密な文脈解析・構文解析機能を備えることにより、前後の文脈に適合する出力データの判定は高精度にできたとしても、そのもととなる出力データの候補が辞書から抽出できなければデータ変換の精度向上はできないからである。
しかし、辞書の情報量には限界がある。例えば、実施の形態で述べたような、検索文字列をキーとして変換候補を出力することは従来のデータ入力装置では難しい。ユーザが任意に入力できる検索文字列に対応する変換候補の組を一つずつ持つことは現実的に困難だからである。
一方で、現在は情報通信端末が多くの人々に行き渡り、ブロードバンドの通信ネットワークも整備されている。そして、世界中の多くの人々が自ら情報を発信し、通信ネットワーク上には様々な情報が集合知として蓄積されている。我々はこの集合知に検索サービス等を利用してアクセスし、多様な情報を取得することができる。
本発明の実施の形態に係るデータ入力装置は、自身が保持する辞書による変換を備えるだけでなく、検索サービス等を利用して、通信ネットワーク上の集合知をあたかも自らの辞書であるかのように変換処理に利用する。いわば、日々成長する、無限の容量を備えた辞書を保持しているといえる。このデータ入力装置は、これからのWeb2.0時代に適合するデータ入力装置の先駆けであると、本発明者は確信する。
なお、この実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
本実施例では、検索変換処理において、検索変換処理部20は検索サービス等と通信を行うと説明した。変形例として、検索変換処理部20は内部にデータベースを持ち、過去の検索データと検索結果データの組、または過去の検索データと最終的にユーザが選択したデータの組など、過去の検索変換処理の履歴情報を保持してもよい。ユーザがデータベースに存在する検索データで再び検索変換処理を要求したときは、そのデータベースから検索結果データ、または以前選択されたデータを出力することができる。これにより、検索サービス等への通信回数が抑制され、検索変換処理要求に対するレスポンスタイムも向上させやすくなる。
実施の形態に係るデータ入力装置の構成を示した機能ブロック図である。 図1のデータ入力装置の通常変換処理部の詳細な構成を示した機能ブロック図である。 図1のデータ入力装置の検索変換処理部の詳細な構成を示した機能ブロック図である。 データ入力装置を利用して文字列を入力するユーザインタフェイスを示す図である。 図4の次のステップのユーザインタフェイス説明するための図である。 図5の次のステップのユーザインタフェイス説明するための図である。 データ入力装置を利用して文字列を入力するユーザインタフェイスを示す図である。 図7の次のステップのユーザインタフェイス説明するための図である。 データ入力装置を利用して文字列を入力するユーザインタフェイスを示す図である。 データ入力装置を利用して文字列を入力するユーザインタフェイスを示す図である。 データ入力装置を利用して文字列を入力するユーザインタフェイスを示す図である。 データ入力装置を利用して文字列を入力するユーザインタフェイスを示す図である。
符号の説明
10 データ入力装置、12 入力受付部、16 校正支援部、18 出力部、20 検索変換処理部、22 通信部、30 検索データ変換部、32 数式変換部、34 数式データベース、36 類義語変換部、38 類義語データベース、40 検索結果データ変換部、42 検索変換候補抽出部、44 検索変換順序決定部、46 数式抽出部、48 文脈解析部、50 検索ヒット数取得部、60 検索変換表示部、62 ブラウザ表示部、64 ディレクトリ表示部、66 検索変換候補表示部、70 通常変換処理部、72 候補抽出部、74 辞書データベース、76 順序決定部、78 候補表示部、100 ローカルマシン、110 ユーザインタフェイス、120 アプリケーション、130 ディレクトリ管理サービス、140 ディスプレイ、150 アプリケーション、152 データ出力位置、154 データ入力装置が出力した文字列、156 ユーザが入力した文字列、160 検索装置、162 翻訳装置、170 ブラウザ、172 テキストフィールド、174 検索実行ボタン、176 ユーザが指定した文字列、180 変換先データの候補、190 ディレクトリツリー画面、200 通信ネットワーク、300 検索サービス、400 翻訳サービス、500 ディレクトリ管理サービス。

Claims (11)

  1. ユーザからデータの入力を受け付ける入力受付部と、
    ユーザから受け付けた入力データを変換することにより生成されたデータを出力する通常変換処理部と、
    ユーザから受け付けた入力データをもとに検索を行った結果から生成されたデータを出力する検索変換処理部と、を備え、
    前記通常変換処理部は、
    前記入力データをもとに、辞書データベースを参照して変換先データの候補を抽出する候補抽出部と、
    前記変換先データの候補を表示し、ユーザから変換先データの選択を受け付ける候補表示部と、を含み、
    前記検索変換処理部は、
    前記入力データをもとに、検索サービスに検索要求を行い、検索結果データを得る通信部と、
    前記検索結果データ、若しくは検索結果データを所定の条件に従って加工した変換先データの候補を表示する検索変換表示部と、を含む
    ことを特徴とするデータ入力装置。
  2. 前記検索変換表示部は、検索データ入力画面を表示し、または検索結果データを表示するためのブラウザの表示を行い、
    前記入力受付部は、前記ブラウザ内に表示された検索結果からユーザが任意に指定した1以上のデータを受け付けることを特徴とする請求項1に記載のデータ入力装置。
  3. データ出力位置の前後の文脈に対する適合性の高さに従って、前記検索結果データの並び順序を決定する検索変換順序決定部を更に備え、
    前記検索変換表示部は、前記検索変換順序決定部により決定された並び順序に従って前記検索結果データをブラウザに表示することを特徴とする請求項2に記載のデータ入力装置。
  4. 前記通信部は、パス情報をもとに、ディレクトリ管理サービスにディレクトリ検索要求を行い、検索結果データとして検索データの下位のパス情報を得て、
    前記検索変換表示部は、前記下位のパス情報をディレクトリツリー画面で表示し、
    前記入力受付部は、前記ディレクトリツリー画面内のパス情報からユーザが任意に指定したパス情報を受け付けることを特徴とする請求項1に記載のデータ入力装置。
  5. 前記通信部より検索結果データを受け付け、所定の条件に従って検索結果データから変換先データの候補を抽出する検索変換候補抽出部と、
    前記検索変換候補抽出部により複数の変換先データの候補が抽出された場合、所定の条件に従って前記複数の変換先データの候補の表示順序を決定する検索変換順序決定部を更に備え、
    前記検索変換表示部は、前記検索変換順序決定部により決定された表示順序に従って前記変換先データの候補を表示し、ユーザから変換先データの選択を受け付けることを特徴とする請求項1に記載のデータ入力装置。
  6. 前記検索変換候補抽出部は、データ出力位置の前後の文脈に対する適合性の高さに従って検索結果データから変換先データの候補を抽出し、
    前記検索変換順序決定部は、データ出力位置の前後の文脈に対する適合性の高さに従って変換先データの候補の並び順序を決定することを特徴とする請求項5に記載のデータ入力装置。
  7. 前記通信部は、翻訳サービスに翻訳要求を行い、翻訳結果データを得て、
    前記検索変換候補抽出部は、データ出力位置の前後の文脈への適合性の高さに従って前記翻訳結果データから変換先データの候補を抽出することを特徴とする請求項6に記載のデータ入力装置。
  8. 前記通信部は、検索サービスに複数の類義語データの検索要求を行い、各々の類義語データの検索結果データを得て、
    前記検索変換候補抽出部は、検索結果データから類義語データを変換先データの候補として抽出し、
    前記検索変換順序決定部は、検索結果データの中の各々の類義語データに対する検索ヒット数に従って変換先データの候補の並び順序を決定することを特徴とする請求項5に記載のデータ入力装置。
  9. 前記通信部は、検索サービスに1以上の数式関連データの検索要求を行い、各々の数式関連データの検索結果データを得て、
    前記検索変換候補抽出部は、検索結果データから数式データを変換先データの候補として抽出し、
    前記検索変換順序決定部は、文字出力位置の前後の文脈への適合性の高さに従って変換先データの候補の並び順序を決定することを特徴とする請求項5に記載のデータ入力装置。
  10. ユーザからデータの入力を受け付けるステップと、
    ユーザから受け付けた入力データを変換することにより生成されたデータを出力する通常変換ステップと、
    ユーザから受け付けた入力データをもとに検索を行った結果から生成されたデータを出力する検索変換ステップと、を備え、
    前記通常変換ステップは、
    前記入力データをもとに、辞書データベースを参照して変換先データの候補を抽出するステップと、
    前記変換先データの候補を表示し、ユーザから変換先データの選択を受け付けるステップと、を含み、
    前記検索変換ステップは、
    前記入力データをもとに、検索サービスに検索要求を行い、検索結果データを得るステップと、
    前記検索結果データ、若しくは検索結果データを所定の条件に従って加工した変換先データの候補を表示するステップと、を含む
    ことを特徴とするデータ入力方法。
  11. ユーザからデータの入力を受け付ける機能と、
    ユーザから受け付けた入力データを変換することにより生成されたデータを出力する通常変換機能と、
    ユーザから受け付けた入力データをもとに検索を行った結果から生成されたデータを出力する検索変換機能と、
    をコンピュータに実現させることを特徴とするデータ入力プログラムであり、
    前記通常変換機能は、
    前記入力データをもとに、辞書データベースを参照して変換先データの候補を抽出する機能と、
    前記変換先データの候補を表示し、ユーザから変換先データの選択を受け付ける機能と、を含み、
    前記検索変換機能は、
    前記入力データをもとに、検索サービスに検索要求を行い、検索結果データを得る機能と、
    前記検索結果データ、若しくは検索結果データを所定の条件に従って加工した変換先データの候補を表示する機能と、を含む
    ことを特徴とするデータ入力プログラム。
JP2008201214A 2008-08-04 2008-08-04 データ入力装置、方法、及びプログラム Pending JP2010039721A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008201214A JP2010039721A (ja) 2008-08-04 2008-08-04 データ入力装置、方法、及びプログラム
US12/535,209 US20100030760A1 (en) 2008-08-04 2009-08-04 Data input apparatus and data input method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008201214A JP2010039721A (ja) 2008-08-04 2008-08-04 データ入力装置、方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2010039721A true JP2010039721A (ja) 2010-02-18

Family

ID=41609363

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008201214A Pending JP2010039721A (ja) 2008-08-04 2008-08-04 データ入力装置、方法、及びプログラム

Country Status (2)

Country Link
US (1) US20100030760A1 (ja)
JP (1) JP2010039721A (ja)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996010795A1 (en) * 1994-10-03 1996-04-11 Helfgott & Karas, P.C. A database accessing system
US5649221A (en) * 1995-09-14 1997-07-15 Crawford; H. Vance Reverse electronic dictionary using synonyms to expand search capabilities
JP3952216B2 (ja) * 1995-11-27 2007-08-01 富士通株式会社 翻訳装置及び辞書検索装置
US5956740A (en) * 1996-10-23 1999-09-21 Iti, Inc. Document searching system for multilingual documents
US6144958A (en) * 1998-07-15 2000-11-07 Amazon.Com, Inc. System and method for correcting spelling errors in search queries
US6466901B1 (en) * 1998-11-30 2002-10-15 Apple Computer, Inc. Multi-language document search and retrieval system
US20060156233A1 (en) * 2005-01-13 2006-07-13 Nokia Corporation Predictive text input
US7412441B2 (en) * 2005-05-31 2008-08-12 Microsoft Corporation Predictive phonetic data search
US20070192318A1 (en) * 2005-09-14 2007-08-16 Jorey Ramer Creation of a mobile search suggestion dictionary

Also Published As

Publication number Publication date
US20100030760A1 (en) 2010-02-04

Similar Documents

Publication Publication Date Title
US8942973B2 (en) Content page URL translation
US7475063B2 (en) Augmenting queries with synonyms selected using language statistics
US8762358B2 (en) Query language determination using query terms and interface language
US8606826B2 (en) Augmenting queries with synonyms from synonyms map
KR100815215B1 (ko) 웹사이트 통합 검색 장치 및 방법
US7835903B2 (en) Simplifying query terms with transliteration
TW200817941A (en) Multilingual data querying
US10713418B2 (en) Auto completing domain names comprising multiple languages
US20020152258A1 (en) Method and system of intelligent information processing in a network
TW200821867A (en) Program, character input editing method, and apparatus
US20170331786A1 (en) Generating domain names comprising multiple languages
RU2682002C2 (ru) Способ и система для сопоставления исходного лексического элемента первого языка с целевым лексическим элементом второго языка
Leidner An evaluation dataset for the toponym resolution task
JP2006164292A (ja) ネットワークにおけるインテリジェントな情報処理方法およびシステム
RU2595531C2 (ru) Способ и система генерирования определения слова на основе множественных источников
JP2001249884A (ja) インターネットユーザが所望の言語でドメイン名を使用するためのシステム
JP3467160B2 (ja) 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法
JP5186165B2 (ja) 組織名抽出装置、方法及びプログラム
JP2019053262A (ja) 学習システム
JP6114090B2 (ja) 機械翻訳装置、機械翻訳方法およびプログラム
JP2010039721A (ja) データ入力装置、方法、及びプログラム
JP3467159B2 (ja) 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法
JP2015095180A (ja) 絞り込み検索のためのクエリ語の選択候補を明示するコンテンツ検索プログラム、装置及び方法
RU2767965C2 (ru) Способ и система для перевода исходной фразы на первом языке целевой фразой на втором языке
JP2018055620A (ja) 情報処理装置及びプログラム