JPWO2014087704A1 - 入力支援装置、入力支援方法、及び入力支援プログラム - Google Patents

入力支援装置、入力支援方法、及び入力支援プログラム Download PDF

Info

Publication number
JPWO2014087704A1
JPWO2014087704A1 JP2014526291A JP2014526291A JPWO2014087704A1 JP WO2014087704 A1 JPWO2014087704 A1 JP WO2014087704A1 JP 2014526291 A JP2014526291 A JP 2014526291A JP 2014526291 A JP2014526291 A JP 2014526291A JP WO2014087704 A1 JPWO2014087704 A1 JP WO2014087704A1
Authority
JP
Japan
Prior art keywords
input
phrase
language
word
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014526291A
Other languages
English (en)
Other versions
JP5897711B2 (ja
Inventor
祐太 林部
祐太 林部
正人 萩原
正人 萩原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Inc filed Critical Rakuten Inc
Application granted granted Critical
Publication of JP5897711B2 publication Critical patent/JP5897711B2/ja
Publication of JPWO2014087704A1 publication Critical patent/JPWO2014087704A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

一実施形態に係る入力支援装置は、受付部、検索部、及び出力部を備える。受付部は、ローマ字による入力文字列を受け付ける。検索部は、アルファベットで表記される第1の言語の語句と、該第1の言語の語句に対応する第2の言語の語句のローマ字表記と、をそれらの対応関係が特定できる態様で記憶する記憶部から、前記入力文字列を含む前記第1の言語の語句を検索する第1の処理と、該記憶部から、該入力文字列を含む前記ローマ字表記に対応する前記第1の言語の語句を検索する第2の処理とを実行する。出力部は、第1の処理の結果と第2の処理の結果とを入力候補として出力する。

Description

本発明の一側面は、入力支援装置、入力支援方法、及び入力支援プログラムに関する。
従来から、他言語(例えば日本人にとっての英語)の入力を支援するシステムが知られている。例えば下記特許文献1に記載の文字入力装置では、コピーされた文字列が英語のスペリングとして正しくない場合に、変換バッファにコピーされた文字列がローマ字読みされ、かな変換され、かなバッファに格納される。かな変換の結果が日本語の意味を持つ場合には、その意味に対応する英語が検索され、その結果が格納される。
特開平11−7448号公報
しかしながら、上記特許文献1に記載の装置を使う場合には、ユーザはこの装置に対して、自分が入力したアルファベットの文字列を英単語として認識させるのか、それともローマ字入力による日本語の単語として認識させるのかをユーザ自身が指定する必要がある。そこで、ユーザに入力文字列の言語を指定させることなく、目的とする言語の語句を入力することが可能な仕組みが要請されている。
本発明の一側面に係る入力支援装置は、ローマ字による入力文字列を受け付ける受付部と、アルファベットで表記される第1の言語の語句と、該第1の言語の語句に対応する第2の言語の語句のローマ字表記と、をそれらの対応関係が特定できる態様で記憶する記憶部から、前記入力文字列を含む前記第1の言語の語句を検索する第1の処理と、該記憶部から、該入力文字列を含む前記ローマ字表記に対応する前記第1の言語の語句を検索する第2の処理とを実行する検索部と、第1の処理の結果と第2の処理の結果とを入力候補として出力する出力部とを備える。
本発明の一側面に係る入力支援方法は、入力支援装置により実行される入力支援方法であって、ローマ字による入力文字列を受け付ける受付ステップと、アルファベットで表記される第1の言語の語句と、該第1の言語の語句に対応する第2の言語の語句のローマ字表記と、をそれらの対応関係が特定できる態様で記憶する記憶部から、前記入力文字列を含む前記第1の言語の語句を検索する第1の処理と、該記憶部から、該入力文字列を含む前記ローマ字表記に対応する前記第1の言語の語句を検索する第2の処理とを実行する検索ステップと、第1の処理の結果と第2の処理の結果とを入力候補として出力する出力ステップとを含む。
本発明の一側面に係る入力支援プログラムは、ローマ字による入力文字列を受け付ける受付部と、アルファベットで表記される第1の言語の語句と、該第1の言語の語句に対応する第2の言語の語句のローマ字表記と、をそれらの対応関係が特定できる態様で記憶する記憶部から、前記入力文字列を含む前記第1の言語の語句を検索する第1の処理と、該記憶部から、該入力文字列を含む前記ローマ字表記に対応する前記第1の言語の語句を検索する第2の処理とを実行する検索部と、第1の処理の結果と第2の処理の結果とを入力候補として出力する出力部とをコンピュータに実行させる。
このような側面によれば、翻訳することなく入力文字列そのものから語句を検索する処理と、その入力文字列に基づく翻訳の処理とが実行され、これらの処理から得られた語句(第1の言語の語句)がまとめて入力候補として出力される。このように、一つの入力文字列に対して複数系統の処理が行われて双方の検索結果が出力されるので、ユーザは、入力文字列の言語を自分で指定することなく、目的とする言語の語句を入力することができる。
別の側面に係る入力支援装置では、入力文字列が複数の単語を含み、検索部が、複数の単語のそれぞれについて第1の処理及び第2の処理を実行し、出力部が、複数の単語のすべてにおいて検索された共通の第1の言語の語句を入力候補として出力してもよい。入力文字列を構成するすべての単語を用いて入力候補を検索することで、ユーザが入力しようとしている語句を確度高く提示することができる。
さらに別の側面に係る入力支援装置では、ユーザにより選択された共通の第1の言語の語句が入力文字列の全体と置換されることで、該選択された語句の入力が確定してもよい。この置換により、ユーザは直ぐに次の編集作業に取り掛かることができる。
さらに別の側面に係る入力支援装置では、入力文字列が複数の単語を含み、出力部が、複数の単語のうち一部の単語において検索された第1の言語の語句を入力候補として出力してもよい。一部の単語のみを用いて入力候補を検索することで、抽出される第1の言語の語句が多すぎたり少なすぎたりする状況を回避することが可能になる。
さらに別の側面に係る入力支援装置では、一部の単語が、入力文字列において最後に位置する単語であってもよい。
さらに別の側面に係る入力支援装置では、ユーザにより選択された第1の言語の語句が、複数の単語のうち該選択された語句の検索条件として用いられた単語のみと置換されることで、該選択された語句の入力が確定してもよい。このように置換することで、ユーザはどの単語が置き換えられたかを知ることができる。
さらに別の側面に係る入力支援装置では、入力候補が、未確定部分を示す情報が付加された第1の言語の語句を含み、未確定部分を有する語句の入力が確定した場合に、該未確定部分にフォーカスが設定されてもよい。このようにフォーカスの位置を設定することで、ユーザは、カーソルを移動させる等の操作をすることなく直ぐに次の編集作業に取り掛かることができる。
さらに別の側面に係る入力支援装置では、入力候補が、未確定部分を示す情報が付加された第1の言語の語句を含み、未確定部分を有する語句の入力が確定した場合に、該未確定部分に挿入され得る語句を取得し、取得した語句を更なる入力候補として出力する追加処理部を更に備えてもよい。未確定部分を有する語句の入力が確定すると直ぐに、その未確定部分に挿入され得る語句の候補が提示されるので、ユーザはより簡単に文又は文章を作成することができる。
さらに別の側面に係る入力支援装置では、追加処理部が、語句の未確定部分と該未確定部分に挿入可能な語句との対応が記憶された所定の記憶部を参照することで、未確定部分に挿入され得る語句を取得してもよい。
さらに別の側面に係る入力支援装置では、追加処理部が、第1の言語及び第2の言語のうち少なくとも一方の言語のコーパスが記憶された所定の記憶部を参照することで、未確定部分に挿入され得る語句を取得してもよい。
さらに別の側面に係る入力支援装置では、更なる入力候補がコーパス内での出現回数に従った順番で表示されてもよい。このように表示順を設定することで、選択される蓋然性が高い語句をそうでない語句よりも優先してユーザに提示することが可能になる。
さらに別の側面に係る入力支援装置では、追加処理部が、入力文字列より前に位置する確定済の文字列を解析することで、未確定部分に挿入され得る語句を推定してもよい。未確定部分に挿入され得る語句を、既に入力されている文または文章に基づいて推定することで、その文または文章を入力しているユーザがこれから入力しそうな語句を先行して提示することができる。
さらに別の側面に係る入力支援装置では、更なる入力候補において、確定済の文字列の解析により推定された語句が、該解析により推定されなかった語句よりも優先して表示されてもよい。このように表示順を設定することで、選択される蓋然性が高い語句をそうでない語句よりも優先してユーザに提示することが可能になる。
さらに別の側面に係る入力支援装置では、入力候補に含まれる第1の言語の語句に未確定部分が複数存在する場合に、追加処理部が、各未確定部分について更なる入力候補を取得すると共に、第1の未確定部分に挿入され得る語句と第2の未確定部分に挿入され得る語句との自然な組合せを示す組合せ情報を取得し、該組合せ情報を各未確定部分の更なる入力候補と共に出力し、第1及び第2の未確定部分のうちの一方の未確定部分におけるユーザ操作に応じて、他方の未確定部分に挿入され得る語句が組合せ情報に基づいて提示されてもよい。このように語句同士の自然な組合せを提示することで、ユーザは自然な文または文章を簡単に作成することが可能になる。
さらに別の側面に係る入力支援装置では、入力候補が単語の列とフレーズの列とに分かれて表示されてもよい。入力候補を少なくとも二つに分けた上で表示することで、ユーザは所望の語句を容易に見つけて選択することができる。
さらに別の側面に係る入力支援装置では、フレーズが語義に従って更に複数の列に分かれて表示されてもよい。フレーズを語義毎に分けた上で提示することで、ユーザは所望の語句を容易に見つけて選択することができる。
さらに別の側面に係る入力支援装置では、入力候補が語義に従って複数の列に分かれて表示されてもよい。入力候補の語句を語義毎に分けた上で提示することで、ユーザは所望の語句を容易に見つけて選択することができる。
さらに別の側面に係る入力支援装置では、各列が独立してスクロールするように入力候補が表示されてもよい。このようなスクロール方法により、ユーザは他の列の語句をそのまま見続けながら特定の一つの列内の語句を見渡すことができる。
本発明の一側面によれば、ユーザは、入力文字列の言語を指定することなく、目的とする言語の語句を入力することができる。
実施形態に係る入力支援の概念を示す図である。 第1実施形態に係る入力支援システムの機能構成を示すブロック図である。 入力支援サーバのハードウェア構成を示す図である。 第1実施形態に係る入力支援システムの動作を示すシーケンス図である。 エディタの一連の動作を説明する図である。 エディタの一連の動作を説明する図である。 エディタの一連の動作を説明する図である。 エディタの一連の動作を説明する図である。 エディタの一連の動作を説明する図である。 エディタの一連の動作を説明する図である。 エディタの一連の動作を説明する図である。 エディタの一連の動作を説明する図である。 エディタの一連の動作を説明する図である。 第1実施形態に係る入力支援プログラムの構成を示す図である。 第2実施形態に係る入力支援システムの機能構成を示すブロック図である。 第2実施形態に係る入力支援システムの動作を示すシーケンス図である。 エディタ上で更なる入力候補が表示された状態を示す図である。 第2実施形態に係る入力支援プログラムの構成を示す図である。 変形例に係る入力支援システム(ユーザ端末)の機能構成を示すブロック図である。
以下、添付図面を参照しながら本発明の実施形態を詳細に説明する。なお、図面の説明において同一又は同等の要素には同一の符号を付し、重複する説明を省略する。
本明細書における用語「アルファベット」とは、一定の順序に並べられた西欧語の文字の総称を意味する。また、用語「ローマ字」とは、ある言語をラテン語で表記する際に用いる文字を意味する。本明細書では、ある言語をローマ字を用いて表記することを「ローマ字表記」という。
(第1実施形態)
図1〜3を用いて、第1実施形態に係る入力支援システム(以下では単に「システム」ともいう)1の機能及び構成を説明する。このシステム1は英文入力を支援するコンピュータシステムである。このシステム1を用いることで、英語に不慣れなユーザも簡単に英文を作成することが期待できる。
図1に示すように、ユーザは英文を入力する際に英語の文字列を入力してもよいし、ローマ字入力による日本語の文字列を入力してもよい(ステップS1)。言い換えると、ユーザは自分がこれから入力しようとする文字列の言語をシステム1に予め認識させる必要がない。例えば、「e−mail the address of」という英語フレーズを最終的に得たい場合に、ユーザは「okuru」と日本語を入力してもよいし、「e−mail」と英語を入力してもよい。
文字列が入力されると、入力支援システム1はその文字列を用いて二種類の処理を実行する。一つは、入力文字列を英語とみなして、その文字列を含む単語又はフレーズをデータベースから検索する処理である(ステップS2)。もう一つは、入力文字列を日本語とみなして、その文字列に関連する英語翻訳をデータベースから取得する処理である(ステップS3)。そして、入力支援システム1はこれら二つの処理で得られた結果を入力候補として一度にユーザに提示する(ステップS4)。二つのステップS2,S3ではいずれも英語の語句が得られるので、入力候補としてユーザに提示される語句はすべて英語である。なお、本明細書における語句とは、単語及びフレーズの一方又は双方のことをいう。
図2に示すように、入力支援システム1はユーザ端末10、入力支援サーバ(入力支援装置)20、及び言語データベース(記憶部)30を備えている。ユーザ端末10と入力支援サーバ20とはインターネットや専用線などの通信ネットワークを介して双方向に通信することが可能である。また、入力支援サーバ20は同様の通信ネットワークを介して言語データベース30にアクセスすることができる。
ユーザ端末10は、英文を作成しようとするユーザが使用するコンピュータである。ユーザ端末10の種類は限定されず、例えば据置型又は携帯型のパーソナルコンピュータでもよいし、高機能携帯電話機(スマートフォン)や携帯電話機、携帯情報端末(PDA)などの携帯端末でもよい。入力支援システム1内に存在するユーザ端末10の台数も限定されない。ユーザ端末10は文字の入力及び表示を実行するエディタ(editor)11を備えている。本実施形態ではエディタ11は入力支援サーバ20と通信する機能を有するが、エディタ11の具体的な実装方法は何ら限定されない。例えば、エディタ11はウェブブラウザ(Web Browser)上に実装されてもよいし、特定のワードプロセッサ・アプリケーション・プログラム内に組み込まれてもよい。
入力支援サーバ20は、ローマ字による日本語が入力されるか、または英単語が入力されると、その入力文字列に基づいて入力候補を検索してユーザに提示するコンピュータである。入力支援サーバ20はこのような処理を実行するために言語データベース30を参照する。
言語データベース30は、英語と日本語との対訳を記憶する装置である。英語の語句と、ローマ字表記された日本語の語句との対応関係が特定できる限り、言語データベース30及びこの中に格納されるデータの具体的な構成(態様)は何ら限定されない。
例えば、既存の辞書データベース又はコーパスを言語データベース30として用いてもよい。ただし、入力文字列はローマ字で表現されるので、言語データベース30内の日本語は少なくともローマ字で表記されている必要がある。もちろん、言語データベース30中における日本語については、ローマ字表記と共に、平仮名、片仮名、又は漢字による表記が存在していてもよい。言語データベース30は、英語と、平仮名、片仮名、又は漢字により表記された日本語(仮名等で表記された日本語)との対訳データベースと、仮名等で表記された日本語とローマ字表記された日本語との対応を示す変換テーブルとから成っていてもよい。本実施形態では、エディタ11が入力候補の英語のフレーズを日本語の語義毎に分けて表示するので、各フレーズには日本語の語義に関する情報(例えば格フレーム辞書の情報)が予め付加されている。
また、言語データベース30は対訳データだけでなく、英語の語句のリストを示すデータを含んでいてもよい。図1で示すように入力支援システム1は二種類の検索を実行するので、参照するデータベース又は記憶領域を検索処理毎に変えてもよい。例えば、入力支援システム1は、英語からの検索を実行する場合には英語表現のみが登録されているデータベースを用い、日本語からの検索を実行する場合には二言語間の対訳が登録されているデータベースを用いてもよい。
次に、入力支援サーバ20の機能及び構成を具体的に説明する。入力支援サーバ20のハードウェア構成を図3に示す。この図に示すように、入力支援サーバ20は、オペレーティングシステムやアプリケーション・プログラムなどを実行するCPU201と、ROM及びRAMで構成される主記憶部202と、ハードディスクなどで構成される補助記憶部203と、ネットワークカードなどで構成される通信制御部204と、キーボードやマウスなどの入力装置205と、ディスプレイなどの出力装置206とを備えている。
後述する入力支援サーバ20の各機能的構成要素は、CPU201又は主記憶部202の上に所定のソフトウェアを読み込ませ、CPU201の制御の下で通信制御部204や入力装置205、出力装置206などを動作させ、主記憶部202又は補助記憶部203におけるデータの読み出し及び書き込みを行うことで実現される。処理に必要なデータやデータベースは主記憶部202又は補助記憶部203内に格納される。なお、図3では入力支援サーバ20が1台のコンピュータで構成されているように示しているが、入力支援サーバ20の機能を複数台のコンピュータに分散させてもよい。
図2に示すように、入力支援サーバ20は機能的構成要素として受付部21、検索部22、及び提供部(出力部)23を備えている。
受付部21は、アルファベットによる入力文字列を受け付ける機能要素である。ユーザ端末10のエディタ11は入力された文字列を入力支援サーバ20に送信し、受付部21はその入力文字列を受信して検索部22にその文字列を出力する。
エディタ11が入力文字列を入力支援サーバ20に送信するタイミングは限定されない。例えば、エディタ11は所定の長さ以上の文字列(例えば2又は3文字以上の文字列)の入力を受け付けた時に初めて入力支援サーバ20にその文字列を送信してもよい。受付部21が受信する入力文字列の長さの下限を設定することで、単語又はフレーズの検索の負荷を軽減したり、ユーザ端末10上に表示される入力候補の個数を抑えてエディタ11をより使い易くしたりすることができる。あるいは、エディタ11は区切り文字(スペース)が入力された時に入力文字列を送信してもよい。一つの単語を入力文字列とすることで検索の負荷をさらに軽減したり入力候補の個数をさらに抑えたりすることができる。
あるいは、エディタ11はキー入力が所定の時間(例えば2秒など)途絶えた時に入力文字列を送信してもよい。さらに別の手法として、エディタ11はユーザが検索ボタンや送信ボタンなどを押したことに応じて入力文字列を送信してもよい。これら二つの手法によれば、スペースで区切られた複数の単語から成る入力文字列を入力支援サーバ20に送信することができる。
受付部21又はエディタ11は、区切り文字が無い入力文字列から複数の単語を自動的に特定してもよい。例えば、受付部21又はエディタ11は、「nimotsuwookuru」(英語の「send a package」に相当)という文字列を受け付けた場合に、この文字列をローマ字表記の日本語とみなして形態素解析することで、「nimotsu」「wo」「okuru」という3単語を特定し、これらの単語を検索部22に出力してもよい。このような単語分割において、受付部21又はエディタ11は、検索での必要性が低い特定の語(例えば助詞)を削除し、残った単語(例えば名詞や動詞など)のみを検索部22に出力してもよい。例えば、受付部21又はエディタ11は日本語の助詞である「wo」を削除して、名詞「nimotsu」及び動詞「okuru」のみを検索部22に出力してもよい。
検索部22は、入力文字列に対応する入力候補を言語データベース30から取得する機能要素である。検索部22は図1に示すような二通りの手法で英語の語句を取得する。
まず、検索部22は入力文字列を含む英語(第1の言語)の語句を第1の検索結果として言語データベース30から取得する。この第1の処理では、検索部22は入力された言語が英語であるとみなして検索を行う。したがって、ローマ字表記の日本語が入力された場合には、検索部22は第1の処理(英語からの検索)では英語の語句を取得することができない。もちろん、ユーザが日本語を入力したつもりでもその文字列を含む英語がたまたま存在すれば、検索部22はこの第1の処理で一以上の英語の語句を取得する。
例えば、入力文字列が「forg」であれば、検索部22は「forget」「forgot」「forgive」などの単語と、「get forgotten」「get forgetful」「forgive A for B」などのフレーズとを取得する。
次に、検索部22は、入力文字列を含む日本語(第2の言語)の語句に対応する英語(第1の言語)の語句を第2の検索結果として取得する。この第2の処理では、検索部22は入力された言語が日本語であるとみなして検索を行うので、英語が入力された場合には、検索部22はこの第2の処理(日本語からの検索)では英語の語句を取得することができない。もちろん、ユーザが英語を入力したつもりでもその文字列で示される日本語がたまたま存在すれば、検索部22はこの第2の処理で一以上の英語の語句を取得する。
例えば、入力文字列が「okuru」であれば、検索部22はこの日本語に相当し得る「send」「give」「lead」などの単語と、この日本語に相当し得る「send e−mail to」「e−mail the address of」「lead a gracious life」などのフレーズとを取得する。一つの日本語の単語が複数の英語の単語に対応することがあるので、この例のように一つの日本語の単語から様々な意味の英語の語句が抽出される場合がある。
なお、入力文字列から語句を検索する方法として前方一致、完全一致、後方一致、部分一致などの様々な手法がある。また、文字そのものの同一性を見るのではなく、入力された単語の関連語句をシソーラス(関連語のデータベース)から検索する手法もある。例えば、検索部22は日本語「nimotsu」の関連語「kamotsu(貨物)」と日本語「okuru」の関連語「soufu(送付)」とをシソーラスから抽出し、これら二つの関連語を用いて言語データベース30から英語の語句を取得してもよい。このように様々な検索手法があるが、検索部22は任意の一以上の手法を用いて語句を検索してよい。
検索部22はこのような二種類の処理により得た第1及び第2の検索結果を提供部23に出力する。この際には、検索部22は、取得した英語の語句の一つ一つに対して、その語句が英語からの検索(第1の処理)により抽出されたのかそれとも日本語からの検索(第2の処理)により抽出されたのかを示すフラグを付加する。なお、当然ながら、ユーザのタイプミスなどにより第1及び第2の検索結果が共に空(NULL)であることも有り得る。
入力文字列が複数の単語を含む場合には、検索部22は各単語について上記二種類の検索を行うことで、入力されたすべての単語において抽出された共通のフレーズを最終的に取得してもよい(共通フレーズの検索)。入力文字列を構成するすべての単語を用いて入力候補を検索することで、ユーザが入力しようとしている語句を確度高く提示することができる。共通フレーズの検索において、入力文字列は英語のみから成っていてもよいし、日本語のみから成っていてもよいし、日本語及び英語の混合であってもよい。例えば、入力文字列が二つの英語「send」及び「package」を含む場合、二つの日本語「okuru」(英語の「send」に相当)及び「nimotsu」(英語の「package」に相当)から成る場合、そして日本語「nimotsu」及び英語「send」から成る場合のいずれにおいても、検索部22は「send a package」(日本語で「荷物を送る(nimotsu wo okuru)」という意味)というフレーズを検索する。
入力文字列が複数の単語を含む場合の別の処理方法として、検索部22はそのうちの一部単語についてのみ上記二種類の検索を行ってもよい(一部の単語を用いた検索)。例えば、検索部22は入力文字列において最後に位置する単語についてのみ上記二種類の検索を行ってもよい。一部の単語のみを用いて入力候補を検索することで、抽出される英語の語句が多すぎたり少なすぎたりする状況を回避することが可能になる。
さらに別の方法として、検索部22は共通フレーズの検索と、一部の単語を用いた検索との双方を実行して、これら二種類の検索結果を取得してもよい。この場合には、検索部22は入力候補として取得した語句のそれぞれに、共通フレーズの検索で得られた語句か、それとも一部の単語を用いた検索により取得した語句かを区別するためのフラグを付加する。
提供部23は、検索部22による検索結果を入力候補としてユーザ端末10に送信する機能要素である。上述したように、検索結果に含まれる英語の語句のそれぞれには、その語句がどのような検索により抽出されたかを示すフラグが関連付けられている。ユーザ端末10ではエディタ11がその入力候補を受信して画面上に表示する。
次に、図4を用いて、入力支援システム1の動作を説明するとともに本実施形態に係る入力支援方法について説明する。
まず、ユーザ端末10でエディタ11がアルファベットで入力された所定の長さ以上の文字列を取得し(ステップS11)、その入力文字列を入力支援サーバ20に送信する(ステップS12)。
入力支援サーバ20では、受付部21がその入力文字列を受信し(ステップS12、受付ステップ)、次に検索部22がその文字列に基づいて入力候補を検索する。具体的には、検索部22は入力文字列を含む英語の語句を検索すると共に(ステップS13、検索ステップ)、その入力文字列を含む日本語の語句に対応する英語の語句を検索する(ステップS14、検索ステップ)。なお、検索部22は日本語からの検索(ステップS14)を実行した後に英語からの検索(ステップS13)を実行してもよい。最後に、提供部23がこれら二種類の検索の結果を入力候補としてユーザ端末10に送信する(ステップS15、出力ステップ)。
ユーザ端末10ではエディタ11がその入力候補を受信して画面上に表示する(ステップS16、出力ステップ)。ユーザは表示された入力候補から一つを選択でき、選択された英語の語句が確定語句としてエディタ11上に表示される。
次に、図5〜13を用いて、エディタ11上で入力候補がどのように表示されるかを説明する。
例えば、図5に示すように、ユーザがローマ字表記による日本語「okuru」を入力したとする。この場合には、エディタ11が入力文字列「okuru」を入力支援サーバ20に送信し、検索部22がこの文字列に基づいて二種類の検索を実行する。「okuru」を含む英単語は存在しないので、検索部22は英語からの検索では英語の語句を取得することができない。しかし、日本語の「okuru」は、英語の「send」「give」「present」「lead」などのいくつかの単語に相当する意味を持っているので、検索部22は日本語からの検索を実行することで英語の語句を取得する。したがって、提供部23は一又は複数の英語の語句を入力候補としてユーザ端末10に送信し、エディタ11がその入力候補を画面上に表示する。
ユーザ端末10で表示される入力候補の例を図6に示す。この図では、エディタ11は入力候補を候補欄Cに一覧表示している。検索された英語の語句Eのそれぞれには日本語の翻訳Jが併記される。候補欄の左上にある「単語(日本語から)」というタイトルは、今回の語句が日本語からの検索により得られたものであることを示している。エディタ11は取得した語句に関連付けられているフラグを参照することでそのタイトルを決めることができる。
この図では、エディタ11は入力候補を、最左列に表示される単語のリストL1と、それ以外の列に表示されるフレーズのリストとに分けて表示する。更に、エディタ11はフレーズを日本語の「okuru」の意味毎にそれぞれの列L2〜L4に分ける。図6の例では候補欄Cの高さと比較して英単語の個数が多いので列L1にはスクロールバー(scroll bar)が表示されているが、エディタ11はこのスクロールバーを各列の単語数又はフレーズ数に応じて各列に設定する。したがって、ユーザは他の列の語句をそのまま見続けながら特定の一つの列内の語句を見渡すことができる。英語フレーズを日本語の意味毎に分けた際のグループ数が候補欄Cの幅と比較して多いようであれば、エディタ11はフレーズの列を見渡すための横方向のスクロールバーを設定する。
このように、入力候補を単語とフレーズに分けたり、あるいはフレーズを語義毎に分けたりした上でその入力候補を表示することで、ユーザは所望の語句を容易に見つけて選択することができる。なお、エディタ11は取得した語句を単語とフレーズとに分けることなく、それらの語句を単に語義のみに分けた上で表示してもよい。この場合にも、ユーザは所望の語句を容易に見つけて選択することができる。
図7に示すようにユーザが入力候補から単語「send」を選択すると、図8に示すように、エディタ11はその単語を入力文字列「okuru」と入れ替えて表示する。これにより、「send」の入力が確定する。一方、図9に示すようにユーザが入力候補からフレーズ「e−mail the address of」を選択すると、図10に示すように、エディタ11はそのフレーズを入力文字列「okuru」と入れ替えて表示する。これにより、「e−mail the address of」の入力が確定する。
なお、図6,7に示すように、被選択状態の単語の別の語義をボックスBで示してもよい。
別の例において、図11に示すように、ユーザがアルファベットで英語「e−mail」と入力したとする。この場合には、エディタ11が入力文字列「e−mail」を入力支援サーバ20に送信し、検索部22がこの文字列に基づいて二種類の検索を実行する。「e−mail」とローマ字表記される日本語は存在しないので、検索部22は日本語からの検索では英語の語句を取得することができない。しかし、当然ながら、検索部22は英語からの検索を実行することでこの「e−mail」を含む英語の語句を取得することができる。なお、仮に入力文字列が「e−mai」であった場合でも同様の結果が得られる。したがって、提供部23は一又は複数の英語の語句を入力候補としてユーザ端末10に送信し、エディタ11がその入力候補を画面上に表示する。
この場合にユーザ端末10で表示される入力候補の例を図12に示す。この例でも、エディタ11は候補欄C中において英語の語句のそれぞれに日本語の翻訳を併記する。図12では、複数の語義を有する「e−mail」にフォーカスが当たっており、このフォーカス設定を受けて他の語義の説明がボックスBで表示されている。もっとも、エディタ11にこのボックスBの機能を実装するか否かは、任意に定めてよい。ユーザが入力候補から一の単語又はフレーズを選択すると、エディタ11は選択された語句を入力文字列「e−mail」と入れ替えて表示し、これにより入力が確定する。
図13は、入力文字列が複数の単語を含む場合の入力候補の一例を示している。列L1には、入力文字列中の最後の日本語「okuru」に相当する英単語のリストが表示されている。列L2には、入力文字列に含まれる二つの日本語「nimotsu」及び「okuru」の双方の翻訳を含む英語フレーズのリストが表示されている。列L3,L4には、入力文字列中の最後の日本語「okuru」の翻訳を含む英語フレーズのリストが表示されている。エディタ11は、各フレーズに関連付けられているフラグを参照することで、そのフレーズをどの列に表示させるべきかを判定することができる。
図13の例では、ユーザが列L1から一つの英単語を選ぶか、あるいは列L3又はL4から一つのフレーズを選んだ場合には、エディタ11は入力文字列の最後の単語「okuru」のみを選択された語句と置き換えて入力を確定させる。言い換えれば、エディタ11は、入力支援サーバ20における英語の語句の検索条件として用いられた単語のみを、ユーザにより指定された語句と置き換える。この場合には、ユーザはどの単語が置き換えられたかを知ることができる。
これに対して、ユーザが列L2からフレーズを選んだ場合には、エディタ11は入力文字列に含まれる二つの日本語「nimotsu」及び「okuru」を選択されたフレーズと置き換えることで入力を確定させる。したがって、ユーザは直ぐに次の編集作業に取り掛かることができる。エディタ11は、入力候補内の各語句のフラグを参照することで入力文字列の置換部分を判定することができる。
なお、図13では入力文字列が二つの単語を含んでいるが、上述したように、入力文字列が3以上の単語を含む場合もある。例えば、入力文字列が日本語「okuru」「nimotsu」「koukuubin(英語の「airmail」に相当)」という3単語を含んでもよい。
次に、図14を用いて、入力支援システム1を実現するための入力支援プログラムPを説明する。入力支援プログラムPは、ユーザ端末10でエディタ11を機能させるためのクライアント・プログラムP1と、コンピュータを入力支援サーバ20として機能させるためのサーバ・プログラムP2とを備えている。
クライアント・プログラムP1はエディタ・モジュールP11を備えており、このモジュールによりエディタ11の機能が実現される。
サーバ・プログラムP2は、メインモジュールP20、受付モジュールP21、検索モジュールP22、及び提供モジュールP23を備えている。メインモジュールP20は、入力支援サーバ20の機能を統括的に制御する部分である。受付モジュールP21、検索モジュールP22、及び提供モジュールP23を実行することにより実現される機能はそれぞれ、上記の受付部21、検索部22、及び提供部23の機能と同様である。
クライアント・プログラムP1及びサーバ・プログラムP2はそれぞれ、例えば、CD−ROMやDVD−ROM、半導体メモリ等の有形の記録媒体に固定的に記録された上で提供される。また、各プログラムP1,P2は、搬送波に重畳されたデータ信号として通信ネットワークを介して提供されてもよい。
以上説明したように、本実施形態によれば、翻訳することなく入力文字列そのものから語句を検索する処理(英語からの検索)と、その入力文字列に基づく翻訳の処理(日本語からの検索)とが実行され、これら二種類の処理から得られた英語の語句がまとめて入力候補として出力される。通常、ユーザは入力モードを切り替えるなどの操作を行った上で文または文章を入力する必要がある。しかし本実施形態では、一つの入力文字列に対して二系統の処理が行われて双方の検索結果が出力されるので、ユーザは、入力文字列の言語を自分で指定することなく(例えば入力モードを切り替えることなく)、目的とする言語の語句を入力することができる。
(第2実施形態)
次に、第2実施形態に係る入力支援システム2を説明する。このシステム2は、ユーザが入力候補から一の語句を選択して入力を確定させた際にその語句のスロット(slot)に当てはまる語句を更に提示するという点で、第1実施形態(入力支援システム1)と異なる。このために、入力支援システム2は入力支援サーバ20Aを備えている。
本明細書における「スロット」とは、入力候補から選択された一つの語句に設定された未確定部分であり、この未確定部分には目的語や補語などが挿入され得る。このスロットは単語の前後、あるいはフレーズの前、後ろ、又は途中に設定される。例えば、「give someone a birthday present」というフレーズにおける「someone」は、フレーズ中に設定されたスロットである。別の例として、「e−mail the address of」というフレーズの後に続く部分もスロットとして設定され得る。あるいは「provide A with B」というフレーズにおける「A」「B」もスロットの一例である。このようなスロットに当てはまる語句を更に提示すれば、文章入力が更に簡略化されることが期待できる。
図15に示すように、本実施形態の入力支援サーバ20Aは上記のような追加機能を実現するために、第1実施形態における三つの機能的構成要素に加えてスロット処理部(追加処理部)24を備えている。また、エディタ11は、スロットに当てはまる可能性がある語句を得るための機能を更に有する。また、入力候補としてユーザ端末10に表示され得る英語の語句のうちの少なくとも一部には、スロットの位置を示す情報が予め関連付けられている。
エディタ11は、ユーザが入力候補の中から一の語句を選択すると、その語句の入力を確定すると共に、その語句の情報を入力支援サーバ20Aに送信する。また、エディタ11はスロットの位置にフォーカスを設定する。スロットが複数存在すれば、エディタ11はそのうちの一つのスロット(例えば、先頭のスロット)にフォーカスを設定する。その後、エディタ11は、確定語句の情報の送信に応じて入力支援サーバ20から送られてきた更なる入力候補を受信し、その入力候補を画面上に表示する。この更なる入力候補は、スロットに挿入され得る語句のことである。
スロット処理部24は、スロットを有する英語の語句の入力が確定した場合に、そのスロットに挿入される英語の語句を取得し、取得した語句を更なる入力候補として出力する機能要素である。スロット処理部24は、エディタ11から受信した確定語句の情報に基づいて、スロットに挿入される可能性がある語句を取得し、その処理結果をユーザ端末10に送信する。
スロットに当てはまる語句を検索する方法は限定されない。第1の手法として、スロットを有する英語の語句と、そのスロットに挿入され得る語句とが関連付けられて言語データベース30に格納されていることを前提とした上で、スロット処理部24は確定語句のスロットに挿入され得る語句を言語データベース30から抽出してもよい。
あるいは、第2の手法として、スロット処理部24は従来の自然言語処理の技術を用いることで、確定語句のスロットに挿入され得る語句を判断してもよい。例えば、スロット処理部24は、英文に対してnグラム(n−gram)の手法を用いることで更なる入力候補を得るとともに、格フレーム辞書の情報を含む対訳データを参照することで更なる入力候補を得てもよい。このように、スロット処理部24は、第1実施形態で説明した入力候補(最初の入力候補)の取得と同様に、英語からの検索と日本語からの検索との双方を用いて更なる入力候補を得ることができる。この場合には、スロット処理部24は、得られた語句がその二種類の検索処理のどちらで得られたかを示すフラグをその語句に関連付ける。なお、この処理の際に用いる自然言語処理はnグラム及び格フレーム辞書に限定されず、任意の手法を採用し得る。
あるいは、第3の手法として、スロット処理部24は言語データベース30内の英文コーパスを検索することで更なる入力候補を抽出してもよい。具体的には、スロット処理部24は確定語句を含む文を抽出し、抽出された一以上の文を解析して、スロットの位置に実際に挿入されている語句をその出現回数と共に特定する。そして、スロット処理部24は特定した一以上の語句を出現回数の降順にソートすることでリストを作成し、このリストを更なる入力候補として設定する。例えば、スロット処理部24は確定語句「give someone a birthday present」に対して、出現回数の降順に「you」「her」「him」「Tom」という単語群を更なる入力候補として設定する。出現回数に従って表示順を設定することで、選択される蓋然性が高い語句をそうでない語句よりも優先してユーザに提示することが可能になる。あるいは、スロット処理部24は、PMI(Pointwise Mutual Information。自己相互情報量)などを使って、頻度そのものは大きくないが後に続く特徴的な語を更なる入力候補として設定してもよい。
あるいは、第4の手法として、スロット処理部24は、エディタ11上で今回の確定語句よりも前に位置している文又は文章を解析することで、スロットに挿入される蓋然性が高い語句を特定してもよい。例えば、「His birthday is in December. I will」という文章が既に入力されているとする。この場合にユーザが「okuru」と入力し、その操作に応じて表示された入力候補から「give someone a birthday present」というフレーズを選んだ場合には、スロット処理部24は単語「His」を手掛かりに「him」を更なる入力候補として抽出する。この第4の手法では、スロット処理部24は確定語句の情報だけでなく、それより前方の文又は文章の情報もエディタ11から受信する必要がある。この第4の手法によれば、文または文章を入力しているユーザがこれから入力しそうな語句を先行して提示することができる。
あるいは、スロット処理部24は第3の手法に従って抽出した単語群のうち、第4の手法に従って導出された単語を、当該手法により導出されなかった単語よりも優先して表示させてもよい(第5の手法)。例えば、スロット処理部24は、第4の手法で導出された単語の表示順が他の単語の表示順よりも早くなるように、単語群内の各単語の表示順を設定してもよい。
このように、スロットに挿入され得る語句の取得手法は何ら限定されない。また、この語句の表示順も上記に限定されず、例えばスロット処理部24は取得した語句をアルファベット順に並べてもよい。
スロットが複数存在する場合には、スロット処理部24は各スロットについて任意の手法(例えば上記第1〜第5の手法うちのいずれかの手法)で更なる入力候補を抽出してもよい。
また、スロット処理部24は、複数スロットのうち少なくとも二つのスロットのそれぞれに挿入される語句の自然な組合せの情報を、各スロットに挿入され得る語句と共にエディタ11に送信してもよい。なお、組合せ情報は言語データベース30に格納されていてもよいし、スロット処理部24が予め保持しておいてもよい。
例えば、第1のスロットの候補として二つの英単語「rent」「borrow」があり、第2のスロットの候補として二つの英単語「library」「rental shop」があると仮定する。この場合に、スロット処理部24は、「library」と「borrow」との組合せが「library」と「rent」との組合せよりも自然であることを示す組合せ情報Caと、「rental shop」と「rent」との組合せが「rental shop」と「borrow」との組合せよりも自然であることを示す組合せ情報Cbとを言語データベース30から読み出してエディタ11に送信する。
次に、図16を用いて、入力支援システム2の動作を説明するとともに本実施形態に係る入力支援方法について説明する。
ステップS11〜S16の処理は第1実施形態と同じである。その後ユーザが入力候補から一つの語句を選択して入力を確定すると(ステップS17)、エディタ11は確定語句のスロットにフォーカスを設定する(ステップS18)。
例えば、確定語句が「give someone a birthday present」であればエディタ11は単語「someone」の全体に対してフォーカスを設定する。別の例で、確定語句が「e−mail the address of」であれば、エディタ11は「of」の後ろにフォーカスを設定する。このようにフォーカスの位置を設定することで、ユーザは、カーソルを移動させる等の操作をすることなく直ぐに次の編集作業に取り掛かることができる。例えば、単語全体に対してフォーカスが設定されることで、ユーザはその単語を入力候補からの選択、又は直接入力により直ぐに上書きできる。この様なフォーカス設定に加えて、エディタ11は確定語句の情報を入力支援サーバ20に送信する(ステップS19)。
入力支援サーバ20ではスロット処理部24がその情報を受信し(ステップS19)、上述した任意の手法により、スロットに挿入され得る英語の語句を取得する(ステップS20)。そして、スロット処理部24は抽出した語句を更なる入力候補としてユーザ端末10に送信する(ステップS21)。
ユーザ端末10ではエディタ11がその更なる入力候補を受信して画面上に表示する(ステップS22)。ユーザがその候補の中から一つを選択すると、選択された英語の語句がスロットに挿入され、これにより入力が確定する。
スロットが複数存在する場合には、エディタ11は、ユーザの選択操作に基づいて各スロットの語句を一つずつ確定していってもよい。あるいは、エディタ11は、ユーザがすべてのスロットに対して選択操作をした後で全スロットの語句を一括して確定することで、個々のスロットでの語句を再選択する機会をユーザに提供してもよい。
組合せ情報を受信した場合には、エディタ11はその情報に基づいて、一のスロットにおいてユーザが選択した語句とより自然に対応する他のスロットの語句を自動的に選択及び提示するか、あるいは、自動的に選択することなく、より自然な語句をヘルプ情報としてユーザに提示してもよい。このように語句同士の自然な組合せを提示することで、ユーザは自然な文または文章を簡単に作成することが可能になる。
例えば、エディタ11が、第1のスロットの候補である二つの英単語「rent」「borrow」と、第2のスロットの候補である「library」「rental shop」という英単語と、上述した組合せ情報Ca,Cbを受信したとする。そして、ユーザが第1のスロットで「rent」を選択した後に第2のスロットで「library」を選択したとする。この場合に、エディタ11はそのユーザ操作に応じて、第1のスロットの「rent」を「borrow」に置き換えるか、あるいは「borrow」の方がより自然な単語である旨のヘルプ情報を表示する。
次に、図17を用いて、エディタ11上で更なる入力候補がどのように表示されるかを説明する。
入力候補から「chuck a ball to」という英語のフレーズが選択されることで入力が確定したとする。この場合には、エディタ11がこのフレーズの情報を入力支援サーバ20に送信する。続いて、スロット処理部24がこのフレーズに基づいて更なる入力候補を取得してその候補をユーザ端末10に送信する。
そして、エディタ11がその更なる入力候補を図17に示すように画面上に表示する。この図では、エディタ11は更なる入力候補を候補欄Cに一覧表示している。この例では、更なる入力候補は、英語からの検索により得られた語句(列L1)と、日本語からの検索により検索された語句(列L2)とに分かれて表示されている。各語句が二つのグループのうちのどちらに属するかは、その語句に関連付けられているフラグを参照することで判定できる。図17に示すように、更なる入力候補を表示する際にも、エディタ11はスクロールバーを各列の単語数又はフレーズ数に応じて各列に設定してもよい。
次に、図18を用いて、入力支援システム2を実現するための入力支援プログラムPを説明する。本実施形態の入力支援プログラムPは、サーバ・プログラムP2Aが、メインモジュールP20、受付モジュールP21、検索モジュールP22、及び提供モジュールP23に加えてスロット処理モジュールP24を備える点で、第1実施形態と異なる。スロット処理モジュールP24を実行することにより実現される機能は上記のスロット処理部24の機能と同様である。
以上説明した第2実施形態も第1実施形態と同様の効果を奏する。加えて、本実施形態によれば、スロットを有する語句の入力が確定すると直ぐに、そのスロットに挿入され得る語句の候補(更なる入力候補)が提示されるので、ユーザはより簡単に文又は文章を作成することができる。
以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。
上記実施形態ではクライアント・サーバ型の入力支援システムを示したが、ユーザ端末、あるいはエディタが入力支援サーバ20又は20Aの機能を備える入力支援装置を採用してもよい。例えば図19に示すように、ユーザ端末10Aに実装されたエディタ11Aが受付部21、検索部22、提供部23、及びスロット処理部24を備えていてもよい。この場合には、検索部22及びスロット処理部24はネットワークを介して言語データベース30にアクセスする。
上記実施形態において、言語データベース30は入力支援サーバ20又は20A内に設けられていてもよい。これと同様に、図19の変形例において、言語データベース30はユーザ端末10A内に設けられていてもよい。
上記実施形態では、入力支援システムは英文入力を支援するために英語の入力又はローマ字表記の日本語の入力を受け付けた。すなわち、上記実施形態では第1の言語が英語であり、第2の言語が日本語であった。しかし、どの言語を第1及び第2の言語とするかは任意に定めてよい事項である。ただし、第1の言語はアルファベットを用いて表現される言語(例えばフランス語やドイツ語)である。一方、第2の言語は、通常はアルファベットを用いないがアルファベットでも表現可能な言語(例えば中国語)でもよいし、アルファベットを用いて表現される言語(例えばフランス語、ドイツ語、英語)でもよい。したがって、第1及び第2の言語の双方がラテン語系の言語であってもよい。
エディタ上での入力候補及び更なる入力候補の表示方法も限定されない。例えば、エディタ11はスクロールバーを候補欄C全体に対して一つのみ表示させてもよいし、入力候補を単語の列とフレーズの列との二つにのみ分けて表示させてもよい。あるいは、スクロールバーではなくページ切替の手法を用いて、表示されていない語句を表示させてもよい。
上記第2実施形態では、エディタ11がスロットにフォーカスを設定し、その後に更なる入力候補を表示した。しかし、入力支援システムは、スロットにフォーカスを設定した時点で処理を終了し、更なる入力候補の取得を行わなくてもよい。
1,2…入力支援システム、10,10A…ユーザ端末、11,11A…エディタ、20,20A…入力支援サーバ、21…受付部、22…検索部、23…提供部(出力部)、24…スロット処理部(追加処理部)、30…言語データベース(記憶部)、P…入力支援プログラム、P1…クライアント・プログラム、P11…エディタ・モジュール、P2,P2A…サーバ・プログラム、P20…メインモジュール、P21…受付モジュール、P22…検索モジュール、P23…提供モジュール、P24…スロット処理モジュール。
さらに別の側面に係る入力支援装置では、各列が独立してスクロールするように入力候補が表示されてもよい。このようなスクロール方法により、ユーザは他の列の語句をそのまま見続けながら特定の一つの列内の語句を見渡すことができる。
また、本発明の一側面に係る入力支援装置は、入力文字列の言語の指定を受け付けることなく、ローマ字による入力文字列を受け付ける受付部と、アルファベットで表記される第1の言語の語句と、該第1の言語の語句に対応する第2の言語の語句のローマ字表記とを、それらの対応関係が特定できる態様で記憶する記憶部から、入力文字列を含む第1の言語の語句を検索する第1の処理と、該記憶部から、該入力文字列を含むローマ字表記に対応する第1の言語の語句を検索する第2の処理とを実行する検索部と、少なくとも第2の処理の結果を入力候補として出力する出力部とを備える。
また、本発明の一側面に係る入力支援方法は、入力支援装置により実行される入力支援方法であって、入力文字列の言語の指定を受け付けることなく、ローマ字による入力文字列を受け付ける受付ステップと、アルファベットで表記される第1の言語の語句と、該第1の言語の語句に対応する第2の言語の語句のローマ字表記とを、それらの対応関係が特定できる態様で記憶する記憶部から、入力文字列を含む第1の言語の語句を検索する第1の処理と、該記憶部から、該入力文字列を含むローマ字表記に対応する第1の言語の語句を検索する第2の処理とを実行する検索ステップと、少なくとも第2の処理の結果を入力候補として出力する出力ステップとを含む。
本発明の一側面に係る入力支援プログラムは、入力文字列の言語の指定を受け付けることなく、ローマ字による入力文字列を受け付ける受付部と、アルファベットで表記される第1の言語の語句と、該第1の言語の語句に対応する第2の言語の語句のローマ字表記とを、それらの対応関係が特定できる態様で記憶する記憶部から、入力文字列を含む第1の言語の語句を検索する第1の処理と、該記憶部から、該入力文字列を含むローマ字表記に対応する第1の言語の語句を検索する第2の処理とを実行する検索部と、少なくとも第2の処理の結果を入力候補として出力する出力部としてコンピュータを機能させる。

Claims (20)

  1. ローマ字による入力文字列を受け付ける受付部と、
    アルファベットで表記される第1の言語の語句と、該第1の言語の語句に対応する第2の言語の語句のローマ字表記と、をそれらの対応関係が特定できる態様で記憶する記憶部から、前記入力文字列を含む前記第1の言語の語句を検索する第1の処理と、該記憶部から、該入力文字列を含む前記ローマ字表記に対応する前記第1の言語の語句を検索する第2の処理とを実行する検索部と、
    前記第1の処理の結果と前記第2の処理の結果とを入力候補として出力する出力部と
    を備える入力支援装置。
  2. 前記入力文字列が複数の単語を含み、
    前記検索部が、前記複数の単語のそれぞれについて前記第1の処理及び前記第2の処理を実行し、
    前記出力部が、前記複数の単語のすべてにおいて検索された共通の前記第1の言語の語句を前記入力候補として出力する、
    請求項1に記載の入力支援装置。
  3. ユーザにより選択された前記共通の第1の言語の語句が前記入力文字列の全体と置換されることで、該選択された語句の入力が確定する、
    請求項2に記載の入力支援装置。
  4. 前記入力文字列が複数の単語を含み、
    前記出力部が、前記複数の単語のうち一部の単語において検索された前記第1の言語の語句を前記入力候補として出力する、
    請求項1〜3のいずれか一項に記載の入力支援装置。
  5. 前記一部の単語が、前記入力文字列において最後に位置する単語である、
    請求項4に記載の入力支援装置。
  6. ユーザにより選択された前記第1の言語の語句が、前記複数の単語のうち該選択された語句の検索条件として用いられた単語のみと置換されることで、該選択された語句の入力が確定する、
    請求項4又は5に記載の入力支援装置。
  7. 前記入力候補が、未確定部分を示す情報が付加された前記第1の言語の語句を含み、
    前記未確定部分を有する語句の入力が確定した場合に、該未確定部分にフォーカスが設定される、
    請求項1〜6のいずれか一項に記載の入力支援装置。
  8. 前記入力候補が、未確定部分を示す情報が付加された前記第1の言語の語句を含み、
    前記未確定部分を有する語句の入力が確定した場合に、該未確定部分に挿入され得る語句を取得し、取得した語句を更なる入力候補として出力する追加処理部を更に備える、
    請求項1〜7のいずれか一項に記載の入力支援装置。
  9. 前記追加処理部が、語句の未確定部分と該未確定部分に挿入可能な語句との対応が記憶された所定の記憶部を参照することで、前記未確定部分に挿入され得る語句を取得する、
    請求項8に記載の入力支援装置。
  10. 前記追加処理部が、前記第1の言語及び前記第2の言語のうち少なくとも一方の言語のコーパスが記憶された所定の記憶部を参照することで、前記未確定部分に挿入され得る語句を取得する、
    請求項8又は9に記載の入力支援装置。
  11. 前記更なる入力候補が前記コーパス内での出現回数に従った順番で表示される、
    請求項10に記載の入力支援装置。
  12. 前記追加処理部が、前記入力文字列より前に位置する確定済の文字列を解析することで、前記未確定部分に挿入され得る語句を推定する、
    請求項8〜11のいずれか一項に記載の入力支援装置。
  13. 前記更なる入力候補において、前記確定済の文字列の解析により推定された語句が、該解析により推定されなかった語句よりも優先して表示される、
    請求項12に記載の入力支援装置。
  14. 前記入力候補に含まれる前記第1の言語の語句に前記未確定部分が複数存在する場合に、前記追加処理部が、各未確定部分について前記更なる入力候補を取得すると共に、第1の未確定部分に挿入され得る語句と第2の未確定部分に挿入され得る語句との自然な組合せを示す組合せ情報を取得し、該組合せ情報を各未確定部分の更なる入力候補と共に出力し、
    前記第1及び第2の未確定部分のうちの一方の未確定部分におけるユーザ操作に応じて、他方の未確定部分に挿入され得る語句が前記組合せ情報に基づいて提示される、
    請求項8〜13のいずれか一項に記載の入力支援装置。
  15. 前記入力候補が単語の列とフレーズの列とに分かれて表示される、
    請求項1〜14のいずれか一項に記載の入力支援装置。
  16. 前記フレーズが語義に従って更に複数の列に分かれて表示される、
    請求項15に記載の入力支援装置。
  17. 前記入力候補が語義に従って複数の列に分かれて表示される、
    請求項1〜14のいずれか一項に記載の入力支援装置。
  18. 各列が独立してスクロールするように前記入力候補が表示される、
    請求項15〜17のいずれか一項に記載の入力支援装置。
  19. 入力支援装置により実行される入力支援方法であって、
    ローマ字による入力文字列を受け付ける受付ステップと、
    アルファベットで表記される第1の言語の語句と、該第1の言語の語句に対応する第2の言語の語句のローマ字表記と、をそれらの対応関係が特定できる態様で記憶する記憶部から、前記入力文字列を含む前記第1の言語の語句を検索する第1の処理と、該記憶部から、該入力文字列を含む前記ローマ字表記に対応する前記第1の言語の語句を検索する第2の処理とを実行する検索ステップと、
    前記第1の処理の結果と前記第2の処理の結果とを入力候補として出力する出力ステップと
    を含む入力支援方法。
  20. ローマ字による入力文字列を受け付ける受付部と、
    アルファベットで表記される第1の言語の語句と、該第1の言語の語句に対応する第2の言語の語句のローマ字表記と、をそれらの対応関係が特定できる態様で記憶する記憶部から、前記入力文字列を含む前記第1の言語の語句を検索する第1の処理と、該記憶部から、該入力文字列を含む前記ローマ字表記に対応する前記第1の言語の語句を検索する第2の処理とを実行する検索部と、
    前記第1の処理の結果と前記第2の処理の結果とを入力候補として出力する出力部と
    をコンピュータに実行させる入力支援プログラム。
JP2014526291A 2012-12-06 2013-08-09 入力支援装置、入力支援方法、及び入力支援プログラム Active JP5897711B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261734026P 2012-12-06 2012-12-06
US61/734026 2012-12-06
PCT/JP2013/071712 WO2014087704A1 (ja) 2012-12-06 2013-08-09 入力支援装置、入力支援方法、及び入力支援プログラム

Publications (2)

Publication Number Publication Date
JP5897711B2 JP5897711B2 (ja) 2016-03-30
JPWO2014087704A1 true JPWO2014087704A1 (ja) 2017-01-05

Family

ID=50883135

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014526291A Active JP5897711B2 (ja) 2012-12-06 2013-08-09 入力支援装置、入力支援方法、及び入力支援プログラム

Country Status (3)

Country Link
US (1) US20150309991A1 (ja)
JP (1) JP5897711B2 (ja)
WO (1) WO2014087704A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016016994A1 (ja) * 2014-07-31 2016-02-04 楽天株式会社 情報処理装置、情報処理方法、プログラム、記憶媒体

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3548747B2 (ja) * 1997-06-17 2004-07-28 オムロン株式会社 記録媒体および文字入力装置
JPH11338858A (ja) * 1998-05-22 1999-12-10 Toshiba Corp 入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体
JP2001265765A (ja) * 2000-03-23 2001-09-28 Seiko Instruments Inc 電子辞書
US8137105B2 (en) * 2003-07-31 2012-03-20 International Business Machines Corporation Chinese/English vocabulary learning tool
US7376648B2 (en) * 2004-10-20 2008-05-20 Oracle International Corporation Computer-implemented methods and systems for entering and searching for non-Roman-alphabet characters and related search systems
CN105117376B (zh) * 2007-04-10 2018-07-10 谷歌有限责任公司 多模式输入法编辑器
JP5113459B2 (ja) * 2007-08-31 2013-01-09 セイコーインスツル株式会社 辞書検索装置
WO2010003155A1 (en) * 2008-07-03 2010-01-07 Nuance Communications, Inc. Methods and systems for processing japanese text on a mobile device
JP5320925B2 (ja) * 2008-09-18 2013-10-23 富士通株式会社 情報検索方法、情報検索装置及び情報検索プログラム
US8635539B2 (en) * 2008-10-31 2014-01-21 Microsoft Corporation Web-based language translation memory compilation and application
US9465782B2 (en) * 2010-07-13 2016-10-11 Motionpoint Corporation Dynamic language translation of web site content
JP6511221B2 (ja) * 2010-08-26 2019-05-15 グーグル エルエルシー 入力テキスト文字列の変換
JP5739718B2 (ja) * 2011-04-19 2015-06-24 本田技研工業株式会社 対話装置
US8706472B2 (en) * 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
US8775165B1 (en) * 2012-03-06 2014-07-08 Google Inc. Personalized transliteration interface
US20130326347A1 (en) * 2012-05-31 2013-12-05 Microsoft Corporation Application language libraries for managing computing environment languages

Also Published As

Publication number Publication date
WO2014087704A1 (ja) 2014-06-12
JP5897711B2 (ja) 2016-03-30
US20150309991A1 (en) 2015-10-29

Similar Documents

Publication Publication Date Title
JP5761833B2 (ja) ユーザ部分入力のための辞書候補
JP5241828B2 (ja) 辞書の単語及び熟語の判定
US7774193B2 (en) Proofing of word collocation errors based on a comparison with collocations in a corpus
US9323827B2 (en) Identifying key terms related to similar passages
US8782049B2 (en) Keyword presenting device
JP2007004633A (ja) 言語モデル作成装置およびそれにより作成された言語モデルを使用する言語処理装置
JP2003223437A (ja) 正解語の候補の表示方法、スペルチェック方法、コンピュータ装置、プログラム
JP2010055235A (ja) 翻訳支援プログラム、及び該システム
JP4502615B2 (ja) 類似文検索装置、類似文検索方法、およびプログラム
US20090300003A1 (en) Apparatus and method for supporting keyword input
JP5850014B2 (ja) 文字入力装置、及びプログラム
US20140026043A1 (en) Computer product, input support method, and input support apparatus
JP5897711B2 (ja) 入力支援装置、入力支援方法、及び入力支援プログラム
JP4491389B2 (ja) 電子機器、プログラム、及びプログラムを記録した記録媒体
JP5380989B2 (ja) 辞書機能を備えた電子装置およびプログラム
JP5271526B2 (ja) 商標検索システム及び商標検索サーバ
JP4953440B2 (ja) 形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体
Kwok et al. CHINET: a Chinese name finder system for document triage
JP2004157965A (ja) 検索支援装置、検索支援方法、プログラムおよび記録媒体
JP2008059169A (ja) 中国語例文検索装置および中国語例文検索処理プログラム
JP2010146061A (ja) 例文表示装置、例文表示方法および例文表示プログラム
JP2007257188A (ja) 辞書検索装置およびその制御プログラム
JP6048601B2 (ja) 情報表示装置、プログラムおよび単語情報表示方法
KR102523767B1 (ko) Bleu 스코어를 기초로 유사 문장에 대한 검색을 수행하는 전자 장치 및 그 동작 방법
JP2008102802A (ja) 文書支援システム及び文書支援プログラム

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20141028

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160302

R150 Certificate of patent or registration of utility model

Ref document number: 5897711

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250