JP2013117978A - タイピング効率向上のためのタイピング候補の生成方法 - Google Patents

タイピング効率向上のためのタイピング候補の生成方法 Download PDF

Info

Publication number
JP2013117978A
JP2013117978A JP2013013454A JP2013013454A JP2013117978A JP 2013117978 A JP2013117978 A JP 2013117978A JP 2013013454 A JP2013013454 A JP 2013013454A JP 2013013454 A JP2013013454 A JP 2013013454A JP 2013117978 A JP2013117978 A JP 2013117978A
Authority
JP
Japan
Prior art keywords
word
input
words
candidate
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013013454A
Other languages
English (en)
Inventor
Wen-Lian Hsu
フ,ウェン−リャン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Academia Sinica
Original Assignee
Academia Sinica
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Academia Sinica filed Critical Academia Sinica
Publication of JP2013117978A publication Critical patent/JP2013117978A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】タイピング効率の向上のためのタイピング候補の生成方法を提供する。
【解決手段】生成方法は、ユーザーから文章のテキスト入力として受け付けられた単語および単語列を表すテキストの蓄積を保持するステップと、入力インターフェースを介して、前記ユーザーから入力文字列を受け付けるステップと、前記入力文字列が、変換候補を表す全ての文字よりも少ない部分列を形成するような一つ以上の前記変換候補を特定するために、事前に受け付けられた単語および単語列を含む前記テキストの蓄積において検索するステップと、前記テキストの蓄積において検索された前記変換候補から前記一つ以上の単語を含む所望の列を決定するステップと、から構成される。
【選択図】図1

Description

本発明はタイピング候補の生成方法に関し、さらに詳細には、タイピング効率の向上のためのタイピング候補の生成方法に関する。
コンピュータや携帯デバイスでのタイピングはアルファベット言語の利用により困難ではない、それはアルファベットの文字数が限られているからである。アルファベット言語は一般的なキーボード上のキーパッドに簡単に位置づけし対応させることができる。しかしながら、誤ったつづり、タイプエラー、未知のつづり、および発音区別符号による文字(もしくはアクセント記号)により、一般的なキーボード上でのアルファベット言語のタイピング効率は簡単に鈍化する。前記要因による間違いを読み出すことにより、タイピングの速度の鈍化およびタイピストの思考の流れの遮断を起こすことになっている。正確なつづりを知らない文字のタイピングには様々な推測と、辞書の検索作業と、を有している。通常、特別に設計されたキーボードレイアウト、更なるキーストロークの学習、またはキーストロークとの両立を必要とし、発音区別符号(またはアクセント記号)での文字のタイピングにおいて、それらによってタイピング速度を落とすこともある。
請求項に係る発明は、双方向のテキスト入力インターフェースを使用するユーザーからのテキスト入力を処理する方法を提供する。その方法は、前記入力インターフェースを介して、前記ユーザーから文章のテキスト入力として受け付けられた単語および単語列を表すテキストの蓄積を保持するステップと、前記入力インターフェースを介して、前記ユーザーから受け付けられた入力文字列を含むさらなる入力を受け付けるステップであって、前記さらなる入力はテキスト入力された一つ以上の単語を含む所望の列を表現し、前記一つ以上の単語を含む所望の列は所定の文字の集合に基づく文字列の表現に相当し、前記入力文字列は前記一つ以上の単語を含む所望の列を表現する前記文字列の部分列を含むステップと、可能性のある検索結果として事前に変換候補を登録することなく、前記さらなる入力の前記入力文字列が、変換候補を表す全ての文字よりも少ない部分列を形成するような一つ以上の前記変換候補を特定するために、事前に受け付けられた単語および単語列を含む前記テキストの蓄積において検索するステップと、前記テキストの蓄積において検索された前記変換候補から前記一つ以上の単語を含む所望の列を決定するステップと、を含む。
本発明のこれらおよびその他の目的は、様々な数式や図面を用いて記された後述する好ましい実施形態の詳細な説明を読むことで、技術の通常の知識を有する者にとって間違いなく明らかになるであろう。
図1は、誤ったつづりを軽減するための、本発明におけるタイピング候補の生成方法を示すフローチャート図である。 図2は、入力された語の簡易の発音に即したつづりでタイピストの手助けをするための、本発明における候補の生成方法を示すフローチャート図である。 図3は、図2に示されるステップにおいて利用される相似行列を示すブロック図である。 図4は、対象となる文字における文字の部分列を入力することによる、本発明における候補の生成方法を示す図である。 図5は、オリジナルの文字の列の頭文字の部分列を利用することによる、本発明における候補の生成方法を示す図である。 図6は、発音区別符号によるタイピングする文字を拡張させるための、本発明における候補の生成方法を示す図である。
タイピストに対する上述の問題による阻害を防止するために、タイピストを手助けし、そして、上述の問題による阻害を克服することに関して、本発明においていくつかのタイピング候補の生成方法が提供される。
本発明の第1の候補の生成方法は誤ったつづりによる問題からタイピストを手助けすることである。誤ったつづりには、挿入、削除、置換、および並べ替えのエラーを含む。もし、タイプした単語の文字が別の文字(もしくは小文字が大文字)と置き換わると、置換エラーが起こる。もし、タイプした単語の文字が削除されると、削除エラーが起こる。もし、余分な文字がタイプされると、挿入エラーが起こる。もし、2つの文字の順序が逆にされると、並べ替えエラーが起こる。単語の長さと比較してつづりのエラーの数が少ない限り、たとえどのような誤ったつづりのタイプであってもエラーは起こり、誤ったつづりの単語は修正されるまで十分な情報を保持し続ける。たとえば、誤ってつづった単語である”phenomanon”は、”phenomenon”のタイプミスであり、そして、7番目の文字である”e”が”a”の誤ったつづり(置換エラー)というだけであり、他の9文字は正しくつづられている。それゆえ、誤った単語を読み出すためにそのような情報が用いられる。
上述のコンセプトによると、本発明において提供される第1のタイピング候補の生成方法は図1のように示され、図1には誤ったつづりを軽減するためのタイピング候補の生成方法のフローチャートが示される。
ステップ102:単語辞書を準備する。
ステップ104:単語辞書を使いそしてテストすることであって、かなり多くの文の意味的特質を有する所定の統計データを確立するために、多くの関連付けられた単語を有するかなり多くの文を使用する。
ステップ106:所定の統計データと関連し、ユーザーがタイプした文の意味的特質と一致するように、ユーザーがタイプした文を適応させることで、単語辞書から少なくとも一つの候補の単語を生成するという自動選択方法を実行する。
ステップ108:ユーザーがタイプした文の選択した単語と、単語辞書中から少なくも一つの候補となるそれぞれの単語との間の編集距離を計算する。
ステップ110:すべての計算された編集距離がすべてゼロより大きいかどうかを調べる。すべての計算された編集距離がすべてゼロより大きい場合はステップ112に進み、異なる場合はステップ114に進む。
ステップ112:複数の候補の単語から編集距離が最も短い候補の単語を選定し、誤ったつづりだとされた単語とその選定された候補の単語とを置換する。
ステップ114:誤ったつづりだとされた単語と編集距離がゼロである候補の単語とを置換する。
ステップ102と104は、図1に示されるように、それ以降のステップのために前もって、単語辞書を準備し設置するという手順を含む、というのもそれ以降のステップがその単語辞書による補助により実行されるからである。単語辞書は、システム辞書、ドメイン辞書、またはユーザー辞書である。ある状況において、タイピストのタイピングする慣習と一致するために、単語辞書はタイピストの最近の記事または小記事からなる。ステップ102や104において、単語辞書はどのようなタイプのものでも利用され、かなり多くの文を確認するため、もしくは、複数の文の意味的特質と関連した統計データを得るため、その利用される単語辞書は使用されそしてテストされなければならない。統計データは、所定のパラグラフやタイピストがタイプした段落内の様々な単語の頻度、または、様々な単語間の順列の可能性などである。
ステップ106から114に関して、最も見込みのある候補の単語を決定することにおいて、また、上述のように誤ったつづりでタイプしたことによる誤った単語である入力した単語が有する正しい文の意味的特質と一致するように、タイピストが入力した単語を決定された候補の単語で置換することにおいて、自動選択方法が実行される。入力した単語と関連する可能性のある候補の単語は、編集距離に基づいて単語辞書から決定され、入力した単語を可能性のある候補の単語に変更するために、入力した単語に対する文字の挿入、削除、または置換が行われることを示す。たとえば、入力した”phenomanon”という単語を、候補の単語”phenomenon”に変更するために、文字”a”は文字”e”に置換されるべきであり、さらに、複数の文字中1つの置換だけなので、関連する編集距離は1と記録される。同様に、入力された単語が”phnocmanon”であるときは、文字”e”を”h”と”n”の間に挿入し、”o”と”m”の間の文字”c”を削除し、そして文字”a”を”m”と”n”の間の文字”e”で置換するため、関連する編集距離は3である。ここで、本発明の翻訳距離は別例でも決定でき、上述の方法に制限されるものではない。
すべての候補の単語の編集距離がゼロより大きな値を有することは、入力した単語が誤ってつづられた単語である、ということを示している。そして、入力された単語と置換するために、入力された単語に基づいた最も小さな値の編集距離を有する候補の単語が、自動的に選択される。しかしながら、最も小さな値と同じ値の編集距離を有する候補の単語がさらに複数あるかもしれない。そのような問題ある状態を防ぐために、入力した単語を有する正しいパラグラフの意味的特質に関連する上述の統計データもまた、編集距離に関連した可能性のある候補の単語を決定するために利用される。意味的特質を導入することで、入力された単語のための可能性のある候補の単語の分野はかなり削減され、可能性のある候補の単語を決定する効率が向上し、さらに、タイピストのタイピング効率も同様に向上する。そのようにして、本発明による誤ったつづりを軽減する方法は機能する。
さらに、文脈自由文法において利用され、意味的法則に従うN−gramモデル法や、言語的テンプレート照合システムもまた、本発明の誤ったつづりを軽減するため、そして、上述した方法をさらに良くするために利用される。
本発明における誤ったつづりを軽減する上述の方法を実行するために、ユーザーインターフェースが利用されるかもしれない。ユーザーインターフェース上では、入力された単語に対して複数の可能性のある候補の単語のリスト化、もしくは、タイピストがタイプした最近のパラグラフを関連する単語辞書が参照すると同時に、タイピストがタイプした文章を編集して生成されることがありうる。ユーザーインターフェースはさらに、タイピストによる誤ったつづりを報告し、そしてそのようなタイピングによるエラーの記録をするために、設計されうる。それゆえ、タイピングエラーを記録することは、編集距離と意味的特質に加えて、可能性のある候補の単語の分野の削減に利用されることもある。挿入エラー、削除エラー、置換エラー(または並べ替えエラー)を含んだタイピングエラーを記録することは、それによって参照されるものとしての統計データの一種として、前述のタイピングエラーを有する文やパラグラフとともに記録されうる。
本発明の第2の候補の生成方法は、タイプした単語の簡易音声つづりを利用してタイピストの手助けをすることである。第2の候補の生成方法の基本概念は以下に記述した通りである。アルファベット言語にとって、もしタイピストが単語のつづりを忘れており、その発音の仕方は大体覚えていた場合、ユーザーは大体の発音を推測することでその単語を調べることができる。そのような考えにおいて、かなり多くの音声的音節を有する音声語辞書が必要になる。タイピストが英語で”bureaucracy”という単語をつづることができなかった場合、”burocrecy”や”burockrecy”というような対応した発音によるものを意味しているように、音声による単語に基づいたおおよその発音によるものでタイプするかもしれない。
発音による単語を受け取ると、多くの可能性のあるものとして、その発音による単語が音声的音節に分割されることで、発音による単語に対応した発音が解読もしくは推測される、そして、対応する複数の発音による音節の列が生成される。それぞれの音声的音節の列は、複数の音声的音節が含まれ、そして、前記可能性のあるものと一致することになる。
図2は、タイプされる単語の簡易音声つづりを利用した、タイピストを補助するための、本発明の第2の候補の生成方法を示すフローチャート図である。第2の候補の生成方法は次のステップを含む。
ステップ202:音声語辞書を準備する。
ステップ204:音声語辞書に多くの音声的音節を記録する。
ステップ206:複数の記録された音声的音節同士から複数の類似度合いを計算する。
ステップ208:入力した単語を複数の音声的音節からなる列に分割し、それぞれが複数の音声的音節を含むようにする。
ステップ210:音声語辞書の複数の相似行列に従い、複数の音声的音節の列のそれぞれにおいて、少なくとも一つの候補の単語を含んでいる複数の候補の単語を生成する。
ステップ212:複数の候補の単語の中から候補の単語を選択し、そして、最小合計置換値が入力した単語の置換が0個よりも大きい値を有する選択した候補の単語で入力した単語を入れ替える。
ステップ102から104と類似するステップ202から206は、図2に示す後述するステップで用いる音声語辞書を準備することを含む。音声語辞書を記録することに加えて、音声的音節間における類似的度合いを意図する類似性が音声語辞書内に仮の記憶として行わなければならない。第1の音声的音節と第2の音声的音節間の高い類似的度合いは、第1の音声的音節の文字を挿入、削除、置換、または並び替えすることによる、第1の音声的音節から第2の音声的音節への変更の置換値が小さいということ示しており、逆に、低い類似的度合いは置換値が大きいということを示す。第1の音声的音節の列と第2の音声的音節の列との間の類似点は、相似行列によって定義される。相似行列の列には第1の音声的音節の列内の全音声的音節が並べられ、相似行列の行には第2の音声的音節の列内の全音声的音節が並べられる。
図3は前記相似行列を示す図である。相似行列Aは、第1の音声的音節の列PSrow=(PSR,PSR,PSR,…,PSRM−1)と第2の音声的音節の列PScolumn=(PSC,PSC,PSC,…,PSCN−1)との相互間における、すべての置換値を示すために利用されており、ここで、PSR(i=0,1,2,…,M−1)は音声的音節の列であるPSrowのi番目の音声的音節を示し、PSC(j=0,1,2,…,N−1)は音声的音節の列PScolumnのj番目の音声的音節を示す。さらに、Mは音声的音節の列であるPSrowの大きさを示し、Nは音声的音節の列であるPScolumnの大きさを示す。図3に示すように、係数Ai,jは音声的音節PSRと音声的音節PSCとの相互間における類似度を示し、本発明における最適な実施形態において前記関数Ai,jは0から1までの値を有する。音声的音節の列であるPSrowとPScolumn間のすべての置換値を計算するために、いくつかの考えられる方法が利用されうる。本発明の最適な実施形態において、各列または各行における各最小の係数Ai,jは相似行列Aの表現されるすべての置換値として足しあわされ、また、相似行列Aの表現されるすべての置換値として、前記列と前記行との値間のより小さな全ての合算された置換値が検索され、それは他の相似行列の表現されるすべての置換値を比較することに関する。音声的音節の列であるPSrowとPScolumnのそれぞれの大きさ間の差異は大きくなく、つまり、許容でき適切に選ばれた値dにおいて||PSrow|−|PScolumn||≦dであって、|PSrow|と|PScolumn|はそれぞれPSrowとPScolumnの大きさを示す。本発明のもう一つの実施形態において、相似行列Aの行列式もまた表現されるすべての置換値として利用されるかもしれない。
したがって、すべての可能性のある音声的音節の相関における類似性の度合いが、音声語辞書においてすべて予め計算され、予め記録される。ステップ208から212を通して、最も可能性のある候補の単語を決定し、入力した単語を入れ替えるために、第2の候補の単語生成方法が実行され、そして、一致する可能性の最も高い入力単語の音声的特質の一致に関して、決定した候補の単語でタイピストの音声的つづりに関して、それが入力される。第1に、入力単語は様々な可能性のある音声的音節の列に分割される必要があり、入力単語の音声的つづりにより、その文は複数の音声的音節を有し、それぞれ様々な候補の単語を意味する。標準的な状況において、入力単語から分割された音声的音節の列とそれぞれの前記可能性のある候補の単語との相関による上記の値dは、入力単語に関してdが極端な値を有する候補の単語を取り除くために適切なアルゴリズムに利用されることに限られるであろう。そして、様々な相似行列からの複数の典型的な全置換値を比較することによって、最小全置換値が導き出され、入力単語と前述した可能性のある候補の単語との間の類似性とそれぞれが一致する。
最後に、前記入力単語の文字を挿入、削除、置換または並び替えることによって、前記入力単語に関する前記最小全置換値を有する可能性のある候補の単語に入力された単語は変更される。音声的特性によって第2の候補の生成方法の目的が達成される。
上述のステップは、適切に設計されたユーザーインターフェースを用い、自動選択的に実行されるかもしれない。それゆえ、一度発音どおりのつづりによりタイピストが入力単語をタイプすると、タイピストが一つの好適な候補の単語を選択するために、前記ユーザーインターフェースは可能性のある候補の単語リストを示すかもしれなく、もしくは、上述した手順に沿って、入力単語が自動的に最も可能性のある候補の単語に変更される。
時折、非常に多くの文字数の単語をタイプすることは困難である。それゆえ、本発明の第3の候補の生成方法は、そのような不便性を軽減するために、タイピストがタイプしたいと考えていた対象とする単語の列の部分列をタイプすることによる便利な方法を提供する。たとえば、”psychology”という単語は”pylg”とタイプされるかもしれない、なぜなら”psychology”という単語は、入力する”pylg”のすべての文字を含み、入力する”pylg”と同じ順序でもある。”pylg”の部分列に基づいて、”psychological”、”psycholinguistic”、”physiology”のような、”pylg”という部分列を含んでいる、可能性のある候補の単語が、本発明の前記第3の候補の生成方法による補助の下で生成されるであろう。URLやemailのアドレスをタイプする際に、前記方法もまた利用されるであろう。例えば、前にタイピストによってタイプされ、保存されている単語の列であるhttp://iasl.iis.sinica.edu.tw/hsu/と示すために、あるタイピストが部分列”shsu”とタイプするかもしれない。
図4を参照すると、対象とする単語における単語の部分列を入力することによる、本発明の前記第3の候補の生成方法が示されている。図4に示すように、それらのステップは次のように記される。
ステップ302:単語辞書を準備する。
ステップ304:少なくとも一つの候補の単語の中のいずれかから見つけ出し、少なくとも一つの候補の単語の部分列として入力単語を構成される単語辞書内の単語である、少なくとも一つの候補の単語が存在するかを決定する。少なくとも一つの候補の単語があるならばステップ306に進み、ないならばステップ308に進む。
ステップ306:入力単語を変更するために少なくとも一つの候補の単語から一つを選択する。
ステップ308:エラーを示すメッセージを表示する。
前述した方法と同様に、単語辞書は後で実行するステップのために準備される。単語辞書は複数の候補の単語を記録し、複数の候補の単語の部分列を認識する機能を提供する。タイピストが入力単語をタイプすると、単語辞書は列に対して前記入力単語を含む可能性のある候補の単語を検索する。可能性のある候補のリストが見つかると、可能性のある候補の単語の前記リストから最適な単語をタイピストは選べる。適切に設計されたユーザーインターフェースを利用すると、可能性のある候補の単語のリストが、タイピストの選択を容易にするようなリストとして表示されることもできる。さらに、多くの統計データを記録したものを利用すると、さまざまな可能性のある候補の単語の頻度が予め計算され、自動選択的に前記統計データを利用して、上記の選択が自動で行われるであろう。しかしながら、可能性のある候補が見つからなかった際は、タイピストが誤った入力単語をタイプしたということと、入力単語がいずれの候補の単語とも一致しないということとを示すために、対応するエラーメッセージをタイピストに対してリストとして示すべきである。
第4の候補の生成方法は、フレーズや文といった単語が連なったものを利用します。文やフレーズ内の単語の列に基づき、予め記録しておき、また、文やフレーズ内の各単語のはじめの文字からなる”頭文字の列”に対応したものが予め記録される。そして、はじめの単語のはじめの文字を最初にタイプし、最後の単語のはじめの文字を最後にタイプする方法で、その対応した頭文字の列からなる部分列をタイプすることによって、タイピストは単語の連続した部分列を取り出せるかもしれない。たとえば、タイピストが以前に”I will visit the University of California at Los Angeles tomorrow”という文をタイプしていたなら、対応する頭文字の列である”iwvtuocalat”が自動的に保存される。”ucla”または”uocla”とタイプすることによって、タイプする頭文字が”uocala”である”University of California at Los Angeles”というフレーズを、タイピストが取り出せるかもしれない。第4の候補の生成方法は上記の方法とは異なるということを注意する必要があり、というのもフレーズ辞書が、タイピストが記憶するために、”University of California at Los Angeles”というフレーズを記録するためにあるのではないし、たとえば”ucla”というような検索キーでもない。かつてタイプしたテキストにおける法則的な頭文字部分列に基づいた、もしくは、特定のユーザープロファイルに記録した、フレーズや文を読み出すことに関し、タイピストは全てにおいて自由である。
図5は、第4の候補の生成方法を示す図である。
ステップ402:単語の列を保存する。
ステップ404:ある単語の第1の文字と、単語の列内にある対応する単語の順番に並び替えられた単語の列からなる部分列の単語の第1の文字と、からなる頭文字の部分列を利用して、単語の列の単語の部分列を読み出す 。
一つもしくは複数の単語の列からなる一つ以上の頭文字の部分列が利用する一つの頭文字の部分列に修正される場合、前記方法を実行するため、そして、リストからの選択を許可し、頭文字の部分列が修正された可能性のあるリストを生成するために、ユーザーインターフェースが設計されうる。統計データもしくは関連する可能性に従い、最も可能性のある単語の部分列、もしくは最も可能性のある単語の列を選択するため、その選択はまた自動選択的に実行されるかもしれない
本発明の第5の候補の生成方法は発音区別符号での文字のタイピングを促進させるために利用される。前記方法により、発音区別符号を有する文字、たとえば、”Oの上に・・が付いた文字”や”Uの上に・・が付いた文字”は”O”や”U”のように類似した”符号がない”文字と置換される。そのような符号がない文字は自動的に変更される。それゆえ、そのような符号のある文字を含む多くのアルファベット言語において、特別に設計されたキーボードに頼る必要はない。
本発明の第5の候補の生成方法が図5のように示され、次のようにリスト化されている。
ステップ502:単語辞書を準備する。
ステップ504:単語辞書に記録され、複数の可能性のある発音区別符号と関係がある、意味的な単語の組み合わせを照会することによって、入力単語中の文字の可能性のある発音区別符号に基づいて、少なくとも一つの候補の単語を生成する。
ステップ506:少なくとも一つの候補の単語から1つの候補の単語を選択する。
ステップ502において、発音区別符号を有する文字について、ある文字が特定の状況下で発音区別符号を有していようと、もしくはその他の状況下でそのような発音区別符号を有していまいと、語義となる単語の組み合わせと関係する候補の単語を記録するために、単語辞書が準備される。タイピストが入力単語をタイプするとき、発音区別符号と前記入力単語に関係する可能性のある語義となる単語の組み合わせにより、複数の可能性のある候補の単語を検索する。そして、検索された複数の候補の単語の中からタイピストは一つの候補の単語を選択するか、もしくは、頻度や可能性に関連した単語の中から最も可能性のある候補の単語が自動的に選択される。良く設計されたユーザーインターフェースはまた、前記可能性のある候補の単語をリスト化することによって、タイピストが適切な候補の単語を選択するのを補助するために、もしくは自動的に一つの最も可能性のある候補の単語を選択するために、第5の候補の生成方法を実行するために利用されうる。
本発明は、誤ったつづり、タイピングエラー、未知のつづり、そして発音区別符号(またはアクセント記号)を有する文字によるタイピングの負担を軽減するため、そして、単純な技術しか有しないタイピストのタイピング効率の向上のため、いくつかの候補の生成方法を提供する。本発明の方法は、タイピストがタイプした文やフレーズ中の単語の前後関係に基づく候補の単語選択、もしくは、ユーザープローフィールを利用してタイピストがタイプした前後関係の自己学習、といったいくつかのコンセプトを使用する。さらに、特別な制限をすることにより、自動選択的によい予測をすることで、可能性のある候補の単語はかなり減少するかもしれない。
多くのアジアの言語は、標準中国語のピン語入力、倉頡入力、日本語の漢字入力のような、アルファベットをベースにしたタイピング方法を採用している。その方法において、アルファベットの列は、候補のアジアの文字のコレクションを読み出すコードを形成する。それゆえ、単語としてアジアの文字を考慮すると、本発明のすべての候補の生成方法は、アジアの言語に利用することができる。
当業者であれば、本発明の技術を維持しながら、装置や方法といったものの多数の修正と変更ができるであろう。したがって、上述したものは、添付の請求項の範囲によって定義される本発明の範囲を制限することを意図したものではないことが理解されるべきである。

Claims (11)

  1. 双方向のテキスト入力インターフェースを使用するユーザーからのテキスト入力を処理する方法であって、
    前記入力インターフェースを介して、前記ユーザーから文章のテキスト入力として受け付けられた単語および単語列を表すテキストの蓄積を保持するステップと、
    前記入力インターフェースを介して、前記ユーザーから受け付けられた入力文字列を含むさらなる入力を受け付けるステップであって、前記さらなる入力はテキスト入力された一つ以上の単語を含む所望の列を表現し、前記一つ以上の単語を含む所望の列は所定の文字の集合に基づく文字列の表現に相当し、前記入力文字列は前記一つ以上の単語を含む所望の列を表現する前記文字列の部分列を含むステップと、
    可能性のある検索結果として事前に変換候補を登録することなく、前記さらなる入力の前記入力文字列が、変換候補を表す全ての文字よりも少ない部分列を形成するような一つ以上の前記変換候補を特定するために、事前に受け付けられた単語および単語列を含む前記テキストの蓄積において検索するステップと、
    前記テキストの蓄積において検索された前記変換候補から前記一つ以上の単語を含む所望の列を決定するステップと、
    を含む方法。
  2. 前記所定の文字の集合は、アルファベットの文字の集合を含む請求項1に記載の方法。
  3. 前記さらなる入力を受け付けるステップは、前記入力インターフェースを介したアルファベットの文字列の受け付けを含む請求項2に記載の方法。
  4. 前記入力インターフェースを介した前記文字列の受け付けは、キーボードインターフェースを介した前記文字列の受け付けを含む請求項3に記載の方法。
  5. 前記一つ以上の単語を含む所望の列は、所望の一つの単語からなり、受け付けられた前記入力文字列は、前記所望の一つの単語の全ての文字より少ない部分列からなり、前記テキストの蓄積の検索は、前記入力文字列が変換候補となる前記所望の一つの単語の全ての文字より少ない部分列として含まれるような前記変換候補となる単語を見つけるために前記テキストの蓄積を検索することを含む請求項2に記載の方法。
  6. 前記一つ以上の単語を含む所望の列は、二つ以上の単語を含む所望の列からなり、前記入力文字列のそれぞれの文字は、前記二つ以上の単語を含む所望の列に含まれる単語に対応する頭文字であり、前記テキストストレージの検索は、前記入力文字列のそれぞれの文字が変換候補となる前記二つ以上の単語を含む所望の列に含まれる単語の頭文字であるような前記変換候補となる単語列を見つけるために前記テキストの蓄積を検索することを含む請求項2に記載の方法。
  7. 前記所定の文字の集合は、アジアの言語における単語を表すための文字の集合を含む請求項1に記載の方法。
  8. 前記アジアの言語における少なくともいくつかの単語は、前記所定の文字の集合に含まれる複数の文字の列により表現される請求項7に記載の方法。
  9. 前記所定の文字の集合は、標準中国語のピンイン入力、倉頡ピンイン入力および日本語漢字入力からなる群のいずれかの方法を使用するアジアの言語における単語を表すための文字を含む請求項7に記載の方法。
  10. テキスト入力された前記一つ以上の単語を含む所望の列は、アジアの言語における単語の列を含む請求項7に記載の方法。
  11. 前記単語の列の少なくとも一つの単語について、前記入力文字列は、当該一つの単語を表す文字列の部分列を含む請求項10に記載の方法。
JP2013013454A 2006-09-27 2013-01-28 タイピング効率向上のためのタイピング候補の生成方法 Pending JP2013117978A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/535,497 US8364468B2 (en) 2006-09-27 2006-09-27 Typing candidate generating method for enhancing typing efficiency
US11/535,497 2006-09-27

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2009530601A Division JP2010505208A (ja) 2006-09-27 2007-09-27 タイピング効率向上のためのタイピング候補の生成方法

Publications (1)

Publication Number Publication Date
JP2013117978A true JP2013117978A (ja) 2013-06-13

Family

ID=39226154

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2009530601A Pending JP2010505208A (ja) 2006-09-27 2007-09-27 タイピング効率向上のためのタイピング候補の生成方法
JP2013013454A Pending JP2013117978A (ja) 2006-09-27 2013-01-28 タイピング効率向上のためのタイピング候補の生成方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2009530601A Pending JP2010505208A (ja) 2006-09-27 2007-09-27 タイピング効率向上のためのタイピング候補の生成方法

Country Status (7)

Country Link
US (2) US8364468B2 (ja)
EP (1) EP2082333A4 (ja)
JP (2) JP2010505208A (ja)
KR (1) KR101425182B1 (ja)
CN (1) CN101523385B (ja)
TW (2) TWI435225B (ja)
WO (1) WO2008039927A2 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8364468B2 (en) * 2006-09-27 2013-01-29 Academia Sinica Typing candidate generating method for enhancing typing efficiency
US7949516B2 (en) 2007-08-31 2011-05-24 Research In Motion Limited Handheld electronic device and method employing logical proximity of characters in spell checking
CN100592249C (zh) * 2007-09-21 2010-02-24 上海汉翔信息技术有限公司 快速输入相关词的方法
US8521516B2 (en) * 2008-03-26 2013-08-27 Google Inc. Linguistic key normalization
US9009591B2 (en) 2008-12-11 2015-04-14 Microsoft Corporation User-specified phrase input learning
JP5476811B2 (ja) * 2009-06-23 2014-04-23 富士ゼロックス株式会社 文書処理装置及びプログラム
JP5204803B2 (ja) * 2010-05-10 2013-06-05 株式会社エヌ・ティ・ティ・ドコモ データ処理装置、入力支援方法及びプログラム
JP5803481B2 (ja) * 2011-09-20 2015-11-04 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP5642037B2 (ja) * 2011-09-22 2014-12-17 株式会社東芝 検索装置、検索方法およびプログラム
US8725497B2 (en) * 2011-10-05 2014-05-13 Daniel M. Wang System and method for detecting and correcting mismatched Chinese character
US8881005B2 (en) * 2012-04-20 2014-11-04 King Abdulaziz City For Science And Technology Methods and systems for large-scale statistical misspelling correction
WO2014138756A1 (en) * 2013-03-07 2014-09-12 Dang Thi Mai Huong System and method for automatic diacritizing vietnamese text
KR101332757B1 (ko) * 2013-05-16 2013-11-25 주식회사 큐키 삭제키 입력 없이 단어 또는 문자열을 수정하는 방법 및 이를 구현한 장치
US9934217B2 (en) * 2013-07-26 2018-04-03 Facebook, Inc. Index for electronic string of symbols
CN104572611A (zh) * 2013-10-17 2015-04-29 阿尔派株式会社 文字输入装置以及文字输入方法
US20160062979A1 (en) * 2014-08-27 2016-03-03 Google Inc. Word classification based on phonetic features
US10558926B2 (en) * 2014-11-20 2020-02-11 Academia Sinica Statistical pattern generation for information extraction
KR101645951B1 (ko) * 2015-02-10 2016-08-05 동국대학교 산학협력단 오타 정정 시스템 및 방법
JP6583686B2 (ja) 2015-06-17 2019-10-02 パナソニックIpマネジメント株式会社 意味情報生成方法、意味情報生成装置、およびプログラム
KR101649914B1 (ko) * 2016-07-20 2016-08-22 동국대학교 산학협력단 오타 정정 시스템 및 방법
CN107783965B (zh) * 2016-08-31 2021-07-02 深圳市青锋全能教育培训有限公司 一种基于句式结构的翻译方法及装置
US10372814B2 (en) 2016-10-18 2019-08-06 International Business Machines Corporation Methods and system for fast, adaptive correction of misspells
US10579729B2 (en) 2016-10-18 2020-03-03 International Business Machines Corporation Methods and system for fast, adaptive correction of misspells
US11869494B2 (en) * 2019-01-10 2024-01-09 International Business Machines Corporation Vowel based generation of phonetically distinguishable words
TWI699674B (zh) * 2019-07-26 2020-07-21 致伸科技股份有限公司 獨立式學習輸入裝置
CN112825111A (zh) * 2019-11-20 2021-05-21 中央研究院 自然语言处理方法与其计算装置
CN112748811A (zh) * 2021-01-21 2021-05-04 李博林 一种英文单词输入方法及装置
US12050873B2 (en) * 2021-10-28 2024-07-30 Sap Se Semantic duplicate normalization and standardization

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59100941A (ja) * 1982-11-30 1984-06-11 Sharp Corp 仮名漢字変換装置
JPH04130578A (ja) * 1990-09-20 1992-05-01 Fujitsu Ltd 未登録語検索方法および装置
JP2000123006A (ja) * 1998-08-10 2000-04-28 Just Syst Corp 文字列変換装置およびその方法
JP2002183128A (ja) * 2000-12-11 2002-06-28 Sharp Corp 文字処理装置
JP2004046359A (ja) * 2002-07-09 2004-02-12 Sharp Corp 手書き入力装置および方法、手書き入力プログラム、並びに、プログラム記録媒体

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6356756A (ja) 1986-08-28 1988-03-11 Sharp Corp コレクト機能付欧文作成装置
JPH01214964A (ja) 1988-02-23 1989-08-29 Sharp Corp コレクト機能付欧文作成装置
DE4323241A1 (de) * 1993-07-12 1995-02-02 Ibm Verfahren und Computersystem zur Suche fehlerhafter Zeichenketten in einem Text
JP3003605B2 (ja) 1996-12-25 2000-01-31 日本電気株式会社 単語修正装置および単語修正方法
US6047300A (en) * 1997-05-15 2000-04-04 Microsoft Corporation System and method for automatically correcting a misspelled word
WO1999017223A1 (en) * 1997-09-30 1999-04-08 Ihc Health Services, Inc. Aprobabilistic system for natural language processing
GB2343037B (en) * 1998-10-22 2002-12-31 Ibm Phonetic spell checker
US6332158B1 (en) * 1998-12-03 2001-12-18 Chris Risley Domain name system lookup allowing intelligent correction of searches and presentation of auxiliary information
US7679534B2 (en) 1998-12-04 2010-03-16 Tegic Communications, Inc. Contextual prediction of user words and user actions
US6262771B1 (en) * 1999-03-04 2001-07-17 Victor Company Of Japan, Ltd. Method and apparatus for converting picture signal, and recording and reproducing apparatus
US7030863B2 (en) 2000-05-26 2006-04-18 America Online, Incorporated Virtual keyboard system with automatic correction
US7750891B2 (en) * 2003-04-09 2010-07-06 Tegic Communications, Inc. Selective input system based on tracking of motion parameters of an input device
US6539421B1 (en) * 1999-09-24 2003-03-25 America Online, Inc. Messaging application user interface
US6848080B1 (en) 1999-11-05 2005-01-25 Microsoft Corporation Language input architecture for converting one text form to another text form with tolerance to spelling, typographical, and conversion errors
US6616704B1 (en) * 2000-09-20 2003-09-09 International Business Machines Corporation Two step method for correcting spelling of a word or phrase in a document
US7117144B2 (en) * 2001-03-31 2006-10-03 Microsoft Corporation Spell checking for text input via reduced keypad keys
US6820075B2 (en) * 2001-08-13 2004-11-16 Xerox Corporation Document-centric system with auto-completion
JP2003223437A (ja) * 2002-01-29 2003-08-08 Internatl Business Mach Corp <Ibm> 正解語の候補の表示方法、スペルチェック方法、コンピュータ装置、プログラム
CA2493443C (en) 2002-07-23 2011-07-19 Research In Motion Limited Systems and methods of building and using custom word lists
US7453439B1 (en) * 2003-01-16 2008-11-18 Forward Input Inc. System and method for continuous stroke word-based text input
US7389233B1 (en) * 2003-09-02 2008-06-17 Verizon Corporate Services Group Inc. Self-organizing speech recognition for information extraction
US8321786B2 (en) * 2004-06-17 2012-11-27 Apple Inc. Routine and interface for correcting electronic text
US7831911B2 (en) * 2006-03-08 2010-11-09 Microsoft Corporation Spell checking system including a phonetic speller
US7797629B2 (en) * 2006-04-05 2010-09-14 Research In Motion Limited Handheld electronic device and method for performing optimized spell checking during text entry by providing a sequentially ordered series of spell-check algorithms
US8364468B2 (en) * 2006-09-27 2013-01-29 Academia Sinica Typing candidate generating method for enhancing typing efficiency

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59100941A (ja) * 1982-11-30 1984-06-11 Sharp Corp 仮名漢字変換装置
JPH04130578A (ja) * 1990-09-20 1992-05-01 Fujitsu Ltd 未登録語検索方法および装置
JP2000123006A (ja) * 1998-08-10 2000-04-28 Just Syst Corp 文字列変換装置およびその方法
JP2002183128A (ja) * 2000-12-11 2002-06-28 Sharp Corp 文字処理装置
JP2004046359A (ja) * 2002-07-09 2004-02-12 Sharp Corp 手書き入力装置および方法、手書き入力プログラム、並びに、プログラム記録媒体

Also Published As

Publication number Publication date
US8364468B2 (en) 2013-01-29
US20130185053A1 (en) 2013-07-18
WO2008039927A3 (en) 2008-12-04
EP2082333A2 (en) 2009-07-29
US20080077396A1 (en) 2008-03-27
CN101523385A (zh) 2009-09-02
KR20090087435A (ko) 2009-08-17
TWI435225B (zh) 2014-04-21
KR101425182B1 (ko) 2014-08-01
CN101523385B (zh) 2011-07-27
TW200816007A (en) 2008-04-01
TW201122850A (en) 2011-07-01
TWI421708B (zh) 2014-01-01
US8594999B2 (en) 2013-11-26
WO2008039927A2 (en) 2008-04-03
JP2010505208A (ja) 2010-02-18
EP2082333A4 (en) 2012-03-14

Similar Documents

Publication Publication Date Title
JP2013117978A (ja) タイピング効率向上のためのタイピング候補の生成方法
JP5997217B2 (ja) 言語変換において複数の読み方の曖昧性を除去する方法
KR101524740B1 (ko) 입력 방법 편집기
US9471566B1 (en) Method and apparatus for converting phonetic language input to written language output
JP4833476B2 (ja) モードレス入力で一方のテキスト形式を他方のテキスト形式に変換する言語入力アーキテクチャ
JP5535417B2 (ja) スペルミス、タイプミス、および変換誤りに耐性のある、あるテキスト形式から別のテキスト形式に変換する言語入力アーキテクチャ
KR101083540B1 (ko) 통계적인 방법을 이용한 한자에 대한 자국어 발음열 변환 시스템 및 방법
CN101133411B (zh) 非罗马字符的容错罗马化输入方法
JP4829901B2 (ja) マニュアルでエントリされた不確定なテキスト入力を音声入力を使用して確定する方法および装置
JP2003514304A5 (ja)
JPH07325828A (ja) 文法チェックシステム
Alkanhal et al. Automatic stochastic arabic spelling correction with emphasis on space insertions and deletions
KR20230009564A (ko) 앙상블 스코어를 이용한 학습 데이터 교정 방법 및 그 장치
JP2000298667A (ja) 構文情報による漢字変換装置
Kaur et al. Spell checker for Punjabi language using deep neural network
Subhagya et al. Data driven approach to sinhala spellchecker and correction
CA2583923C (en) Handheld electronic device and method for performing spell checking during text entry and for providing a spell-check learning feature
JP7102710B2 (ja) 情報生成プログラム、単語抽出プログラム、情報処理装置、情報生成方法及び単語抽出方法
Hasan et al. SweetCoat-2D: Two-Dimensional Bangla Spelling Correction and Suggestion Using Levenshtein Edit Distance and String Matching Algorithm
JP2019159118A (ja) 出力プログラム、情報処理装置及び出力制御方法
CN1323004A (zh) 汉语盲文到汉字的自动转换方法
JPH07325825A (ja) 英文法チェックシステム装置
KR101461062B1 (ko) 로마자 변환을 이용한 일본어 자동 추천 시스템 및 방법
Agarwal A survey of spell checkers for Indian languages
GB2573529A (en) A method and apparatus for determining a spelling correction candidate

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130827

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131127

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20131202

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131227

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140108

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140124

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140617

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140917

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140922

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150120