JP3777477B2 - 単語列入力装置、単語列入力方法、ならびに、プログラム - Google Patents

単語列入力装置、単語列入力方法、ならびに、プログラム Download PDF

Info

Publication number
JP3777477B2
JP3777477B2 JP2001046593A JP2001046593A JP3777477B2 JP 3777477 B2 JP3777477 B2 JP 3777477B2 JP 2001046593 A JP2001046593 A JP 2001046593A JP 2001046593 A JP2001046593 A JP 2001046593A JP 3777477 B2 JP3777477 B2 JP 3777477B2
Authority
JP
Japan
Prior art keywords
word
input
string
key
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001046593A
Other languages
English (en)
Other versions
JP2002251390A (ja
Inventor
久美子 石井
正人 武市
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Todai TLO Ltd
Original Assignee
Todai TLO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Todai TLO Ltd filed Critical Todai TLO Ltd
Priority to JP2001046593A priority Critical patent/JP3777477B2/ja
Publication of JP2002251390A publication Critical patent/JP2002251390A/ja
Application granted granted Critical
Publication of JP3777477B2 publication Critical patent/JP3777477B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Input From Keyboards Or The Like (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、少ないキー操作回数で単語列を入力するのに好適な単語列入力装置、単語列入力方法、ならびに、これらを実現するためのプログラムに関する。
【0002】
【従来の技術】
従来から、各種の単語列を入力する技術が提案されている。
【0003】
日本語の単語列を入力する場合に広く使われている技術には、アルファベット入力を用いて入力したい単語列の読みをローマ字で入力し、これを単語列に変換するものや、0〜9の数字キーを用いて仮名列を入力して、これを単語列に変換するものがある。
【0004】
後者の技術としては、携帯電話やPHS(Personal Handyphone System)においてアドレス帳や電子メールで用いる文字列を入力したり、ページャ(「ポケットベル」ともいう。)への文字メッセージを入力したり、トーン式電話機において番号案内をする際に地名や人名を入力したりするものがあげられる。
【0005】
たとえば、「私も参加しません」の読み「わたしもさんかしません」を入力する際に、携帯電話などでは、1から9、ならびに0の数字キーにあ行〜ら行、ならびに「わ」「を」「ん」が割り当てられている。そこで、以下のように数字キーを押圧操作する。
0 4 33 77777 3 000 2 33 7 3333 000
【0006】
0を1回だけ押圧操作するのは、「わをん」の1番目の文字「わ」を入力する、の意であり、3を2回押圧操作するのは、「さしすせそ」の2番目の文字「し」を入力する、の意である。以下、これをカナ方式と呼ぶ。
【0007】
このほか、以下のような入力方法もある。
01 41 32 75 31 03 21 32 71 34 03
【0008】
01は、0キーに割り当てられた「わをん」のうち1番目の文字「わ」を入力する、の意であり、32は、3キーに割り当てられた「さしすせそ」のうち2番目の文字「し」を入力する、の意である。以下、これをPB方式と呼ぶ。
【0009】
さらに、単語を1つだけ入力する際には、特開平10−124506号公報や特開昭57−185528号公報に開示されるように、子音のみを入力する(五十音表の中で同じ行に属する仮名には同じキーを割り当てる)手法がある。これらに開示された技術を数字キーに置き換えて説明する。この手法では、「私」の読み「わたし」を入力したい場合、以下のように入力する。
0 4 3
【0010】
「わをん」の中の1文字、「たちつてと」の中の1文字、「さしすせそ」の中の1文字からなる単語の候補をあげて、選択させる、というものである。この場合、日本語の単語として有意な組合せは「わたし(私、渡し)」「わたす(渡す)」であるから、ユーザはこれらから1つを選択すればよい。
【0011】
このような入力手法は、NTT西日本が提供する「あんないジョーズ」というサービスにおいて、固有名詞を入力する際にも用いられている(http://www.ntt-west.co.jp/anjozu/等)。以下、これを子音方式と呼ぶ。
【0012】
「わたし」の入力について考えた場合、キーの押圧操作の回数については、子音のみを入力する手法が最も操作回数が少なくてすむ。
【0013】
このほか、英語などのアルファベットで表記される単語を入力する場合は、上記のカナ方式に類似する入力手法が使われているほか、テジック社(http://www.t9.com/)等により子音方式に類似する手法が使われている。
【0014】
たとえば文字「A」「B」「C」が数字キー「2」に、「D」「E」「F」が「3」に、「T」「U」「V」が「8」に、等のようにそれぞれ割り当てられている場合、「EAT」と入力するには、カナ方式に類似する入力手法では、
33 2 8
と入力する。テジック社の手法では、
3 2 8
と入力して、提示される候補「EAT」「DAT」「FAT」などから「EAT」を選択する。このほか、上記割り当てでは、テジック社の手法によると、「2 6 9」が「ANY」「COW」「BOY」「BOX」等に対応することになる。
【0015】
【発明が解決しようとする課題】
しかしながら、特に携帯電話などのようにキーそのものの数が少ない場合には、できるだけキー操作回数を少なくして単語列の入力ができるようにしたい、という要望は大きい。
【0016】
また、家庭用テレビゲーム装置などで用いるコントローラでは、十字に配置されたスイッチやボタン(以下「十字キー」という。)や各種のボタンを用いてプレイヤーからの入力を受け付けるが、コントローラに用意された数少ない十字キーやボタンにより簡単に単語列の入力ができるようにしたい、という要望もある。
【0017】
さらに、キーの数が少なくとも容易に単語列の入力ができるのであれば、携帯電話に限らず、種々のコンピュータを組み込んだ機器においても便利である。たとえば、テレビジョン装置のリモートコントローラ、ケーブルテレビジョン用のセットトップボックス、室内用の固定電話などを用いてインターネットへの接続が可能になるような技術が開発されつつあり、このような技術においても、キーの数が少なくとも容易に単語列の入力ができる手法が望まれている。
【0018】
本発明は、以上のような問題を解決するためになされたもので、少ないキー操作回数で単語列を入力するのに好適な単語列入力装置、単語列入力方法、ならびに、これらを実現するためのプログラムを提供することを目的とする。
【0019】
【課題を解決するための手段】
以上の目的を達成するため、本発明の原理にしたがって、下記の発明を開示する。
【0020】
本発明の第1の観点に係る発明は、単語の読みに含まれる文字の種類よりも少ない数のキーを用いて単語列を入力する単語列入力装置であって、キー入力受付部と、入力キー記憶部と、辞書部と、推定部と、選択入力受付部と、出力部と、クリア部と、を備え、以下のように構成する。
【0021】
すなわち、キー入力受付部は、キーのキー入力を受け付ける。
【0022】
一方、入力キー記憶部は、受け付けられたキー入力の履歴(以下「キー入力履歴」という。)を記憶する。
【0023】
さらに、辞書部は、単語の綴り(以下「単語綴り」という。)と、当該単語の読みの文字列(以下「単語読み」という。)のそれぞれに対応付けられたキーの列(以下「読みキー列」という。)と、を対応付けて記憶する。
【0024】
そして、推定部は、記憶された単語から、記憶されたキー入力履歴に対応する候補単語を推定して提示する。
【0025】
一方、選択入力受付部は、推定されて提示された候補単語からいずれかを選択する選択入力を受け付ける。
【0026】
さらに、出力部は、受け付けられた選択入力により選択された候補単語を記憶されたキー入力履歴に対応する入力結果として出力する。
【0027】
そして、クリア部は、入力結果が出力された場合、記憶されたキー入力履歴をクリアする。
【0028】
また、推定部により推定される候補単語は、当該候補単語の読みキー列全体もしくはその先頭部分列と、当該記憶されたキー入力履歴と、が一致する単語である。
【0029】
一方、推定部は、出力部によりこれまでに入力結果として出力された単語列と、候補単語と、を連接した単語列の情報を、所定のデータ圧縮アルゴリズムによりデータ圧縮するとした場合、そのデータ圧縮率が高くなる順に当該候補単語を提示する。
【0030】
また、本発明の単語列入力装置は、以下のように構成することができる。
【0031】
すなわち、所定の圧縮アルゴリズムは算術符号化圧縮である。
【0032】
一方、推定部は、出力部によりこれまでに入力結果として出力された単語列の文脈により、これに連接される候補単語の出現確率をブレンディング(blending)により推定して、当該推定された出現確率が高い順に当該候補単語を提示する。
【0033】
また、本発明の単語列入力装置は、以下のように構成することができる。
【0034】
すなわち、辞書部は、単語綴りと、当該単語の品詞と、をさらに対応付けて記憶する。
【0035】
一方、出力部によりこれまでに入力結果として出力された単語列について記憶された品詞と、推定部により推定される候補単語の記憶された品詞と、は連接可能である。
【0036】
以上の単語列入力装置は、提示する候補として単語を挙げるものであるが、以下の単語列入力装置は、提示する候補として単語の列を挙げるものである。
【0037】
本発明の単語列入力装置は、以下のように構成することができる。
【0038】
すなわち、推定部は、候補単語にかえて、候補単語列を推定して提示する。
【0039】
一方、選択入力受付部は、候補単語にかえて、推定されて提示された候補単語列からいずれかを選択する選択入力を受け付ける。
【0040】
さらに、出力部は、候補単語にかえて、受け付けられた選択入力により選択された候補単語列を入力結果として出力する。
【0041】
一方、推定部により推定される候補単語列は、当該候補単語列のそれぞれの読みキー列を連接したもの全体もしくはその先頭部分列と、当該記憶されたキー入力履歴と、が一致する単語列である。
【0042】
さらに、推定部は、出力部によりこれまでに入力結果として出力された単語列と、候補単語列と、を連接した単語列の情報を、所定のデータ圧縮アルゴリズムによりデータ圧縮するとした場合、そのデータ圧縮率が高くなる順に当該候補単語列を提示する。
【0043】
また、本発明の単語列入力装置は、以下のように構成することができる。
【0044】
すなわち、辞書部は、単語綴りと、当該単語の品詞と、をさらに対応付けて記憶する。
【0045】
一方、出力部によりこれまでに入力結果として出力された単語列について記憶された品詞と、推定部により推定される候補単語列の先頭の単語について記憶された品詞と、は連接可能である。
【0046】
さらに、当該候補単語列の隣合う単語のそれぞれについて、記憶された品詞同士は、連接可能である。
【0047】
本発明の第2の観点に係る発明は、単語の読みに含まれる文字の種類よりも少ない数のキーを用いて、単語の綴り(以下「単語綴り」という。)と当該単語の読みの文字列(以下「単語読み」という。)のそれぞれに対応付けられたキーの列(以下「読みキー列」という。)とを対応付けて記憶する辞書部を参照して、単語列を入力する単語列入力方法であって、キー入力受付工程と、入力キー記憶工程と、推定工程と、選択入力受付工程と、出力工程と、クリア工程と、を備え、以下のように構成する。
【0048】
すなわち、キー入力受付工程では、キーのキー入力を受け付ける。
【0049】
一方、入力キー記憶工程では、受け付けられたキー入力の履歴(以下「キー入力履歴」という。)を記憶する。
【0050】
さらに、推定工程では、記憶された単語から、記憶されたキー入力履歴に対応する候補単語を推定して提示する。
【0051】
一方、選択入力受付工程では、推定されて提示された候補単語からいずれかを選択する選択入力を受け付ける。
【0052】
さらに、出力工程では、受け付けられた選択入力により選択された候補単語を記憶されたキー入力履歴に対応する入力結果として出力する。
【0053】
そして、クリア工程では、入力結果が出力された場合、記憶されたキー入力履歴をクリアする。
【0054】
ここで、推定工程にて推定される候補単語は、当該候補単語の読みキー列全体もしくはその先頭部分列と、当該記憶されたキー入力履歴と、が一致する単語である。
【0055】
一方、推定工程では、出力工程にてこれまでに入力結果として出力された単語列と、候補単語と、を連接した単語列の情報を、所定のデータ圧縮アルゴリズムによりデータ圧縮するとした場合、そのデータ圧縮率が高くなる順に当該候補単語を提示する。
【0056】
また、本発明の単語列入力方法は、以下のように構成することができる。
【0057】
すなわち、所定の圧縮アルゴリズムは算術符号化圧縮である。
【0058】
一方、推定工程では、出力工程にてこれまでに入力結果として出力された単語列の文脈により、これに連接される候補単語の出現確率をブレンディング(blending)により推定して、当該推定された出現確率が高い順に当該候補単語を提示する。
【0059】
また、本発明の単語列入力方法は、以下のように構成することができる。
【0060】
すなわち、辞書部は、単語綴りと、当該単語の品詞と、をさらに対応付けて記憶する。
【0061】
一方、出力工程にてこれまでに入力結果として出力された単語列について記憶された品詞と、推定工程にて推定される候補単語の記憶された品詞と、は連接可能である。
【0062】
また、本発明の単語列入力方法は、以下のように構成することができる。
【0063】
すなわち、推定工程では、候補単語にかえて、候補単語列を推定して提示する。
【0064】
一方、選択入力受付工程では、候補単語にかえて、推定されて提示された候補単語列からいずれかを選択する選択入力を受け付ける。
【0065】
さらに、出力工程では、候補単語にかえて、受け付けられた選択入力により選択された候補単語列を入力結果として出力する。
【0066】
そして、推定工程にて推定される候補単語列は、当該候補単語列のそれぞれの読みキー列を連接したもの全体もしくはその先頭部分列と、当該記憶されたキー入力履歴と、が一致する単語列である。
【0067】
一方、推定工程では、出力工程にてこれまでに入力結果として出力された単語列と、候補単語列と、を連接した単語列の情報を、所定のデータ圧縮アルゴリズムによりデータ圧縮するとした場合、そのデータ圧縮率が高くなる順に当該候補単語列を提示する。
【0068】
また、本発明の単語列入力方法は、以下のように構成することができる。
【0069】
すなわち、辞書部は、単語綴りと、当該単語の品詞と、をさらに対応付けて記憶する。
【0070】
一方、出力工程にてこれまでに入力結果として出力された単語列について記憶された品詞と、推定工程にて推定される候補単語列の先頭の単語について記憶された品詞と、は連接可能である。
【0071】
さらに、当該候補単語列の隣合う単語のそれぞれについて、記憶された品詞同士は、連接可能である。
【0072】
また、本発明の単語列入力装置ならびに単語列入力方法において、単語読みの各文字が清音の平仮名である場合、五十音表中同じ行に含まれるものに対しては、同じキーを対応付けることにより、単語綴りに読みキー列を対応付けるように構成することができる。
【0073】
たとえば、携帯電話や固定電話などのテンキーに割り当てる場合には、「1」キーにあ行の仮名「あいうえお」、「2」キーにか行の仮名「かきくけこ」、…、「9」キーにら行の仮名「らりるれろ」、「0」キーに「わをん」をそれぞれ割り当てる等、種々の割り当て構成を採用することができる。
【0074】
また、本発明の単語列入力装置ならびに単語列入力方法において、単語読みの各文字が清音の平仮名である場合、五十音表中1つ以上の行に含まれるものに対しては、同じキーを対応付けることにより、単語綴りに読みキー列を対応付けるように構成することができる。
【0075】
たとえば、家庭用テレビゲーム機のコントローラの十字キーなど、4つのスイッチ/ボタンに平仮名の清音を割り当てる場合は、第1のキーに、あ行・か行の仮名、第2のキーに、さ行・た行の仮名、第3のキーに、な行・は行・ま行の仮名、第4のキーに、や行・ら行・わ行の仮名および「ん」をそれぞれ割り当てる等、種々の構成を採用することができる。
【0076】
これらの割り当ては、利用できるキー/スイッチ/ボタンの数や、使用される単語の統計情報などに基づいて、適宜変更することができる。
【0077】
本発明の第3の観点に係るプログラムは、コンピュータ(携帯電話、PHS(Personal Handyphone System)、携帯端末、固定電話家庭用ゲーム機、テレビジョン装置、ケーブルテレビジョン用セットトップボックス、ネットワーク上に配置されたサーバ、並列計算機、ネットワーク端末等、各種の情報処理装置を含む。)を上記単語列入力装置として機能させ、もしくは、コンピュータに、上記単語列入力方法を実行させるように構成する。
【0078】
また、本発明のプログラムは、コンパクトディスク、フロッピーディスク、ハードディスク、光磁気ディスク、ディジタルビデオディスク、磁気テープ、半導体メモリなどの情報記録媒体に記録することができる。
【0079】
また、コンピュータとは独立して、本発明のプログラムを記録した情報記録媒体を配布、販売したり、コンピュータ通信網を介して当該プログラムを配布や販売等することができる。
【0080】
【発明の実施の形態】
以下に本発明の一実施形態を説明する。なお、以下に説明する実施形態は説明のためのものであり、本願発明の範囲を制限するものではない。したがって、当業者であればこれらの各要素もしくは全要素をこれと均等なものに置換した実施形態を採用することが可能であるが、これらの実施形態も本願発明の範囲に含まれる。
【0081】
なお、理解を容易にするため、以下の説明では携帯電話における漢字仮名交じり文のための単語列入力を例として説明するが、アルファベット入力が可能なキーボードを有するコンピュータにおいて子音のみを入力して漢字仮名交じり入力を行う場合や、上記のように、家庭用テレビゲーム機のコントローラの十字キー等さらに限られた数のスイッチ/ボタンに平仮名を割り当てる場合など、種々の構成に同様に適用することができ、これらの実施形態も本発明の範囲に含まれる。
【0082】
さらに、本発明は日本語入力に限られるものではなく、英文などの他の国の言語の入力にも同様に適用でき、これらの実施形態も本発明の範囲に含まれる。
【0083】
(発明の実施形態)
図1は、本発明の一実施形態に係る単語列入力装置の概要構成を示す模式図である。以下、本図を参照して説明する。
【0084】
本実施形態の単語列入力装置101は、キー入力受付部102と、辞書部103と、入力キー記憶部104と、推定部105と、選択入力受付部106と、出力部107と、クリア部108とを備える。
【0085】
ここで、キー入力受付部102は、複数の仮名に対応付けられたキーの入力を受け付ける。キーは1から9まで、ならびに0の数字キーを含み、そのそれぞれに、順に、あ行、か行、さ行、た行、な行、は行、ま行、や行、ら行、わ行の仮名が対応付けられ、これらが押圧操作されることにより当該キーの入力が受け付けられる。
【0086】
図2は、本実施形態の単語列入力装置として機能する典型的な携帯電話の外観を示す説明図である。図2に示すように、携帯電話201の0から9までの数字キー202には、上記のような行の仮名が割り当てられており、その仮名の代表がキートップに印刷されている(図中、2キー、5キー、8キーには、図を見やすくするため、符号の記載を省略)。また、*キー203には濁音・半濁音の記号が割り当てられている。#キー204は、種々の特別な指定をするのに用いることができる。数字キー202と*キー203が、キー入力受付部102に相当する。
【0087】
一方、後述するように、表示された候補からいずれかを選択する場合は、前候補ボタン206と次候補ボタン207を操作して所望の候補にカーソルを合わせてから選択ボタン208を操作する。したがって、前候補ボタン206、次候補ボタン207、選択ボタン208が、選択入力受付部106に相当する。
【0088】
表示部205には、入力されたキーの種類や、提示される候補、入力結果の文字列などが表示される。
【0089】
一方、辞書部103は、各単語について、単語綴りと、読みキー列と、単語読みと、その品詞と、を対応付けて記憶する。
【0090】
図3は、辞書部103の概要構成を示す説明図である。図3に示すように辞書部103には、語句ごとのレコード301が複数記憶され、各レコード301には、単語綴り302と、読みキー列303と、品詞304と、が記憶されている。また、各レコードには、重複しない語句ID(Identifier;識別子)305が付されている。なお、語句IDは省略してもよい。このほか、各単語について、出現頻度などの情報を付加して記憶させてもよい(図示せず)。
【0091】
なお、図3に示す辞書は、いわゆる表形式のデータ構造を採用しているが、これは、理解を容易にするためのものである。したがって、自然言語処理で広く用いられるトライ(trie)構造の辞書や木構造の辞書を用いてもよく、そのような実施形態も本発明の範囲に含まれる。たとえば、順次入力されるキーに応じて分枝するトライ構造の辞書は、最長一致型の日本語変換に適しているため、本実施形態における単語列入力に好適である。
【0092】
このほか、有限状態変換器(Finite State Trasducer;FST)を用いる方法も有効である。FSTは、コンパイラなどの分野でも広く用いられている技法であり、辞書を検索しながら、その過程にともなって様々なアクションを実行できる点で、本実施形態に好適である。
【0093】
また、辞書の検索を高速にするために、ハッシュを用いるのも有効である。ハッシュは、上記の手法と組み合わせることもできる。
【0094】
そして、推定部105は、記憶された単語から、記憶されたキー入力履歴に対応する候補単語を推定して提示する。推定の手法の詳細については、後述する。
【0095】
一方、選択入力受付部106は、推定されて提示された候補単語からいずれかを選択する選択入力を受け付ける。
【0096】
さらに、出力部107は、受け付けられた選択入力により選択された候補単語を記憶されたキー入力履歴に対応する入力結果として出力する。
【0097】
そして、クリア部108は、入力結果が出力された場合、記憶されたキー入力履歴をクリアする。
【0098】
図4は、本実施形態の単語列入力装置101における処理(単語列入力方法の手順)の流れを詳細に示すフローチャートである。以下、本図を参照して説明する。
【0099】
単語列入力装置101は、入力キー記憶部104をクリアし(ステップS401)、ユーザからのキー/ボタン操作入力を受け付ける(ステップS402)。そして、キー/ボタン操作の種類を調べる(ステップS403)。
【0100】
数字キー202もしくは*キー203である場合(ステップS403;数字等)、当該キーを入力キー記憶部104に追加記憶し(ステップS404)、入力キー記憶部104に記憶されたキー入力履歴(入力されたキーの列)と、辞書部103とを参照して、推定部105が単語候補を推定し(ステップS405)、これを提示して(ステップS406)、ステップS402に戻る。
【0101】
推定される候補は、入力キー記憶部104に記憶された入力キー列が読みキー列と一致するもの、もしくは、当該キー入力履歴が読みキー列の先頭部分列と一致するものである。
【0102】
以下、理解を容易にするため、推定技法について説明する前に、まず、この推定技法を用いた場合の入力過程の具体例について、図5を参照して説明する。図5は、入力が行われたときの画面の表示例である。「私は参加しません」を入力したい場合について説明する。
【0103】
ユーザが「0」(わ)を入力した場合には、候補領域501に推定された単語候補「を」「ん」「私」「わけ」「わかり」を提示して、ユーザのキー/ボタン操作を待つ(図5(a))。これらの候補単語の読みキー列は、それぞれ「0」「0」「0 4 3」「0 2」「0 2 9」であるから、いずれも読みキー列の全体もしくは先頭部分列が「0」である。
【0104】
さらにユーザが「4」(た)を入力した場合には、候補領域501に単語候補「私」「を通じて」「話題」「渡辺」「渡し」を提示して、ユーザのキー/ボタン操作を待つ(図5(b))。これらの候補単語の読みキー列は、それぞれ「0 4 3」「0 4 1 3 * 4」「0 4 * 0」「0 4 5 6 *」「0 4 3」であるから、いずれも読みキー列の先頭部分列が「0 4」である。
【0105】
このように、将来入力されるであろうキー列を予想して単語を提示する手法を「補完」と呼ぶ。補完を用いれば、単語の読みキー列をすべて入力しなくとも、よく使われる単語については、候補単語の上位に表示するように、推定部105にて推定を行う。
【0106】
これらの図に示す通り、提示直後は、カーソル502は、候補領域501に表示された最初の候補を指している。
【0107】
また、履歴領域503には、それまでに入力されたキー列、すなわち、入力キー記憶部104に記憶されたキー列が表示される。この履歴表示処理は、候補提示(ステップS406)の際に行う。
【0108】
ユーザのキー/ボタン操作が、選択ボタン208である場合(ステップS403;選択)、現在カーソル502が指している候補を選択し(ステップS407)、これを入力結果として結果領域504に表示出力し(ステップS408)、ステップS401に戻って、入力キー記憶部104をクリアする。したがって、携帯電話201が有するCPUが、出力部107ならびにクリア部108として働く。
【0109】
図5(b)の状態で選択ボタン208を押圧操作すると、結果領域504に「私」が表示され、候補領域501と履歴領域503には何も表示されなくなる(図5(c))。
【0110】
さらに入力を続け、「6」(は)を入力すると、候補に「は」「へ」「ほど」「べき」「ばかり」が表示される(図5(d))ので、これに対してまた選択ボタン208を操作すれば、結果領域504には「私は」が表示される。
【0111】
さらに入力を続け「3」(さ)「0」(ん)「2」(か)を操作すると、候補に「専攻」「審議」「参加」「騒がせ」「参考」が表示される(図5(e))。そこで、前候補ボタン206、次候補ボタン207を操作する。
【0112】
なお、提示される候補単語は5つに限られるわけではない。前候補ボタン206、次候補ボタン207を操作することにより、適宜、前の候補群や次の候補群が表示される、これらの候補群から、所望の単語を選択することが可能である。
【0113】
ユーザのキー/ボタン操作が、前候補ボタン206、次候補ボタン207である場合(ステップS403;前後)、表示された候補に対するカーソル502を移動させて(ステップS409)、ステップS402に戻る。
【0114】
カーソル502を「参加」に合わせた様子を図5(f)に、さらに選択ボタン208を操作した後の様子を図5(g)に、それぞれ示す。以下、同様に、「しません」に相当する数字キー202を押圧操作し、適宜前候補ボタン206、次候補ボタン207、選択ボタン208を操作することにより「しません」も入力することができる(図5(h))。
【0115】
なお、濁音、半濁音を入力しないようなキー割り当てを採用することもできる。たとえば、か行とが行は「2」に、は行とぱ行とば行は「6」に、それぞれ割り当てるような態様である。
【0116】
(推定の技法)
以下では、推定部105で行われる推定の技法について述べる。推定部105は、これまでに入力結果として出力された単語列と、候補単語と、を連接した単語列の情報を、所定のデータ圧縮アルゴリズムによりデータ圧縮するとした場合、そのデータ圧縮率が高くなる順に当該候補単語を提示する。これにより、ユーザがこれまでに入力した情報を適切に利用して、望ましい候補単語を選択しやすくし、キー/ボタン操作の回数を減少させることができる。
【0117】
ここでは、データ圧縮アルゴリズムの一例として算術符号化圧縮をあげる。算術符号化圧縮においては、データ圧縮率を向上させるために、それまでの文脈を考慮して確率の補正を行う手法が研究されている。したがって、この確率の補正の手法を逆に利用することにより、データ圧縮を実際に行わなくとも、もっとも出現確率の高い候補単語がどれかを決めることができる。この手法の一つがPPM(Prediction by Partial Match)の分野で研究されているブレンディング(blending)と呼ばれるものである。
【0118】
なお、本発明には、各種のデータ圧縮アルゴリズムと、これに対応する出現確率の推定の技法を適用することができる。たとえば、文脈ソート法や、ブロックソート法などによるデータ圧縮アルゴリズムの技法を適用することができ、これらの態様も本発明の範囲に含まれる。
【0119】
この手法では、これまでに入力された単語列をs0,s1,…,siとしたときに、ある単語si+1が次に現れる確率P(si+1)を以下の[数1]のように推定する。
【0120】
【数1】
Figure 0003777477
【0121】
ここで、tは、直前t個分の単語si-(t-1)からsiまでに対応する。これを「文脈」と呼ぶ。
【0122】
t = 0の場合は、現在のユーザの詳細な入力履歴ではなく、入力された単語の頻度情報だけを用いる場合に相当する。すなわち、「ユーザが入力した単語の頻度情報のみ」に対応する。
【0123】
t = -1の場合は、「文脈」から情報が全く得られない場合に対応する。この場合は、辞書部103(汎用のユーザに特化していない既定辞書)に記憶された単語の頻度情報を用いることになる。
【0124】
Pt(si+1)は、直前t単語分を考慮した確率である。Ctを、これまでの入力履歴にtに対応する文脈が出現した回数とし、ct(si+1)を、その文脈の後にsi+1が出現した回数とすると、Pt(si+1)は、以下の[数2]のように近似できる。
【0125】
【数2】
Figure 0003777477
【0126】
またutは、直前t単語分を考慮する重みであり、以下の[数3]のように定義され、etのバリエーションによって、PPMA、PPMB、PPMC、PPMC'、DAFC、WORDなどの技法がある。
【0127】
【数3】
Figure 0003777477
【0128】
以下では、PPMAについて述べるが、ほかの手法を採用してもよい。PPMAでは、etを以下の[数4]のように決める。
【0129】
【数4】
Figure 0003777477
【0130】
また、tの上限tmaxは、単語列入力装置の記憶領域の量や計算速度などに応じて適宜決める。上記の入力例、ならびに、後述する実験では、tmax = 4としたが、これは、自然言語研究における5-gramに対応する。
【0131】
候補単語は、それまでの入力結果s0,s1,…,siが得られた後に入力されたキー入力履歴を読みキー列の全体もしくは先頭部分列とする単語である。そこで、この候補単語のそれぞれについて、P(si+1)を求め、これが大きい順に候補単語を提示して、ユーザに選択させることにより、キー/ボタン操作の回数を減少させることができる。
【0132】
これらの入力履歴の確率統計情報は、t = -1については、辞書部103に記憶される。t ≧ 0については、推定部105が別に有する統計記憶部(図示せず)に記憶される。
【0133】
確率を求めるアルゴリズムを適宜変更すると、統計記憶部に記憶された確率統計情報にアクセスして、上記確率を求める手法も異なるが、確率が高い順に候補単語を提示するために、たとえば、動的計画法などの手法を採用することができる。
【0134】
(品詞情報の利用)
上記のように、単語の出現確率のみを用いて候補単語の提示順を決めてもよいが、単語の数が多い場合には、調べなければならない組み合わせが極めて大きくなることがある。品詞情報を用いることにより、これを絞り込んで、候補単語の提示までに要する計算時間を短くすることができる。
【0135】
たとえば、「名詞」と「係助詞」とは連接可能であるから、「私」(名詞)と「も」(係助詞)とは連接可能である。
【0136】
一方、「参加」(サ変動詞語幹)と「ませ」(丁寧助動詞未然形)は、連接ができない。「し」(サ変動詞活用語尾連用形)と「ん」(打消終助詞)も同様である。
【0137】
したがって、これまでに入力した入力結果の単語列s0,s1,…,siの最後の単語siの品詞と連接可能な品詞を有するものを、キー入力履歴と読みキー列の条件を満たす単語からさらに選び出せばよい。
【0138】
(候補単語の提示)
上記実施形態では、「私」を選択すると候補領域501に何も表示されなくなっていたが、PPMを用いれば、次のキーが押されなくとも、それまでの入力結果の履歴やその品詞情報等から、次の候補単語を推定することが可能である。たとえば、PPMの技法を本例について適用すると、「私」に対する次の候補単語には、「、」「の」「。」「に」「は」などがあげられる。
【0139】
そこで、入力キー記憶部104に記憶された文字列の長さが0の場合であっても、次の候補単語を提示してユーザに選択させるような手法を採用してもよい。この場合、さらにユーザの操作回数が減少することが期待される。
【0140】
(候補として単語列をあげる実施形態)
上記実施形態では、補完を用いることにより、候補単語からいずれかを選択して、一単語ごとに入力を行っていた。本実施形態では、候補として1個以上の単語からなる単語列を提示して、ユーザにいずれかを選択させる。
【0141】
ユーザが入力したキー列Nを入力した場合の、ある単語列Wが所望の入力結果である条件付確率P(W)は、当該単語列W = w1,…,wnの品詞の列をT = t1,…,tnとしたときに、以下の[数5]のように表すことができる。
【0142】
【数5】
Figure 0003777477
【0143】
ここで、以下の[数6][数7]のように、近似を行う。
【0144】
【数6】
Figure 0003777477
【0145】
【数7】
Figure 0003777477
【0146】
前者は、単語列w1,…,wn-1、品詞列t1,…,tnである場合に単語wnが出現する条件付確率であり、後者は、単語列w1,…,wn-1、品詞列t1,…,tn-1である場合に単語wnが出現する条件付確率である。このような近似により、P(W)は、以下の[数8]のように変形できる。
【0147】
【数8】
Figure 0003777477
【0148】
これは、品詞の隠れマルコフモデルとなっており、仮名漢字変換でよく用いられる接続コスト最小モデルに、統計学的な意味付けを行ったものである。このようにして得られる単語列を、無限長のデータストリームに対するデータ圧縮アルゴリズムを用いて圧縮した場合、確率P(W)が高ければデータ圧縮率も高い、という関係が成立する。
【0149】
P(ti+1|ti)は、品詞による連接条件を満たす程度に対応し、P(wi|ti)は、当該品詞tiが選ばれた場合の単語wiの出現確率に対応する。したがって、これらの積は、品詞を有する単語列(w1,t1),(w2,t2),…(wn,tn)が最も尤もらしい列となるような候補の確率に対応することになる。
【0150】
本実施形態では、この確率P(W)が高い順に単語列Wを提示する。
【0151】
本実施形態で、「私も参加しません」を入力したい場合を考える。まず、数字キー202で0 4 3 7 3 0 2 3 7 3 0を押圧操作する。さらに、前候補ボタン206、次候補ボタン207を押圧操作することにより推定部105による推定が開始され、候補単語列が表示される。ユーザは、候補単語列の上位に提示されると予想される「私も参加しません」にカーソル502を合わせて選択ボタン208を押圧操作することにより、入力が完了する。
【0152】
なお、この手法に、さらに、上記のPPMの手法を合わせてもよい。[数8]のうち、確率P(wi|ti)に相当する部分を、PPMにより各ユーザごとに特化する。これにより、より正確な推定ができる。すなわち、si = (wi+1,ti+1)のように対応付けを行って、P(wi|ti)としてPPMで予想される確率P(si-1)を適用すれば、ユーザに特化された候補単語列の提示が可能となる。
【0153】
(実験結果)
上記の各手法の有効性を確認するため、毎日新聞の社会面の記事から単語辞書を作成し、PPMに用いるための統計として発明者の一年分の電子メールを用いて、テスト文書(毎日新聞社会面/同経済面)を入力した場合のキー/ボタン操作回数を計測した。
【0154】
上記実施形態のPPMを用いない技法(候補単語列一括提示手法)によれば、従来のカナ方式・PB方式に対して、キー/ボタン操作回数をそれぞれ平均で、39%・15%ずつ減少させることができた。
【0155】
一単語を入力する際に必要なキー/ボタン操作回数について詳細に述べると、テスト文書を社会面としたときは、本実施形態の手法、カナ方式、PB方式について、それぞれ4.14回、6.53回、4.65回であった。また、テスト文書を経済面としたときは、本実施形態の手法、カナ方式、PB方式について、それぞれ4.12回、7.04回、5.05回であった。
【0156】
図6は、上記実施形態のPPMを用いる技法のうち、補完手法・候補単語列一括提示手法と、従来のカナ方式と、のキー/ボタン操作回数を比較するグラフである。
【0157】
グラフ横軸は、PPMに用いるための統計として用いた単語数であり、グラフ縦軸は、キー/ボタン操作回数である。
【0158】
グラフには、PPM・補完を用いた本実施形態の方式(completion-digit)、PPM・候補一括表示の本実施形態の方式(phrase-digit)、PPM・補完を用いたカナ方式(completion-word-kana)、PPM・候補一括表示のカナ方式(phrase-word-kana)がそれぞれ示されている。本グラフから、統計として用いる単語数の数にかかわらず、本実施形態の方式の方が圧倒的に操作回数が少ないことがわかる。
【0159】
また、統計として用いる単語数が1000単語程度であっても、大幅に操作回数を減少させることができる(38%の減少)。また統計として用いる単語数が増えれば操作回数が減少する。15万単語を統計に用いた場合(図示せず)では、55%もの操作回数の減少が見られた。このように、実験により、本発明の技法の有効性が示された。
【0160】
(その他の実施形態)
本発明では、上記の実験で示した通り、比較的少ない数のキーでも、キーの操作回数をかなり減少させて単語列の入力を行うことができる。したがって、もっとキーが少ない場合であっても、入力が可能である。図7は、数字キーがある携帯電話以外に、本発明を適用した場合のキー割り当ての様子を示す説明図である。以下、本図を参照して説明する。
【0161】
図7に示すような家庭用テレビゲーム機のコントローラ701の場合は、十字キー702の上キー702aに、あ行・か行の仮名、右キー702bに、さ行・た行の仮名、下キー702cに、な行・は行・ま行の仮名、左キー702dに、や行・ら行・わ行の仮名および「ん」をそれぞれ割り当てることができる。
【0162】
また、コントローラ701には、キートップが丸いボタンが4つ配置されている。Aボタン703を前候補、Bボタン704を選択、Cボタン705を次候補に割り当てる。Dボタン706は、濁音、半濁音、各種記号を表すキーとする。
【0163】
なお、これらのキー割り当ては、適宜変更することができ、そのような実施形態も本発明の範囲に含まれる。
【0164】
また、このコントローラ701による入力では、キー/ボタンの操作回数は携帯電話201の場合に比べて少々多くなると予想されるが、別途行った実験の結果によれば、ユーザが日本語を入力する際にストレスを感じない程度のキー/ボタン操作回数で済むことがわかっている。また、テレビジョン装置を表示画面として用いるので、より多くの候補を表示することができ、ユーザへの入力負担をできるだけ減らすことができる。
【0165】
また、リモートコントローラを持つテレビジョン装置に本発明を適用する場合には、一般に0〜9の数字キー等を備えることが一般的であるので、上記携帯電話201と同様の割り当てを考えればよい。
【0166】
ケーブルテレビジョンのセットトップボックスそのものや、テレビジョン装置の本体は、一般に、リモートコントローラよりもボタンやスイッチの数が少ないので、上記の家庭用テレビ機のコントローラ701の場合のように、1つのキーに2つ以上の行の平仮名を割り当てればよい。
【0167】
このほか、ディスプレイなどにキーの画像を表示し、これをマウスなどでポイントしてクリックすることにより、物理的なキーの押圧操作にかえる、いわゆるソフトウェアキーボードに対しても、本発明を適用することができ、当該実施形態も本発明の範囲に含まれる。
【0168】
【発明の効果】
以上説明したように、本発明によれば、少ないキー操作回数で単語列を入力するのに好適な単語列入力装置、単語列入力方法、ならびに、これらを実現するためのプログラムを提供することができる。
【図面の簡単な説明】
【図1】 本発明の実施形態に係る単語列入力装置の概要構成を示す模式図である。
【図2】 本発明の実施形態の単語列入力装置として機能する典型的な携帯電話の外観を示す説明図である。
【図3】 辞書部の概要構成を示す説明図である。
【図4】 本発明の実施形態の単語列入力装置における処理(単語列入力処理)の流れを示すフローチャートである。
【図5】 本発明の実施形態の単語列入力装置において入力が行われるときの画面の表示例である。
【図6】 本発明の実施形態の単語列入力装置における各種の技法のキー/ボタン操作回数を示すグラフである。
【図7】 本発明を家庭用ゲーム機のコントローラに適用した場合のキー割当の様子を示す模式図である。
【符号の説明】
101 単語列入力装置
102 キー入力受付部
103 辞書部
104 入力キー記憶部
105 推定部
106 選択入力受付部
107 出力部
108 クリア部
201 携帯電話
202 数字キー
203 *キー
204 #キー
205 表示部
206 前候補ボタン
207 次候補ボタン
208 選択ボタン
301 語句のレコード
302 綴り
303 キー列
304 品詞
305 語句ID
501 候補領域
502 カーソル
503 履歴領域
504 結果領域
701 コントローラ
702 十字キー
702b 右キー
702a 上キー
702c 下キー
702d 左キー
703 Aボタン
704 Bボタン
705 Cボタン
706 Dボタン

Claims (14)

  1. 単語の読みに含まれる文字の種類よりも少ない数のキーを用いてユーザに単語列を入力させ、入力された単語列を出力する単語列入力装置であって
    前記キーのキー入力を受け付けるキー入力受付部、
    前記受け付けられたキー入力の履歴(以下「キー入力履歴」という。)を記憶する入力キー記憶部、
    単語の綴り(以下「単語綴り」という。)と、当該単語の読みの文字列(以下「単語読み」という。)のそれぞれに対応付けられたキーの列(以下「読みキー列」という。)と、を対応付けて記憶する辞書部、
    前記辞書部に記憶された単語から、当該単語の読みキー列全体もしくはその先頭部分列と当該記憶されたキー入力履歴とが一致するものを、候補単語として推定し、当該単語列入力装置によりこれまでに入力結果として出力された単語列に当該推定された候補単語のそれぞれを連接した単語列の情報を、あらかじめ定めたデータ圧縮アルゴリズムによりデータ圧縮した場合のデータ圧縮率の高低を求め、当該データ圧縮率が高い順に当該推定された候補単語を提示する推定部、
    前記推定されて提示された候補単語からいずれかを選択する選択入力を受け付ける選択入力受付部、
    前記受け付けられた選択入力により選択された候補単語を前記記憶されたキー入力履歴に対応する入力結果として出力する出力部、
    前記入力結果が出力された場合、前記記憶されたキー入力履歴をクリアするクリア部
    を備えることを特徴とする単語列入力装置。
  2. 前記単語読みの各文字が清音の平仮名である場合、五十音表中同じ行に含まれるものに対しては、同じキーを対応付けることにより、前記単語綴りに読みキー列を対応付ける
    ことを特徴とする請求項1に記載の単語列入力装置。
  3. 前記単語読みの各文字が清音の平仮名である場合、五十音表中1つ以上の行に含まれるものに対しては、同じキーを対応付けることにより、前記単語綴りに読みキー列を対応付ける
    ことを特徴とする請求項1に記載の単語列入力装置。
  4. 前記あらかじめ定めた圧縮アルゴリズムは算術符号化圧縮であり、
    前記辞書部は、前記単語綴りと、当該単語の出現頻度と、をさらに対応付けて記憶し、
    前記推定部は、前記出力部によりこれまでに入力結果として出力された単語列s 0 s 1 ,…, s i に連接される候補単語 s i+1 について、
    P -1 (s i+1 ) を、候補単語 s i+1 に対応付けて前記記憶部に記憶される出現頻度とし、
    t>0 に対し、 C t を単語列 s i-(t-1) ,…, s i が単語列 s 0 s 1 ,…, s i に出現する回数とし、 c t (s i+1 ) を単語列 s i-(t-1) ,…, s i s i+1 が単語列 s 0 s 1 ,…, s i に出現する回数とし、 P t (s i+1 ) を、 c t (s i+1 )/C t とし、
    P 0 (s i+1 ) を、候補単語 s i+1 が単語列 s 0 s 1 ,…, s i に出現する出現頻度とし、 C 0 i+1 とし、 c 0 (s i+1 ) を候補単語 s i+1 が単語列 s 0 s 1 ,…, s i に出現する回数としたときに、
    あらかじめ定めた上限値 tmax に対して、
    u t = (1-e t ) ×Σ i=t+1 tmax e i
    e t = 1/(C t + 1)
    P t (s i+1 ) = c t (s i+1 )/C t
    P(s i+1 ) = Σ t=-1 tmax u t P t (s i+1 )
    により、単語列 s 0 s 1 ,…, s i に候補単語 s i+1 が連接して出現する出願確率の近似値 P(s i+1 ) を計算し、当該算術符号化圧縮によりデータ圧縮した場合のデータ圧縮率の高低とし て当該計算された出現確率の近似値 P(s i+1 ) の高低を用いて、当該出現確率の近似値が高い順に当該候補単語を提示する
    ことを特徴とする請求項1から3のいずれか1項に記載の単語列入力装置。
  5. 前記辞書部は、前記単語綴りと、当該単語の品詞と、をさらに対応付けて記憶し、
    前記推定部は、前記辞書部に記憶された単語から、前記出力部によりこれまでに入力結果として出力された単語列について前記記憶された品詞に連接可能な品詞に対応付けられて記憶される単語であって、当該単語の読みキー列全体もしくはその先頭部分列と当該記憶されたキー入力履歴とが一致する単語を、候補単語として推定する
    ことを特徴とする請求項1から4のいずれか1項に記載の単語列入力装置。
  6. 前記推定部は、候補単語を推定して提示するのにかえて、前記辞書部に記憶された単語から、単語列であって、当該単語列のそれぞれの読みキー列を連接したもの全体もしくはその先頭部分列と当該記憶されたキー入力履歴とが一致する単語列を、候補単語列として推定し、前記出力部によりこれまでに入力結果として出力された単語列に当該推定された候補単語列のそれぞれを連接した単語列の情報を、あらかじめ定めたデータ圧縮アルゴリズムによりデータ圧縮した場合のデータ圧縮率の高低を求め、当該データ圧縮率が高い順に当該推定された候補単語列を提示し、
    前記選択入力受付部は、候補単語にかえて、前記推定されて提示された候補単語列からいずれかを選択する選択入力を受け付け、
    前記出力部は、候補単語にかえて、前記受け付けられた選択入力により選択された候補単語列を入力結果として出力する
    ことを特徴とする請求項1から4のいずれか1項に記載の単語列入力装置。
  7. 前記辞書部は、前記単語綴りと、当該単語の品詞と、をさらに対応付けて記憶し、
    前記推定部は、前記辞書部に記憶された単語から、前記出力部によりこれまでに入力結果として出力された単語列について前記記憶された品詞に連接可能な品詞に対応付けられて記憶される単語から始まり、隣り合う単語のそれぞれについて前記記憶された品詞同士が連接可能な単語列であって、当該単語列のそれぞれの読みキー列全体もしくはその先頭部分列と当該記憶されたキー入力履歴とが一致する単語列を、候補単語列として推定する
    ことを特徴とする請求項6に記載の単語列入力装置。
  8. 単語の読みに含まれる文字の種類よりも少ない数のキーを用いて、単語の綴り(以下「単語綴り」という。)と当該単語の読みの文字列(以下「単語読み」という。)のそれぞれに対応付けられたキーの列(以下「読みキー列」という。)とを対応付けて記憶する辞書部、キー入力受付部、入力キー記憶部、推定部、選択入力受付部、出力部、クリア部を有する単語列入力装置にて実行され、当該辞書部を参照して、ユーザに単語列を入力させ、入力された単語列を出力する単語列入力方法であって、
    前記キー入力受付部が、前記キーのキー入力を受け付けるキー入力受付工程、
    前記入力キー記憶部が、前記受け付けられたキー入力の履歴(以下「キー入力履歴」という。)を記憶する入力キー記憶工程、
    前記推定部が、前記辞書部に記憶された単語から、当該単語の読みキー列全体もしくはその先頭部分列と当該記憶されたキー入力履歴とが一致するものを、候補単語として推定し、当該単語列入力方法によりこれまでに入力結果として出力された単語列に当該推定された候補単語のそれぞれを連接した単語列の情報を、あらかじめ定めたデータ圧縮アルゴリズムによりデータ圧縮した場合のデータ圧縮率の高低を求め、当該データ圧縮率が高い順に当該推定された候補単語を提示する推定工程、
    前記選択入力受付部が、前記推定されて提示された候補単語からいずれかを選択する選択入力を受け付ける選択入力受付工程、
    前記出力部が、前記受け付けられた選択入力により選択された候補単語を前記記憶されたキー入力履歴に対応する入力結果として出力する出力工程、
    前記入力結果が出力された場合、前記クリア部が、前記記憶されたキー入力履歴をクリアするクリア工程
    を備えることを特徴とする単語列入力方法。
  9. 前記あらかじめ定めた圧縮アルゴリズムは算術符号化圧縮であり、
    前記辞書部は、前記単語綴りと、当該単語の出現頻度と、をさらに対応付けて記憶し、
    前記推定工程では、前記出力工程にてこれまでに入力結果として出力された単語列s 0 s 1 ,…, s i に連接される候補単語 s i+1 について、
    P -1 (s i+1 ) を、候補単語 s i+1 に対応付けて前記記憶部に記憶される出現頻度とし、
    t>0 に対し、 C t を単語列 s i-(t-1) ,…, s i が単語列 s 0 s 1 ,…, s i に出現する回数とし、 c t (s i+1 ) を単語列 s i-(t-1) ,…, s i s i+1 が単語列 s 0 s 1 ,…, s i に出現する回数とし、 P t (s i+1 ) を、 c t (s i+1 )/C t とし、
    P 0 (s i+1 ) を、候補単語 s i+1 が単語列 s 0 s 1 ,…, s i に出現する出現頻度とし、 C 0 i+1 とし、 c 0 (s i+1 ) を候補単語 s i+1 が単語列 s 0 s 1 ,…, s i に出現する回数としたときに、
    あらかじめ定めた上限値 tmax に対して、
    u t = (1-e t ) ×Σ i=t+1 tmax e i
    e t = 1/(C t + 1)
    P t (s i+1 ) = c t (s i+1 )/C t
    P(s i+1 ) = Σ t=-1 tmax u t P t (s i+1 )
    により、単語列 s 0 s 1 ,…, s i に候補単語 s i+1 が連接して出現する出願確率の近似値 P(s i+1 ) を計算し、当該算術符号化圧縮によりデータ圧縮した場合のデータ圧縮率の高低として当該計算された出現確率の近似値 P(s i+1 ) の高低を用いて、当該出現確率の近似値が高い順に当該候補単語を提示する
    ことを特徴とする請求項8に記載の単語列入力方法。
  10. 前記辞書部は、前記単語綴りと、当該単語の品詞と、をさらに対応付けて記憶し、
    前記推定工程では、前記辞書部に記憶された単語から、前記出力工程にてこれまでに入力結果として出力された単語列について前記記憶された品詞に連接可能な品詞に対応付けられて記憶される単語であって、当該単語の読みキー列全体もしくはその先頭部分列と当該記憶されたキー入力履歴とが一致する単語を、候補単語として推定する
    ことを特徴とする請求項8または9に記載の単語列入力方法。
  11. 前記推定工程では、候補単語を推定して提示するのにかえて、前記辞書部に記憶された単語から、単語列であって、当該単語列のそれぞれの読みキー列を連接したもの全体もしくはその先頭部分列と当該記憶されたキー入力履歴とが一致する単語列を、候補単語列として推定し、前記出力工程にてこれまでに入力結果として出力された単語列に当該推定された候補単語列のそれぞれを連接した単語列の情報を、あらかじめ定めたデータ圧縮アルゴリズムによりデータ圧縮した場合のデータ圧縮率の高低を求め、当該データ圧縮率が高い順に当該推定された候補単語列を提示し、
    前記選択入力受付工程では、候補単語にかえて、前記推定されて提示された候補単語列からいずれかを選択する選択入力を受け付け、
    前記出力工程では、候補単語にかえて、前記受け付けられた選択入力により選択された候補単語列を入力結果として出力する
    ことを特徴とする請求項8から10のいずれか1項に記載の単語列入力方法。
  12. 前記辞書部は、前記単語綴りと、当該単語の品詞と、をさらに対応付けて記憶し、
    前記推定工程では、前記辞書部に記憶された単語から、前記出力工程にてこれまでに入力結果として出力された単語列について前記記憶された品詞に連接可能な品詞に対応付けられて記憶される単語から始まり、隣り合う単語のそれぞれについて前記記憶された品詞同士が連接可能な単語列であって、当該単語列のそれぞれの読みキー列全体もしくはその先頭部分列と当該記憶されたキー入力履歴とが一致する単語列を、候補単語列として推定 する
    ことを特徴とする請求項11に記載の単語列入力方法。
  13. コンピュータを、請求項1から7のいずれか1項に記載の単語列入力装置として機能させることを特徴とするプログラム。
  14. コンピュータに、請求項8から12のいずれか1項に記載の単語列入力方法を実行させることを特徴とするプログラム。
JP2001046593A 2001-02-22 2001-02-22 単語列入力装置、単語列入力方法、ならびに、プログラム Expired - Fee Related JP3777477B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001046593A JP3777477B2 (ja) 2001-02-22 2001-02-22 単語列入力装置、単語列入力方法、ならびに、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001046593A JP3777477B2 (ja) 2001-02-22 2001-02-22 単語列入力装置、単語列入力方法、ならびに、プログラム

Publications (2)

Publication Number Publication Date
JP2002251390A JP2002251390A (ja) 2002-09-06
JP3777477B2 true JP3777477B2 (ja) 2006-05-24

Family

ID=18908191

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001046593A Expired - Fee Related JP3777477B2 (ja) 2001-02-22 2001-02-22 単語列入力装置、単語列入力方法、ならびに、プログラム

Country Status (1)

Country Link
JP (1) JP3777477B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR0311817A (pt) * 2002-06-05 2005-04-26 Rongbin Su Método de entrada para otimização da digitação de código de operação para a informação de caracteres universais e sistema de processamento de informação dos mesmos
JP2007025980A (ja) * 2005-07-14 2007-02-01 Ricoh Co Ltd 情報指定システム、情報指定方法、サーバ装置、情報指定装置及び情報指定プログラム
JP5045181B2 (ja) * 2007-03-27 2012-10-10 富士通モバイルコミュニケーションズ株式会社 文字入力装置および文字入力プログラム
US20090058688A1 (en) * 2007-08-27 2009-03-05 Karl Ola Thorn Disambiguation of keypad text entry
JP2009282772A (ja) * 2008-05-22 2009-12-03 Hitachi Ltd 監査証跡ファイル作成方法及びその実施装置
CN109901726B (zh) * 2017-12-08 2022-08-02 北京搜狗科技发展有限公司 一种候选词生成方法、装置及用于候选词生成的装置

Also Published As

Publication number Publication date
JP2002251390A (ja) 2002-09-06

Similar Documents

Publication Publication Date Title
EP2133772B1 (en) Device and method incorporating an improved text input mechanism
US7440889B1 (en) Sentence reconstruction using word ambiguity resolution
US10402493B2 (en) System and method for inputting text into electronic devices
US8893023B2 (en) Method and system for predicting text
US7129932B1 (en) Keyboard for interacting on small devices
JP5501625B2 (ja) 不確定なテキスト入力から明確な文字をフィルタリングする装置及び方法
US6407679B1 (en) System and method for entering text in a virtual environment
US20030023426A1 (en) Japanese language entry mechanism for small keypads
US7007233B1 (en) Device and method for entering a character string
Gong et al. Alphabetically constrained keypad designs for text entry on mobile devices
JP5267450B2 (ja) 電子機器及びプログラム
CA2487614A1 (en) Method for entering text
WO2003056451A1 (fr) Procede de generation de texte et generateur de texte
JP2002333948A (ja) 文字選択方法及び文字選択装置
CN109284358B (zh) 一种中文地址名词分层级的方法和装置
CN101790711A (zh) 键区文本输入的确词
KR20090007343A (ko) 키패드의 멀티캐릭터 키를 사용한 문자 숫자식 데이터 입력장치와 방법
JP3777477B2 (ja) 単語列入力装置、単語列入力方法、ならびに、プログラム
Shieber et al. Abbreviated text input
JP2007156545A (ja) 記号列変換方法、単語翻訳方法、その装置およびそのプログラム並びに記録媒体
Hasselgren et al. HMS: A predictive text entry method using bigrams
Tantug A probabilistic mobile text entry system for agglutinative languages
JP5583230B2 (ja) 情報検索装置及び情報検索方法
JP4423369B2 (ja) 漢字仮名交じり入力装置、漢字仮名交じり入力方法、ならびに、情報記録媒体
CN107846492A (zh) 一种首字母数字混合检索方法及系统

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050414

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050419

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050617

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051124

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060214

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370