JP2015022590A - 文字入力装置、文字入力方法、及び文字入力プログラム - Google Patents

文字入力装置、文字入力方法、及び文字入力プログラム Download PDF

Info

Publication number
JP2015022590A
JP2015022590A JP2013151108A JP2013151108A JP2015022590A JP 2015022590 A JP2015022590 A JP 2015022590A JP 2013151108 A JP2013151108 A JP 2013151108A JP 2013151108 A JP2013151108 A JP 2013151108A JP 2015022590 A JP2015022590 A JP 2015022590A
Authority
JP
Japan
Prior art keywords
notation
word
character
character string
word notation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013151108A
Other languages
English (en)
Inventor
上野 晃嗣
Akitsugu Ueno
晃嗣 上野
朋男 池田
Tomoo Ikeda
朋男 池田
平 芦川
Taira Ashikawa
平 芦川
康太 中田
Kota Nakata
康太 中田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2013151108A priority Critical patent/JP2015022590A/ja
Priority to CN201410337928.9A priority patent/CN104298365A/zh
Priority to US14/333,884 priority patent/US20150025877A1/en
Publication of JP2015022590A publication Critical patent/JP2015022590A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Abstract

【課題】利便性の向上を図ることができる文字入力装置、文字入力方法、及び文字入力プログラムを提供する。【解決手段】実施形態に係る文字入力装置は、第1取得部、決定部、第1生成部、及び出力部を備える。第1取得部は、ユーザからの文字入力を受け付けて、入力文字列を取得する。決定部は、入力文字列から、ユーザの意図する単語表記と単語表記間の接続関係とを推測し、ユーザの意図する表記候補として可能性の高い接続関係を表す経路を決定する。第1生成部は、経路に含まれる単語表記群から、出力する単語表記を抽出し、抽出した単語表記を、表記候補として出力するためのレイアウト情報を生成する。出力部は、レイアウト情報を出力する。【選択図】図1

Description

本発明の実施形態は、文字入力装置、文字入力方法、及び文字入力プログラムに関する。
コンピュータシステムの文字入力では、入力文字列の読みに対して変換操作を行うと、その読みに相当すると考えられる表記候補群が推測結果として提示される。そこで、従来から、変換操作のわずらわしさを軽減する技術が知られている。
特許3949245号 特開2006−146008号公報 特開2010−55505号公報 「日本語入力を支える技術」、徳永 拓之、技術評論社、2012年
しかしながら、従来の技術は、正確な文字入力を行うために、常に入力結果が表示される画面を注視する必要があった。そのため、従来の技術は、ユーザにとって利便性のよいものではない。
実施形態に係る文字入力装置は、第1取得部、決定部、第1生成部、及び出力部を備える。第1取得部は、ユーザからの文字入力を受け付けて、入力文字列を取得する。決定部は、入力文字列から、ユーザの意図する単語表記と単語表記間の接続関係とを推測し、ユーザの意図する表記候補として可能性の高い接続関係を表す経路を決定する。第1生成部は、経路に含まれる単語表記群から、出力する単語表記を抽出し、抽出した単語表記を、表記候補として出力するためのレイアウト情報を生成する。出力部は、レイアウト情報を出力する。
第1の実施形態に係る文字入力装置の機能構成例を示す図。 第1の実施形態に係る入力文字列の例を示す図。 第1の実施形態に係る単語表記リストの例を示す図。 第1の実施形態に係る有向非循環グラフの例を示す図。 第1の実施形態に係るNベスト経路の例を示す図。 第1の実施形態に係る文字入力時の処理例を示すフローチャート。 第1の実施形態に係る単語抽出時の処理例を示すフローチャート。 第1の実施形態に係る単語抽出結果の例を示す図。 第1の実施形態に係るレイアウト情報の出力例を示す図。 第2の実施形態に係る文字入力装置の機能構成例を示す図。 第2の実施形態に係る文字入力時の処理例を示すフローチャート。 第3の実施形態に係るキーパッドの一例を示す図。 第3の実施形態に係る単語表記リストの例を示す図。 第3の実施形態に係る有向非循環グラフの例を示す図。 第3の実施形態に係るNベスト経路の例を示す図。 第3の実施形態に係るレイアウト情報の出力例を示す図。 実施形態に係る文字入力装置の構成例を示す図。
以下に、添付図面を参照して、文字入力装置、文字入力方法、及び文字入力プログラムの実施形態を詳細に説明する。
[第1の実施形態]
<概要>
本実施形態に係る文字入力装置が有する機能(以下「文字入力機能」という)について説明する。本実施形態に係る文字入力装置は、ユーザからの文字入力を受け付けて、入力文字列を取得する。本実施形態に係る文字入力装置は、取得した入力文字列から、ユーザの意図する単語表記と単語表記間の接続関係(組み合わせ)とを推測し、ユーザの意図する表記候補(変換候補)として可能性の高い(確率の高い)単語表記の接続経路を複数決定する。本実施形態に係る文字入力装置は、決定した複数の経路に含まれる単語表記群から、出力する単語表記を抽出する。本実施形態に係る文字入力装置は、ユーザの意図する表記候補として可能性の最も高い組み合わせ経路の単語表記列と、抽出した単語表記とを、表記候補として出力するためのレイアウト情報を生成する。本実施形態に係る文字入力装置は、生成したレイアウト情報を出力する。本実施形態に係る文字入力装置は、このような機能を有している。
コンピュータシステムの文字入力では、入力文字列の読みに対して変換操作を行うと、その読みに相当すると考えられる表記候補群が推測結果として提示される。ユーザは、表示された表記候補群を精読して意図する表記を探し、選択することで入力が確定する。具体的には、例えば日本語の場合、ユーザは、まず、仮名入力やローマ字入力により、ひらがなやカタカナなどの日本語読みに相当する文字列(変換前の文字列)を入力する。その後、ユーザは、所定のキー操作により、入力した日本語読みに対して変換を指示する。その結果、画面には、入力した日本語読みに相当すると考えられる日本語表記が、表記候補群として表示される。これを受けてユーザは、表示された表記候補群の中から、入力した日本語読みに対して意図する日本語表記を探し、該当する日本語表記を画面上で選択する。これにより、日本語の文字入力が確定する。
このような文字入力の操作は、例えば中国語などの多くの文字を有する言語について共通する。また、近年では、表記候補群を推測結果として提示する技術は、例えば携帯電話などの高速入力が困難な環境において、曖昧な入力(省略した入力)から、推測した表記候補を提示し、最終的な入力結果を確定させるといった用途にも応用されている。
このような場面で提示される表記候補は、実用上、文節又は単語ごとに区切られたうえで提示されることが一般的である。しかし、読みに対して提示される文節又は単語区切りや表記候補は、あくまでも入力文字列からの推測結果であり、ユーザの意図とは異なる(推測に誤りがある)可能性がある。例えばユーザが「裏庭には鶏がいる」を意味する日本語表記に変換することを意図して、「うらにわにはにわとりがいる」という日本語読みを入力したとする。この場合、推測精度によっては、表記候補として「裏庭に埴輪取りがいる」が提示される可能性がある。そのため、ユーザは、正確な文字入力の結果を得るために、再度、変換操作をしなおさなければならず、その操作は、ユーザにとってわずらわしいものである。例えば表記候補として「裏庭に埴輪取りがいる」が提示された場合には、変換後の日本語表記「埴輪」に対応する変換前の日本語読み「はにわ」を、「は」と「にわ」で区切りなおし、再変換後の表記候補群から、正しい日本語表記を選択しなければならない。そこで、従来では、このような操作や表記候補群を精読する量を減らすなどの方法で、変換操作のわずらわしさを軽減する技術が提案されている。
しかし、従来の技術では、変換の指示、意図した表記の選択、文節又は単語区切りの修正などの操作が不可欠であり、正確な文字入力を行うために、常に入力結果が表示される画面を注視する必要があった。そのため、例えば会議や講演などの聴講中に(人の話を聞きながら)、意図した表記でメモをとるといった文字入力を行う場合には、会議や講演の内容に集中できない。つまり、このような場面では、変換の指示、意図した表記の選択、文節又は単語区切りの修正などの操作を一切行わず、文字入力を継続できることが望まれる。そのためには、文字変換技術に基づきながら、入力文字列から自動的に高確率で意図した表記を提示する必要がある。しかし、従来の技術では、このような提示環境を提供することが困難であった。このように、従来の技術は、ユーザにとって利便性のよいものではなかった。
そこで、本実施形態に係る文字入力装置は、入力文字列から、ユーザの意図する単語表記と単語表記間の接続関係とを推測し、ユーザの意図する表記候補として可能性の高い接続経路を複数決定する。本実施形態に係る文字入力装置は、決定した複数の接続経路に含まれる単語表記群から、表示する単語表記を抽出する。これにより、本実施形態に係る文字入力装置は、ユーザの意図する表記候補として可能性の高い接続経路の単語表記列と、抽出した単語表記とを、ユーザに提示する仕組みとした。
その結果、本実施形態に係る文字入力装置は、ユーザが、変換の指示、意図した表記の選択、文節又は単語区切りの修正などの操作を一切行わなくても、入力文字列から自動的に高確率で意図した表記を提示することができる。これにより、本実施形態に係る文字入力装置は、ユーザが、例えば聴講中などのような画面を注視することが困難な環境であっても、最低限の注意力で文字入力を効率的に継続可能なサービスを実現できる。つまり、本実施形態に係る文字入力装置は、利便性の向上を図ることができる。
以下に、本実施形態に係る文字入力装置が有する機能の構成とその動作について説明する。なお、本実施形態では、文字入力装置に一般的な情報処理装置を想定し、キーボードを用いて日本語入力を行う利用場面を例に説明を行う。また、以下の説明では、変換前の日本語読みに相当する文字又は文字列を、読み「・」と表し、変換後の日本語表記に相当する文字又は文字列を、表記「・」と表す。
《機能構成》
図1は、本実施形態に係る文字入力装置100の機能構成例を示す図である。図1に示すように、本実施形態に係る文字入力装置100は、入力文字列取得部(第1取得部)11、単語表記リスト生成部(第2生成部)12、異表記取得部(第2取得部)13、及びNベスト経路決定部14を有する。また、本実施形態に係る文字入力装置100は、レイアウト情報生成部(第1生成部)15、意味情報取得部(第3取得部)16、レイアウト制約取得部(第4取得部)17、レイアウト情報出力部18などを有する。
本実施形態に係る入力文字列取得部11は、ユーザが入力した文字列を入力文字列として取得する。本実施形態では、例えばキーボードを用いて入力した変換前の文字列を入力文字列として取得する。
図2は、本実施形態に係る入力文字列CSの例を示す図である。図2には、読み「うらにわにはにわとりがいる」が入力された場合に取得される文字数13の入力文字列CSの例が示されている。
本実施形態に係る単語表記リスト生成部12は、入力文字列CSの読みとなり得るすべての組み合わせの単語を、表記候補の単語表記として保持する単語表記リスト(単語表記情報)を生成する。単語表記リスト生成部12は、入力文字列CSのすべての部分文字列を数える。単語表記リスト生成部12は、部分文字列に対する異なる表記(以下「異表記」という)すべてを取得する。単語表記リスト生成部12は、取得した表記が、入力文字列内のどの部分文字列に該当するのかを表すための情報と、取得した表記とが対応付けられた単語表記リストを生成する。取得した表記が、入力文字列内のどの部分文字列に該当するのかを表すための情報は、入力文字列内において、表記が該当する部分文字列の出現位置を表す数値である。具体的には、該当する部分文字列の先端文字の位置(以下「開始位置」という)と終端文字の位置(以下「終了位置」という)とを表す数値である。つまり、取得した表記が、入力文字列内の何文字目から何文字目に該当するのかを表す数値(入力文字列内における表記の文字範囲を表す数値)に相当する。なお、部分文字列の長さには、例えば16文字などの制限を設けるのが一般的である。
図3は、本実施形態に係る単語表記リストWLの例を示す図である。図3には、読み「うらにわにはにわとりがいる」が入力文字列CSの場合に生成された単語表記リストWLの例が示されている。このとき単語表記リスト生成部12は、読み「う」,読み「うら」,読み「うらに」,読み「うらにわ」,・・・,読み「ら」,読み「らに」,読み「らにわ」,・・・,読み「に」,読み「には」,読み「にはに」,・・・のような部分文字列を数える。これに対して単語表記リスト生成部12は、読み「う」が部分文字列の場合、表記「得」,表記「宇」,・・・などの異なる表記を取得する。また、読み「うら」が部分文字列の場合、表記「裏」,表記「浦」,・・・などの異なる表記を取得する。このとき取得した表記「宇」は、入力文字列内の1文字目の部分文字列に該当する。よって、取得した表記「宇」が、入力文字列内のどの部分文字列に該当するのかを表すための情報は、該当する部分文字列の開始位置と終了位置とを表す数値[1]となる。また、取得した表記「裏」は、入力文字列内の1文字目から2文字目の部分文字列に該当する。よって、取得した表記「裏」が、入力文字列内のどの部分文字列に該当するのかを表すための情報は、該当する部分文字列の開始位置を表す数値[1]と終了位置を表す数値[2]となる。このようなことから、単語表記リスト生成部12は、図3に示すように、表記「宇」に、開始位置[1]と終了位置[1]とが対応付けられた単語表記リストWLaを生成する。また、単語表記リスト生成部12は、表記「裏」に、開始位置[1]と終了位置[2]とが対応付けられた単語表記リストWLbを生成する。
本実施形態に係る異表記取得部13は、部分文字列に対する異表記を取得する。異表記取得部13は、単語表記リスト生成部12から指定された部分文字列の異表記すべてを取得する。このとき異表記取得部13は、例えば読みに対して想定される異表記群が予め登録されているDB(Data Base)にアクセスし、部分文字列の読みをキーにDB検索を行い、検索結果として、該当した登録異表記を取得する。異表記取得部13は、このようにして取得した異表記を単語表記リスト生成部12に渡す。これにより、単語表記リスト生成部12は、部分文字列に対する異表記すべてを取得できる。
本実施形態に係るNベスト経路決定部14は、ユーザの意図する表記候補として可能性の高い(確率の高い)N件(複数)の接続経路(以下「経路」という)を、Nベスト経路として決定する。Nベスト経路決定部14は、入力文字列CSに対してユーザの意図する単語表記と単語表記間の接続関係(組み合わせ)との推測結果から経路を決定する。決定される1つの経路は、単語表記列と、入力文字列内における各単語表記の位置を示す数値とで表される。
また、Nベスト経路決定部14は、単語表記リスト生成部12が生成した単語表記リストWLを有向非循環グラフ(閉路を持たない有向グラフ;DAG:Directed Acyclic Graph)構造として扱う。そこで、Nベスト経路決定部14は、単語表記リストWLを有向非循環グラフ構造として扱う(グラフ化する)ために、次のような操作を行う。
例えばk文字目までの単語の次に来ることができる単語表記は、k+1文字目から開始する単語表記である。また、単語表記リストWLは、各単語表記が、入力文字列内の何文字目から何文字目までに該当するのかを表す数値を含んでいるため、文字の境界ごとに、すべての単語表記間の組み合わせを数えることができる。
このことから、例えば読み「うらにわにはにわとりがいる」の3文字目と4文字目の境界に対しては、読み「に」と読み「わ」,読み「らに」と読み「わ」,読み「うらに」と読み「わ」,読み「に」と読み「わに」,読み「に」と読み「わには」,・・・,読み「らに」と読み「わに」,読み「らに」と読み「わには」,・・・という部分文字列の組み合わせを数えることができる。これにより、各部分文字列を単語の読みと考えたときのすべての異表記についての組み合わせを、表記「二」と表記「羽」,表記「二」と表記「話」,・・・のように数えることができる。
Nベスト経路決定部14は、このような操作を、文字の境界ごとに、すべての単語表記間の組み合わせに対して行い、入力文字列内において該当する文字範囲が増加する方向に単語表記同士を接続する。これにより、Nベスト経路決定部14は、単語表記をノードとし、単語表記間の接続をエッジとした有向非循環グラフGを得る。つまり、Nベスト経路決定部14は、入力文字列CSに対してユーザの意図する単語表記と単語表記間の接続関係とを推測する。
図4は、本実施形態に係る有向非循環グラフGの例を示す図である。図4には、入力文字列CSが「うらにわにはにわとりがいる」の場合に、上記操作により得られた有向非循環グラフGの例が示されている。このようにして得られた有向非循環グラフGの先頭から末尾までを辿る経路は、どの経路も入力文字列CSの表記候補に相当する。
また、Nベスト経路決定部14は、得られた有向非循環グラフGに対して、所定の計算を行い、計算結果から、ユーザの意図する表記候補として可能性の高い(確率の高い)N件の経路を決定する。このとき行う計算(確率の高い経路の計算)には、例えば有向非循環グラフGに対して、単語の出現確率と単語間の接続確率とを、それぞれノードスコアとエッジスコアとして与え、ビタビアルゴリズムを適用する手法(例えば「非特許文献1のp.132〜p.133」に記載の計算手法)が知られている。なお、ノードスコアとして与える単語の出現確率及びエッジスコアとして与える単語間の接続確率は、例えばDBなどに予め登録されているものとする。よって、Nベスト経路決定部14は、DBにアクセスし、単語の出現確率と単語間の接続確率とを取得することで、計算時のノードスコアとエッジスコアとを与えることができる。また、Nベスト経路決定部14は、計算時にビタビアルゴリズムを適用する際、各ノードまでのスコアとそのスコアを与える隣接ノードとを、上位N件について記憶する。これにより、得られる経路を上位N件として容易に拡張できる。このように、Nベスト経路決定部14は、入力文字列CSの読みから推測される組み合わせに従って、単語表記リストWLの単語表記を接続し、接続してできる1つの単語表記列を、接続関係を表す経路の1つとする。Nベスト経路決定部14は、このような経路を、ユーザの意図する表記候補として可能性の高い順に複数決定する。
図5は、本実施形態に係るNベスト経路BRの例を示す図である。図5には、入力文字列CSが「うらにわにはにわとりがいる」の場合に、上記計算手法を用いて決定されたNベスト経路BRの例が示されている。このように、本実施形態では、入力文字列CSから得られた有向非循環グラフGに対する計算結果に基づき、ユーザの意図する表記候補として可能性の高い順に、10件の経路BR1〜BR10をNベスト経路BRとして決定している。そのうち、例えば第1位の経路BR1は、表記「裏庭」,表記「に」,表記「埴輪」,表記「取り」,表記「が」,表記「いる」の6単語を有する単語表記列であり、その中の表記「埴輪」は、入力文字列内の6文字目から8文字目の部分文字列に該当する。
なお、ここまで、上記単語表記リスト生成部12及びNベスト経路決定部14について説明を行ったが、これらの機能部の詳細な動作については、非特許文献1などを参照されたい。
本実施形態に係るレイアウト情報生成部15は、Nベスト経路BRから、表記候補を表示するためのレイアウト情報を生成する。例えばNベスト経路決定部14が決定したN件の経路すべてを表示すると、表記候補として表示する文字量が多くなる。その結果、ユーザが一目で意図する表記を見つけることが困難となる。そこで、本実施形態では、まず、ユーザの意図する表記候補として可能性の最も高い第1位の経路BR1の単語表記列を表示する。次に、残り9件(N−1件)の経路BR2〜BR10(第1位の経路以外の経路)に含まれる単語表記群から、表示する単語表記を抽出し、抽出した単語表記を表示する。これにより、本実施形態に係る文字入力装置100は、表記候補を表示する場合の文字の量と表示領域を、意図した文字列に対して大きすぎない範囲にできる。
そのため、レイアウト情報生成部15は、まず、9件の経路BR2〜BR10に含まれる単語表記群の中から、表示する単語表記を抽出する。このときレイアウト情報生成部15は、次のような方法で抽出を行う。レイアウト情報生成部15は、抽出対象の経路BR2〜BR10を順に参照し、経路に含まれる単語表記群の中から、入力文字列CSの部分文字列に該当する表記を順に取り出す。次にレイアウト情報生成部15は、取り出した表記の品詞種別を判別する。レイアウト情報生成部15は、品詞が助詞や助動詞(不要品詞)の場合、判別した表記を、抽出不要の表記とする。つまり、レイアウト情報生成部15は、品詞が所定の種別品詞である表記を、表記候補として表示しない表記として特定する。
また、レイアウト情報生成部15は、抽出対象の経路BR2〜BR10のうち、異なる経路の単語表記群から取り出した表記の意味情報を取得し、表記同士の意味の近さ(意味的距離)を表す距離を計算する。レイアウト情報生成部15は、距離の近い(意味が近い)表記同士の場合、相対的に可能性の低い経路に含まれる表記を、抽出不要の表記とする。つまり、レイアウト情報生成部15は、距離の計算結果から、意味が同じ表記、又は、意味の近い表記が存在する場合、該当した表記のうち、ユーザの意図する表記候補として可能性の低い経路に含まれる表記を、表記候補として表示しない表記として特定する。なお、表記同士の意味の近さを表す距離の計算には、例えばオントロジーに基づく意味表現とその計算手法(例えば「特許文献3」に記載の計算手法)が知られている。また、単語の意味を、特徴量ベクトル空間の座標で表現し、距離を2点間の空間距離として計算することもできる。
このように、レイアウト情報生成部15は、抽出対象の経路BR2〜BR10に含まれるすべての単語表記の中から、上記条件に基づき抽出不要と判断した表記を削除する。つまり、レイアウト情報生成部15は、複数の経路BR2〜BR10に含まれる単語表記群の中から、表記候補として表示しない(非出力とする)単語表記を特定し、特定した単語表記を削除することで、表記候補として表示する(出力する)単語表記を抽出する。レイアウト情報生成部15は、このようにして抽出した表記(単語)を保持し、表示単語リスト(表示単語情報)を生成する。
その結果、レイアウト情報生成部15は、ユーザの意図する表記候補として可能性の最も高い第1位の経路BR1の単語表記列と、抽出した単語表記とを、表記候補の提示環境に応じて表示するためのレイアウト情報を生成する。このときレイアウト情報生成部15は、表記候補の提示環境におけるレイアウト上の制約が定義されたレイアウト制約を取得する。なお、レイアウト制約は、例えば表記候補を何行以内で表示するのかを表す数値である。よって、レイアウト制約が1の場合には、表記候補を1行で表示することが求められる。レイアウト情報生成部15は、取得したレイアウト制約に基づき、仮想的な画面上における表記候補の文字の表示場所やサイズなどを決定し、決定値に従って、単語表記を表示するためのレイアウト情報を生成する。また、レイアウト情報生成部15は、取得したレイアウト制約に基づき、複数のレイアウト形式(出力形式)から、レイアウト制約を満たす形式を選択し、選択結果(選択した出力形式)に従って、単語表記を表示するためのレイアウト情報を生成する。
本実施形態に係る意味情報取得部16は、表記の意味情報を取得する。意味情報取得部16は、レイアウト情報生成部15から指定された表記の意味情報を取得する。このとき意味情報取得部16は、例えば表記に対して想定される意味情報群が予め登録されているDBにアクセスし、表記をキーにDB検索を行い、検索結果として、該当した登録意味情報を取得する。意味情報取得部16は、このようにして取得した意味情報をレイアウト情報生成部15に渡す。これにより、レイアウト情報生成部15は、表記の意味情報を取得できる。
本実施形態に係るレイアウト制約取得部17は、レイアウト制約を取得する。レイアウト制約取得部17は、レイアウト情報生成部15からの取得指示に従って、レイアウト制約を取得する。レイアウト制約取得部17は、例えばGUI(Graphical User Interface)を介して予め設定されているレイアウト制約の設定値を取得する。レイアウト制約取得部17は、このようにして取得したレイアウト制約をレイアウト情報生成部15に渡す。これにより、レイアウト情報生成部15は、レイアウト制約を取得できる。
本実施形態に係るレイアウト情報出力部18は、レイアウト情報を出力する。レイアウト情報出力部18は、レイアウト情報生成部15が生成したレイアウト情報を、例えばディスプレイなどの表示装置(非図示)に出力する。これにより、ディスプレイには、入力文字列CSに対する表記候補が表示される。また、レイアウト情報出力部18は、例えば表示機能を実現するソフトウェアで実行可能なデータ形式に変換し、変換データを出力するようにしてもよい。例えば表示機能を実現するソフトウェアがWebブラウザの場合には、レイアウト情報をHTML(HyperText Markup Language)形式のデータに変換し、Webブラウザに出力すればよい。
<詳細>
ここからは、本実施形態に係る文字入力装置100の詳細な動作(上記機能部の連携動作)について説明する。
《文字入力時の処理》
図6は、本実施形態に係る文字入力時の処理例を示すフローチャートである。図6には、本実施形態に係る文字入力装置100において、文字入力時に、上記文字入力機能を実現するプログラムが実行された場合の処理例が示されている。また、本実施形態に係る処理は、主に3つの処理に分けられる。具体的には、文字の入力処理A(以下「処理A」という)、単語表記リストWLの生成処理B(以下「処理B」という)、及びNベスト経路BRの決定とレイアウト情報の生成処理C(以下「処理C」という)である。
図6に示すように、本実施形態に係る文字入力装置100は、まず、処理Aを実行する。具体的には、文字入力装置100は、ユーザから、読みとなる文字列の入力を受け付ける(ステップS11)。
これを受けて本実施形態に係る入力文字列取得部11は、ユーザ入力から入力文字列CSを取得する(ステップS12)。ここまでが処理Aに相当する。
次に文字入力装置100は、処理Bを実行する。具体的には、本実施形態に係る単語表記リスト生成部12は、入力文字列CSの部分文字列をすべて数える(ステップS13)。
次に単語表記リスト生成部12は、数えた部分文字列のすべての異表記を数える(ステップS14)。このとき単語表記リスト生成部12は、異表記取得部13を介して、部分文字列に対する異表記すべてを取得し、取得した異表記を数える。
その結果、単語表記リスト生成部12は、すべての部分文字列のすべての異表記と、入力文字列内の出現位置とを対応付けた単語表記リストWLを生成する(ステップS15)。このとき単語表記リスト生成部12は、入力文字列内において、表記が該当する部分文字列の出現位置を表す数値(該当する部分文字列の開始位置と終了位置)を、取得した表記に対応付ける。ここまでが処理Bに相当する。
次に文字入力装置100は、処理Cを実行する。具体的には、本実施形態に係るNベスト経路決定部14は、単語表記リストWLから、ユーザの意図する表記候補として可能性の高いN件の経路を、Nベスト経路BRとして決定する(ステップS16)。このときNベスト経路決定部14は、単語表記リストWLを有向非循環グラフ構造として扱い、入力文字列CSに対してユーザの意図する単語表記と単語表記間の接続関係(組み合わせ)との推測結果から経路を決定する。Nベスト経路決定部14は、まず、単語表記リストWLに含まれる各単語表記の入力文字列内における出現位置を表す数値に基づき、文字の境界ごとに、すべての単語表記間の組み合わせを数える。次にNベスト経路決定部14は、文字の境界ごとに、すべての単語表記間の組み合わせを数え、入力文字列内において該当する文字範囲が増加する方向に単語表記同士を接続する。これにより、Nベスト経路決定部14は、単語表記をノードとし、単語表記間の接続をエッジとした有向非循環グラフGを得ることで、単語表記間の接続関係を推測する。次にNベスト経路決定部14は、得られた有向非循環グラフGに対して、所定の計算を行い、計算結果から、ユーザの意図する表記候補として可能性の高い上位N件の経路を、Nベスト経路BRとして決定する。
次に本実施形態に係るレイアウト情報生成部15は、Nベスト経路BR、単語の意味情報、及びレイアウト制約から、単語表記を表示するためのレイアウト情報を生成する(ステップS17)。このときレイアウト情報生成部15は、第1位の経路以外の9件の経路BR2〜BR10に含まれる単語表記群から、表示する単語表記を抽出し、抽出した表記を保持し、表示単語リストを生成する。レイアウト情報生成部15は、意味情報取得部16を介して、表記の意味情報を取得し、取得した意味情報に基づき、表記同士の意味の近さを表す距離を計算し、距離の近い表記同士の場合、相対的に可能性の高い経路に含まれる表記を抽出する。なお、ステップ17で実行される単語抽出処理については、図7を用いて後述する。これにより、レイアウト情報生成部15は、ユーザの意図する表記候補として可能性の最も高い第1位の経路BR1の単語表記列と、抽出した単語表記とを、表記候補の提示環境に応じて表示するためのレイアウト情報を生成する。このときレイアウト情報生成部15は、レイアウト制約取得部17を介して、表記候補の提示環境のレイアウト制約を取得し、取得したレイアウト制約に基づき、画面上における表記候補の文字の表示場所やサイズなどを決定する。レイアウト情報生成部15は、決定値に従って、単語表記を表示するためのレイアウト情報を生成する。
次に本実施形態に係るレイアウト情報出力部18は、レイアウト情報を出力する(ステップS18)。このときレイアウト情報出力部18は、例えばレイアウト情報を、文字入力装置100に接続される表示装置に転送し、表示を指示する。これにより、表示装置には、レイアウト制約にあった形式で、入力文字列CSに対する表記候補として単語表記が表示される。ここまでが処理Cに相当する。
《単語抽出時の処理》
図7は、本実施形態に係る単語抽出時の処理例を示すフローチャートである。図7には、レイアウト情報生成部15が上記ステップS17で実行する処理例が示されている。なお、以下の処理例では、「うらにわにはにわとりがいる」という13文字の入力文字列CSが取得され、取得された入力文字列CSに対して10件の経路BR1〜BR10が、Nベスト経路BRとして決定された場合を想定している。
本実施形態に係るレイアウト情報生成部15は、変数rを2とし、変数iを1とする(ステップS1701)。なお、変数rは、Nベスト経路BRとして決定された経路を表す変数であり、変数iは、入力文字列CSの文字位置を表す変数である。よって、ステップS1701で、変数rに初期値2を設定することは、ユーザの意図する表記候補として可能性の最も高い第1位の経路以外の残り9件の経路BR2〜BR10を、抽出対象の経路とし、以降の処理で順次参照することを意味する。また、ステップS1701で、変数iに初期値1を設定することは、以降の処理で入力文字列CSの先頭文字から順次参照することを意味する。
次にレイアウト情報生成部15は、第r位の経路に含まれる単語表記群から、入力文字列CSのi番目の文字に該当する単語表記を取り出し、Wriとする(ステップS1702)。なお、ここでいう「Wriとする」とは、取り出した単語表記を、変数Wriに代入することを意味する。
次にレイアウト情報生成部15は、Wriの品詞が不要品詞(助詞又は助動詞)かを判定する(ステップS1703)。レイアウト情報生成部15は、この判定により、不要品詞として判定されたWriを、抽出不要の単語表記と判定する。つまり、この判定条件に該当したWriは、表示する単語表記(表示する表記候補)としない。
よって、レイアウト情報生成部15は、Wriの品詞が不要品詞の場合(ステップS1703:YES)、ステップS1704〜S1710の処理をスキップし、ステップS1711の処理へ移行する。
レイアウト情報生成部15は、Wriの品詞が不要品詞でない場合(ステップS1703:NO)、変数sを1とする(ステップS1704)。なお、変数sは、Nベスト経路BRとして決定された経路を表す変数である。ステップS1704で、変数sを1に設定することは、Nベスト経路BRのうち、第r位の経路より上位の経路を、以降の処理で順次参照することを意味する。
次にレイアウト情報生成部15は、第s位の経路に含まれる単語表記群から、入力文字列CSのi番目の文字に該当する単語表記を取り出し、Wsiとする(ステップS1705)。なお、ここでいう「Wsiとする」とは、取り出した単語表記を、変数Wsiに代入することを意味する。
次にレイアウト情報生成部15は、WriとWsiとの意味の近さを表す距離dを計算する(ステップS1706)。このときレイアウト情報生成部15は、意味情報取得部16を介して、WriとWsiそれぞれの意味情報を取得する。つまり、第r位の経路に含まれる単語表記群から取り出した単語表記と、第s位の経路に含まれる単語表記群から取り出した単語表記、それぞれの意味情報を取得する。また、ここでの距離dの計算は、単語の意味を、特徴量ベクトル空間の座標で表現し、距離を2点間の空間距離として計算する手法を用いている。よって、特徴ベクトル空間上の距離として、スカラー値dが得られたものとする。
次にレイアウト情報生成部15は、距離dの計算結果に基づき、WriとWsiとが同じ表記であるか、又は、距離dが閾値Dminより小さいかを判定する(ステップS1707)。なお、閾値Dminは、表記同士の意味の近さを表す最小距離(意味が近いと判断する基準値)に相当し、予め設定されている。レイアウト情報生成部15は、この判定により、第r位の経路より上位の経路に含まれるWsiと同じWri、又は、Wsiと意味が近いWriを、抽出不要の単語表記と判定する。つまり、この判定条件に該当したWriは、表示する単語表記としない。
よって、レイアウト情報生成部15は、距離dの計算結果に基づき、WriとWsiとが同じ表記であるか、又は、距離dが閾値Dminより小さい場合(ステップS1707:YES)、ステップS1708〜S1710の処理をスキップし、ステップS1711の処理へ移行する。
レイアウト情報生成部15は、WriとWsiとが同じ表記でなく、かつ、距離dが閾値Dmin以上の場合(ステップS1707:NO)、変数sを1増やした場合の値(s+1)が変数rの値より小さいかを判定する(ステップS1708)。
レイアウト情報生成部15は、s+1の値が変数rの値より小さい場合(ステップS1708:YES)、変数sを1増やし(ステップS1709)、ステップS1705の処理へ移行する。これにより、レイアウト情報生成部15は、第r位の経路より上位の経路に対して、取り出した単語表記同士の距離dに基づく上記判定を行い、抽出不要の単語表記について調べる。
一方、レイアウト情報生成部15は、s+1の値が変数rの値以上の場合(ステップS1708:NO)、第r位の経路より上位の経路に対し、抽出不要のWriの調査が終了したとして、Wriを表示単語リストに追加する(ステップS1710)。これにより、レイアウト情報生成部15は、変数Wriに代入した単語表記を、表示する単語表記として抽出する。
次にレイアウト情報生成部15は、変数iを1増やした場合の値(i+1)が変数L以下かを判定する(ステップS1711)。なお、変数Lは、入力文字列CSの文字数を表す値に相当し、本実施形態の場合には13である。
レイアウト情報生成部15は、i+1の値が変数Lの値以下の場合(ステップS1711:YES)、変数iを1増やし(ステップS1712)、ステップS1702の処理へ移行する。これにより、レイアウト情報生成部15は、第r位の経路に含まれる単語表記群から、入力文字列CSのi+1番目の文字に該当する単語表記を取り出し、抽出不要の単語表記を調査し、表示する単語表記を抽出する。
一方、レイアウト情報生成部15は、i+1の値が変数rの値より大きい場合(ステップS1711:NO)、入力文字列CSのすべての文字に対して、第r位の経路に含まれる単語表記群から該当する単語表記の取り出しが終了したとして、ステップS1713の処理へ移行する。
次にレイアウト情報生成部15は、変数rを1増やした場合の値(r+1)が変数N以下かを判定する(ステップS1713)。なお、変数Nは、Nベスト経路BRとして決定された経路の件数を表す値に相当し、本実施形態の場合には10である。
レイアウト情報生成部15は、r+1の値が変数Nの値以下の場合(ステップS1713:YES)、変数rを1増やし、かつ、変数iを1とし(ステップS1714)、ステップS1702の処理へ移行する。第r+1位の経路に含まれる単語表記群から、入力文字列CSのi番目の文字に該当する単語表記を取り出し、抽出不要の単語表記について調べる。
一方、レイアウト情報生成部15は、r+1の値が変数Nの値より大きい場合(ステップS1713:NO)、抽出対象の9件の経路BR2〜BR10に対して、抽出不要の単語表記を調査し、表示する単語表記の抽出が終了したとして、処理を終了する。
(単語抽出結果)
図8は、本実施形態に係る単語抽出結果の例を示す図である。図8には、図7に示す処理により、Nベスト経路BRのうち、抽出対象の経路BR2〜BR10に含まれる単語表記群から、表示する単語表記が抽出された結果の例が示されている。なお、第1位の経路BR1は、ユーザの意図する表記候補として可能性の最も高い経路に相当することから、抽出対象ではない。
図8でハッチングにより表された箇所の単語表記は、図7に示す処理により、表示する単語表記として抽出されなかった単語表記(表記候補として表示しない表記)に該当する。具体的には、次の通りである。
第2位の経路BR2では、表記「に」,表記「が」が、不要品詞であることから、抽出されなかった単語表記に該当する。また、第2位の経路BR2では、表記「裏庭」,表記「埴輪」,表記「いる」が、上位の経路BR1に含まれる単語表記群の表記と同じ表記であることから、抽出されなかった単語表記に該当する。
第3位の経路BR3では、表記「には」,表記「が」が、不要品詞であることから、抽出されなかった単語表記に該当する。また、第3位の経路BR3では、表記「裏庭」,表記「いる」が、上位の経路BR1,2に含まれる単語表記群の表記と同じ表記であることから、抽出されなかった単語表記に該当する。
第4位の経路BR4では、表記「には」,表記「が」が、不要品詞であることから、抽出されなかった単語表記に該当する。また、第4位の経路BR4では、表記「裏庭」,表記「いる」が、上位の経路BR1に含まれる単語表記群の表記と同じ表記であることから、抽出されなかった単語表記に該当する。また、第4位の経路BR4では、表記「鳥」が、上位の経路BR3に含まれる単語表記群の表記「鶏」と意味が近い表記であることから、抽出されなかった単語表記に該当する。
第5位の経路BR5では、表記「には」,表記「が」が、不要品詞であることから、抽出されなかった単語表記に該当する。また、第5位の経路BR5では、表記「裏庭」,表記「二羽」,表記「いる」が、上位の経路BR1,4に含まれる単語表記群の表記と同じ表記であることから、抽出されなかった単語表記に該当する。また、第5位の経路BR5では、表記「トリ」が、上位の経路BR3に含まれる単語表記群の表記「鶏」と意味が近い表記であることから、抽出されなかった単語表記に該当する。
第6位の経路BR6では、表記「には」,表記「が」が、不要品詞であることから、抽出されなかった単語表記に該当する。また、第6位の経路BR6では、表記「裏庭」,表記「二羽」,表記「鶏」,表記「いる」が、上位の経路BR1,3,4に含まれる単語表記群の表記と同じ表記であることから、抽出されなかった単語表記に該当する。
第7位の経路BR7では、表記「に」,表記「は」,表記「が」が、不要品詞であることから、抽出されなかった単語表記に該当する。また、第7位の経路BR7では、表記「鶏」,表記「いる」が、上位の経路BR1,3に含まれる単語表記群の表記と同じ表記でることから、抽出されなかった単語表記に該当する。また、第7位の経路BR7では、表記「裏」が、上位の経路BR1に含まれる単語表記群の表記「裏庭」と意味が近い表記であることから、抽出されなかった単語表記に該当する。
第8位の経路BR8では、表記「に」,表記「は」,表記「が」が、不要品詞であることから、抽出されなかった単語表記に該当する。また、第8位の経路BR8では、表記「裏」,表記「ワニ」,表記「二羽」,表記「鳥」,表記「いる」が、上位の経路BR1,4,7に含まれる単語表記群の表記と同じ表記であることから、抽出されなかった単語表記に該当する。
第9位の経路BR9では、表記「に」,表記「は」,表記「が」が、不要品詞であることから、抽出されなかった単語表記に該当する。また、第9位の経路BR9では、表記「裏」,表記「ワニ」,表記「二羽」,表記「トリ」,表記「いる」が、上位の経路BR1,4,5,7に含まれる単語表記群の表記と同じ表記であることから、抽出されなかった単語表記に該当する。
第10位の経路BR10では、表記「に」,表記「は」,表記「が」が、不要品詞であることから、抽出されなかった単語表記に該当する。また、第10位の経路BR10では、表記「裏」,表記「ワニ」,表記「二羽」,表記「鶏」,表記「いる」が、上位の経路BR1,3,4,7に含まれる単語表記群の表記と同じ表記であることから、抽出されなかった単語表記に該当する。
このように、本実施形態では、図7に示す処理により、抽出対象の経路BR2〜BR10に含まれる単語表記群から、第2位の経路BR2に含まれる表記「撮り」、第3位の経路BR3に含まれる表記「鶏」、第4位の経路BR4に含まれる表記「二羽」、及び第7位の経路BR7に含まれる表記「ワニ」が、表示する単語表記として抽出される。
(レイアウト情報の出力結果)
図9は、本実施形態に係るレイアウト情報の出力例を示す図である。図9には、図8に示す単語表記の抽出結果に基づくレイアウト情報が画面に表示された結果の例が示されている。
図9に示すように、画面には、ユーザの意図する表記候補として可能性の最も高い第1位の経路BR1の単語表記列と、抽出した単語表記とが、表記候補として表示される。このとき、抽出した単語表記のレイアウト形式には、例えば次のような形式がある。本実施形態では、4つのレイアウト形式例を挙げる。
図9(A)〜(C)には、第1位の経路BR1の単語表記列と抽出した単語表記とを2行で表示するレイアウト形式の例が示されている。
具体的には、図9(A)には、抽出した単語表記の文字を、第1位の経路BR1の単語表記列の文字より小さいフォントで表示するレイアウト形式の例が示されている。第1位の経路BR1の単語表記列「裏庭に埴輪取りがいる」に比べて、抽出した単語表記の表記「ワニ」,表記「二羽」,表記「鶏」,表記「撮り」が小さく表示されている。
図9(B)には、さらに、上位の経路から抽出した単語表記の文字を、下位の経路から抽出した単語表記より大きいフォントで表示するレイアウト形式の例が示されている。第7位、第4位の経路BR7,BR4から抽出した単語表記の表記「ワニ」,表記「二羽」に比べて、第3位、第2位の経路BR3,BR2から抽出した単語表記の表記「鶏」,表記「撮り」が大きく表示されている。
図9(C)には、さらに、抽出した単語表記において、文字数の少ない単語表記を、文字数の多い単語表記より大きいフォントで表示するレイアウト形式の例が示されている。第2位の経路BR2から抽出した単語表記の2文字の表記「撮り」に比べて、第3位の経路BR3から抽出した単語表記の1文字の表記「鶏」が大きく表示されている。
このように、図9(A)〜(C)には、第1位の経路BR1の単語表記列と、第2位以下の経路BR2〜BR10から抽出した単語表記とを、異なる態様で表示する例が示されている。
一方、図9(D)には、第1位の経路BR1の単語表記列と、抽出した単語表記とを1行で表示するレイアウト形式の例が示されている。この場合、抽出した単語表記は、第1位の経路BR1の各単語表記のうち、入力文字列内の出現位置が最も近い表記の後ろに、括弧書きで表示する。
このように、本実施形態では、表記候補の提示環境のレイアウト制約に基づき、上記レイアウト形式から、レイアウト制約を満たす形式が選択され、選択結果に従って、レイアウト情報が出力され、単語表記が表示される。
<まとめ>
以上のように、本実施形態に係る文字入力装置100によれば、入力文字列取得部11が、ユーザからの文字入力を受け付けて、入力文字列CSを取得する。次に文字入力装置100は、単語表記リスト生成部12が、入力文字列CSの読みとなり得るすべての組み合わせの単語を単語表記リストWLとして生成する。次に文字入力装置100は、Nベスト経路決定部14が、単語表記リストWLを有向非循環グラフ構造として扱い、ユーザの意図する単語表記と単語表記間の接続関係(組み合わせ)とを推測し、ユーザの意図する表記候補として可能性の高い(確率の高い)Nベスト経路BRを決定する。次に文字入力装置100は、レイアウト情報生成部15が、Nベスト経路BRに含まれる単語表記群から、表示する単語表記を抽出し、ユーザの意図する表記候補(変換候補)として可能性の最も高い第1位の経路BR1の単語表記列と、抽出した単語表記とを、表記候補として表示するためのレイアウト情報を生成する。その結果、文字入力装置100は、レイアウト情報出力部18が、レイアウト情報を出力する。
これによって、本実施形態に係る文字入力装置100は、ユーザが意図する可能性の最も高い単語表記列と、表示する単語表記とを表示し、入力文字列CSに対する表記候補を提示可能な環境を提供する。その結果、本実施形態に係る文字入力装置100は、ユーザが、変換の指示、意図した表記の選択、文節又は単語区切りの修正などの操作を一切行わなくても、入力文字列CSから自動的に高確率で意図した表記を提示することができる。これにより、本実施形態に係る文字入力装置100は、ユーザが、例えば聴講中などのような画面を注視することが困難な環境であっても、最低限の注意力で文字入力を効率的に継続可能なサービスを実現できる。つまり、本実施形態に係る文字入力装置100は、利便性の向上を図ることができる。
[第2の実施形態]
<概要>
ユーザは、例えば会議や講義などで、人の話を聞きながら、メモをとるといった文字入力を行う。このような利用場面では、より高速な文字入力が望まれる。そこで、本実施形態では、文節又は単語の文字を最後まで入力することなく、次の文節又は単語の入力に移行できる技術を提案する。これにより、本実施形態に係る文字入力装置は、上記実施形態と同様の効果を奏するとともに、ユーザに対して、高速な文字入力が可能な環境を提供できる。なお、以降の説明は、上記実施形態と異なる事項について説明し、同じ事項については、同一参照符号を付し、その説明を簡略又は省略する。
本実施形態に係る文字入力装置100が有する文字入力機能について説明する。本実施形態に係る文字入力装置100は、ユーザからの文字入力を受け付けて、入力文字列CSを取得する。本実施形態に係る文字入力装置100は、取得した入力文字列CSに対し、ユーザから指示された文字位置に、文字入力を打ち切ったことを表す記号を挿入する。本実施形態に係る文字入力装置100は、文字入力を打ち切ったことを表す記号が挿入された入力文字列CSから、ユーザの意図する単語表記と単語表記間の接続関係(組み合わせ)とを推測し、ユーザの意図する表記候補として可能性の高い(確率の高い)Nベスト経路BRを決定する。本実施形態に係る文字入力装置100は、Nベスト経路BRに含まれる単語表記群から、表示する単語表記を抽出する。本実施形態に係る文字入力装置100は、ユーザの意図する表記候補(変換候補)として可能性の最も高い第1位の経路BR1の単語表記列と、抽出した単語表記とを、表記候補として表示するためのレイアウト情報を生成する。本実施形態に係る文字入力装置100は、レイアウト情報を出力する。本実施形態に係る文字入力装置100は、このような機能を有している。
以下に、本実施形態に係る文字入力装置100が有する機能の構成とその動作について説明する。なお、本実施形態では、文字入力装置100に一般的な情報処理装置を想定し、キーボードを用いて日本語入力を行う利用場面を例に説明を行う。また、本実施形態では、ユーザから入力される文字列を「うらに|にわと|いる」とする。これは、ユーザが「うらにわにはにわとりがいる」を入力したいときに、文節又は単語の文字を最後まで入力することなく、次の文節又は単語の入力に移行した場合の入力例に相当する。なお、文中の‘|’は、文字入力を打ち切ったことを表す記号(以下便宜上「終端記号」という)に相当する。
《機能構成》
図10は、本実施形態に係る文字入力装置100の機能構成例を示す図である。図10に示すように、本実施形態に係る文字入力装置100は、上記実施形態で説明を行った機能部に加えて、終端指示受付部21、終端挿入部22、及び前方一致異表記取得部(第5取得部)23などを有する。
本実施形態に係る終端指示受付部21は、ユーザから文字入力の終端指示を受け付ける。本実施形態では、ユーザが現在入力中の文節又は単語の入力を途中で打ち切り、次の文節又は単語の入力を始めたいときに、例えばキーボードの所定キーが押下されたことを受けて、文字入力の終端指示を受け付ける。つまり、終端指示受付部21は、文字入力の打ち切る指示を受け付ける。
本実施形態に係る終端挿入部22は、入力文字列CSに終端記号を挿入する。終端挿入部22は、ユーザから指示された終端の文字位置に、終端記号を挿入する。終端記号は、例えば‘0x01’のような任意のバイト列に相当する。また、入力文字列CSの文字位置を記録する情報(テーブル)に、終端の文字位置を表すポインタ(例えば「3文字目」など)を挿入するようにしてもよい。
本実施形態に係る単語表記リスト生成部12は、入力文字列CSの読みとなり得るすべての組み合わせの単語を単語表記リストとして生成する。このとき単語表記リスト生成部12は、入力文字列CSのすべての部分文字列を数える。本実施形態では、部分文字列を数えるときの入力文字列内の文字の扱い方が、上記実施形態と異なる。具体的には、単語表記リスト生成部12は、部分文字列を数えるときに、挿入後の終端記号も文字として扱う。また、単語表記リスト生成部12は、部分文字列を数える範囲を、終端を超えない範囲とする。これにより、単語表記リスト生成部12は、例えば「う」「うら」「うらに」「うらに|」のような部分文字列を数え、「うらに|に」を数えない。また、単語表記リスト生成部12は、部分文字列に対する異表記すべてを取得する。本実施形態では、異表記を取得するときの部分文字列の文字の扱い方が、上記実施形態と異なる。具体的には、単語表記リスト生成部12は、終端記号を含む部分文字列(終端記号が終端の文字となる部分文字列)から、終端記号を取り除き(削除し)、取り除いた文字列から始まる異表記(前方一致する異表記)を取得する。これにより、単語表記リスト生成部12は、例えば「うらに|」から‘|’を取り除き、「裏庭」などの前方一致する表記(取り除いた文字列で始まる表記)を取得する。なお、単語表記リスト生成部12は、終端記号を含まない部分文字列に対して、上記実施形態と同様の方法で(異表記取得部13を介して)異表記を取得する。
本実施形態に係る前方一致異表記取得部23は、終端記号を取り除いた文字列に対して前方一致する異表記を取得する。前方一致異表記取得部23は、単語表記リスト生成部12から指定された文字列(終端記号が取り除かれた文字列)の異表記すべてを取得する。このとき前方一致異表記取得部23は、例えば読みに対して想定される異表記群が予め登録されているDBにアクセスし、前方一致によるDB検索を行い、検索結果として、該当した登録異表記を取得する。膨大な単語群から前方一致する表記を高速に検索する手法には、例えばトライ木データ構造を用いて高速検索する手法(例えば「非特許文献1のp.98〜p.93」に記載の計算手法)が知られている。前方一致異表記取得部23は、このようにして取得した異表記を単語表記リスト生成部12に渡す。これにより、単語表記リスト生成部12は、文字列に対して前方一致した異表記すべてを取得できる。
なお、本実施形態に係るNベスト経路決定部14、レイアウト情報生成部15、意味情報取得部16、レイアウト制約取得部17、及びレイアウト情報出力部18は、上記実施形態と同様の動作を行う。
<詳細>
ここからは、本実施形態に係る文字入力装置100の詳細な動作(上記機能部の連携動作)について説明する。
《文字入力時の処理》
図11は、本実施形態に係る文字入力時の処理例を示すフローチャートである。図11には、本実施形態に係る文字入力装置100において、文字入力時に、上記文字入力機能を実現するプログラムが実行された場合の処理例が示されている。また、本実施形態に係る処理は、上記実施形態と同様に、主に3つの処理に分けられる。具体的には、文字の入力処理A(以下「処理A」という)、単語表記リストWLの生成処理B(以下「処理B」という)、及びNベスト経路BRの決定とレイアウト情報の生成処理C(以下「処理C」という)である。そのうち、上記実施形態と異なる処理は、処理A,Bである。よって、以下には、処理A,Bを説明し、処理Cの説明は省略する。
図11に示すように、本実施形態に係る文字入力装置100は、まず、処理Aを実行する。具体的には、文字入力装置100は、ユーザから、読みとなる文字列の入力を受け付ける(ステップS21)。
これを受けて本実施形態に係る入力文字列取得部11は、ユーザ入力から入力文字列CSを取得する(ステップS22)。
次に本実施形態に係る終端指示受付部21は、ユーザから文字入力の終端指示を受け付けたかを判定する(ステップS23)。このとき終端指示受付部21は、例えばキーボードの所定キーの押下イベントの発生有無に基づき、終端指示を受け付けたかを判定する。
終端指示受付部21は、文字入力の終端指示を受け付けると(ステップS23:YES)、受け付けた終端指示を終端挿入部22に伝達する。
これを受けて本実施形態に係る終端挿入部22は、終端指示に従って、入力文字列CSに終端九号を挿入する(ステップS24)。このとき終端挿入部22は、入力文字列CSに対し、ユーザから指示された終端の文字位置に、終端記号を挿入する。ここまでが処理Aに相当する。
次に文字入力装置100は、処理B1を実行する。具体的には、本実施形態に係る単語表記リスト生成部12は、終端を超えないように、入力文字列CSの部分文字列をすべて数える(ステップS25)。このとき単語表記リスト生成部12は、入力文字列CSに挿入された1又は複数の終端記号に基づき、次のように部分文字列を数える。単語表記リスト生成部12は、まず、入力文字列CSの先頭の文字から最初に出現する第1終端記号までの第1文字列の部分文字列を数える。次に単語表記リスト生成部12は、第1終端記号の次の文字から次に出現する第2終端記号までの第2文字列の部分文字列を数える。このように、単語表記リスト生成部12は、部分文字列を数える範囲を、終端を超えない範囲として数える。最後に、単語表記リスト生成部12は、最後に出現した第n終端記号の次の文字から入力文字列CSの終端の文字までの第n+1文字列の部分文字列を数える。その結果、単語表記リスト生成部12は、入力文字列CSが終端記号に従って分割された複数の文字列ごとの部分文字列をすべて数える。
次に単語表記リスト生成部12は、処理B11を実行する。単語表記リスト生成部12は、分割された複数の文字列ごとに数えたすべての部分文字列に対して、処理B11を実行する。具体的には、単語表記リスト生成部12は、数えた部分文字列に、終端記号が含まれているかを判定する(ステップS26)。このとき単語表記リスト生成部12は、部分文字列の終端の文字を参照し、参照した文字が終端記号か否かに基づき、終端記号が含まれているかを判定する。
単語表記リスト生成部12は、部分文字列に、終端記号が含まれている場合(ステップS26:YES)、該当した部分文字列から終端記号を取り除き、取り除いた文字列で始まるすべての異表記(前方一致するすべての異表記)を数える(ステップS27)。このとき単語表記リスト生成部12は、前方一致異表記取得部23を介して、終端記号が取り除かれた文字列に対して前方一致した異表記すべてを取得し、取得した異表記を数える。
一方、単語表記リスト生成部12は、部分文字列に、終端記号が含まれていない場合(ステップS26:NO)、該当した部分文字列のすべての異表記を数える(ステップS28)。このとき単語表記リスト生成部12は、異表記取得部13を介して、部分文字列に対する異表記すべてを取得し、取得した異表記を数える。ここまでが処理B11に相当し、処理B1に相当する。
一方、文字入力装置100は、終端指示受付部21により、文字入力の終端指示を受け付けなければ(ステップS23:NO)、処理B2を実行する。具体的には、本実施形態に係る単語表記リスト生成部12は、入力文字列CSの部分文字列をすべて数え(ステップS31)、数えた部分文字列のすべての異表記を数える(ステップS32)。ここまでが処理B2に相当し、処理B2は、上記実施形態で示した図6のステップS13,S14の処理に相当する。
その結果、単語表記リスト生成部12は、すべての部分文字列のすべての異表記と、入力文字列内の出現位置とを対応付けた単語表記リストWLを生成する(ステップS29)。このとき単語表記リスト生成部12は、入力文字列内において、表記が該当する部分文字列の出現位置を表す数値(該当する部分文字列の開始位置と終了位置)を、取得した表記に対応付ける。ここまでが処理Bに相当する。
次に文字入力装置100は、処理Cを実行する。具体的には、上記実施形態で示した図6のステップS16〜S18の処理である。
[第3の実施形態]
第1および第2の実施形態とは異なり、本実施形態では携帯電話のキーパッドによる英語文の入力について考える。ここでは代表的な省入力方式であるシングルタップ入力方式を用いる。シングルタップ入力方式においては、通常、ユーザが入力したい単語の各文字に相当するキーを一度だけ入力すると、システムはそのキーの組み合わせから考えられる単語を提示し、ユーザに選択させる。しかし、本発明においてはユーザが選択を行う必要は無く、ユーザが入力した可能性が高い文章が自動的に表示される。
全体のフローは第1の実施形態と同様に図1に沿って処理されるため、第1の実施形態との共通部分については説明を省略する。
図12は、本実施形態で扱う携帯電話のキーパッドの一例を示す図である。例えば「2」キーには、「A」、「B」および「C」の文字が割り当てられている。キー割り当ては実際にはどのような割り当てであってもよい。また、図示しないスペースキーまたは右カーソルキー等により、スペースを入力できるものとする。
図13は、本実施形態に係る単語表記リストの例を示す図である。図13は、シングルタップ入力方式によって「843_78425_27696_369_58677_6837_843_5299_364」の数字列が入力された場合に、単語表記リスト生成部12が生成する単語表記リストの例である。ただし、ここでは単語間では必ずスペースを入力したものとして扱う。従って、各単語の始点は文頭かスペース直後に限られる。また、各単語の終点は文末かスペース直前に限られる。
図14は、Nベスト経路決定部14が単語表記リストから内部的に構築した有向非循環グラフの一例を示す図である。Nベスト経路決定部14は、さらにNベスト経路を導出し、図3で既に説明した方法に沿って単語を削減する。図15は、単語を削減したNベスト経路の一例を示す図である。図16は、この削減結果から生成されたレイアウト情報に従った表示結果の一例を示す図である。図16の例では、図15の1行目に記載された第1位の経路である「the quick brown fox jumps over the lazy dog」に対し、図15の2行目以降に記載された第2位以下の経路に登場し、削除されなかった単語が、順位に応じたフォントの大きさで表示される。
本実施形態によれば、携帯電話上の英語の省入力においても、候補選択を行うことなく、ユーザが所望する表示を得ることができる。
<まとめ>
以上のように、本実施形態に係る文字入力装置100によれば、入力文字列取得部11が、ユーザからの文字入力を受け付けて、入力文字列CSを取得する。次に文字入力装置100は、終端挿入部22が、取得した入力文字列CSに対し、ユーザから指示された文字位置に、文字入力の終端記号を挿入する。次に文字入力装置100は、単語表記リスト生成部12が、終端記号が挿入された入力文字列CSを、終端記号に従って複数の文字列に分割し、分割した文字列の読みとなり得るすべての組み合わせの単語を単語表記リストWLとして生成する。次に文字入力装置100は、Nベスト経路決定部14が、単語表記リストWLを有向非循環グラフ構造として扱い、ユーザの意図する単語表記と単語表記間の接続関係(組み合わせ)とを推測し、ユーザの意図する表記候補として可能性の高い(確率の高い)Nベスト経路BRを決定する。次に文字入力装置100は、レイアウト情報生成部15が、Nベスト経路BRに含まれる単語表記群から、表示する単語表記を抽出し、ユーザの意図する表記候補として可能性の最も高い第1位の経路BR1の単語表記列と、抽出した単語表記とを、表記候補として表示するためのレイアウト情報を生成する。その結果、文字入力装置100は、レイアウト情報出力部18が、レイアウト情報を出力する。
これによって、本実施形態に係る文字入力装置100は、ユーザが文節又は単語の文字を最後まで入力することなく、次の文節又は単語の入力に移行可能な環境を提供する。また、本実施形態に係る文字入力装置100は、このような文字入力環境の中で、ユーザが意図する可能性の最も高い単語表記列と、表示する単語表記とを表示し、入力文字列CSに対する表記候補を提示可能な環境を提供する。その結果、本実施形態に係る文字入力装置100は、高速な文字入力サービスを提供できる。また、本実施形態に係る文字入力装置100は、ユーザが、変換の指示、意図した表記の選択、文節又は単語区切りの修正などの操作を一切行わなくても、入力文字列CSから自動的に高確率で意図した表記を提示することができる。これにより、本実施形態に係る文字入力装置100は、ユーザが、例えば会議や講義などで、人の話を聞きながら、メモをとるといった文字入力を行い、画面を注視することが困難な環境であっても、最低限の注意力と作業量(タイピング量)で文字入力を効率的に継続可能なサービスを実現できる。つまり、本実施形態に係る文字入力装置100は、利便性の向上を図ることができる。
<装置>
図17は、実施形態に係る文字入力装置100の構成例を示す図である。図17に示すように、実施形態に係る文字入力装置100は、CPU(Central Processing Unit)101、及び主記憶装置102などを備える。また、文字入力装置100は、補助記憶装置103、通信IF(interface)104、外部IF105、及びドライブ装置107などを備える。文字入力装置100は、各デバイスがバスBを介して相互に接続される。このように、実施形態に係る文字入力装置100は、一般的な情報処理装置に相当する。
CPU101は、装置全体の制御や搭載機能を実現するための演算装置である。主記憶装置102は、プログラムやデータなどを所定の記憶領域に保持する記憶装置(メモリ)である。主記憶装置102は、例えば、ROM(Read Only Memory)やRAM(Random Access Memory)などである。また、補助記憶装置103は、主記憶装置102より容量の大きい記憶領域を備える記憶装置である。補助記憶装置103は、例えば、HDD(Hard Disk Drive)やメモリカード(Memory Card)などの不揮発性の記憶装置である。よって、CPU101は、例えば、補助記憶装置103から主記憶装置102上に、プログラムやデータを読み出し、処理を実行することで、装置全体の制御や搭載機能を実現する。
通信IF104は、装置をデータ伝送路に接続するインタフェースである。これにより、文字入力装置100は、データ伝送路を介して接続される他の外部機器とデータ通信が行える。外部IF105は、装置と外部装置106との間でデータを送受信するためのインタフェースである。外部装置106には、例えば処理結果などの各種情報を表示する表示装置(例えば「ディスプレイ」)や操作入力を受け付ける入力装置(例えば「テンキー」、や「キーボード」)などがある。ドライブ装置107は、記憶媒体108の書き込み又は読み取りを行う制御装置である。記憶媒体108は、例えばフレキシブルディスク(FD)、CD(Compact Disk)、及びDVD(Digital Versatile Disk)などである。
また、上記実施形態に係る文字入力機能は、例えば文字入力装置100において、プログラム(文字入力プログラム)を実行することで、上記各機能部が連携動作することで実現される。この場合、プログラムは、実行環境の装置(コンピュータ)が読み取り可能な記憶媒体に、インストール可能な形式又は実行可能な形式のファイルで記録され提供される。例えば文字入力装置100の場合には、プログラムは、上記各機能部を含むモジュール構成となっており、CPU101が記憶媒体108からプログラムを読み出し実行することで、主記憶装置102のRAM上に各機能部が生成される。なお、プログラムの提供方法は、この限りでない。例えばプログラムを、インターネットなどに接続された外部機器に格納し、データ伝送路経由でダウンロードする方法であってもよい。また、主記憶装置102のROMや補助記憶装置103のHDDなどに予め組み込んで提供する方法であってもよい。
また、上記実施形態では、文字入力機能を実現するソフトウェアの実装環境が一般的な情報処理装置である例を説明したが、この限りでない。ソフトウェアの実装環境は、例えば携帯電話やタブレットなどの情報端末(非図示)であってもよい。
また、上記実施形態では、文字入力機能をソフトウェアの実装により実現する例を説明したが、この限りでない。例えば文字入力機能が有する各機能部の一部又は全部を、例えば「電子回路」や「集積回路」などのハードウェアの実装により実現してもよい。
また、上記実施形態では、日本語入力の例を説明したが、この限りでない。例えば中国語のピンイン入力にも適用できる。
また、上記実施形態では、一般的な文字入力方式の例を説明したが、この限りでない。例えばT9(Text on 9 keys)などの文字入力方式により省入力を実現するシステムと連携させて実施してもよい。
また、上記実施形態では、文字入力装置100が、入力文字列取得部11、単語表記リスト生成部12、異表記取得部13、Nベスト経路決定部14、レイアウト情報生成部15、意味情報取得部16、レイアウト制約取得部17、及びレイアウト情報出力部18を有する構成について説明を行った。さらに、上記実施形態では、文字入力装置100が、入力文字列取得部11、単語表記リスト生成部12、異表記取得部13、Nベスト経路決定部14、レイアウト情報生成部15、意味情報取得部16、レイアウト制約取得部17、及びレイアウト情報出力部18に加えて、終端指示受付部21、終端挿入部22、及び前方一致異表記取得部23を有する構成について説明を行った。しかし、この機能構成については、この限りでない。例えば、文字入力装置100が、これらの機能部の一部の機能を有する外部機器と、通信IF104を介して接続され、接続された外部機器とデータ通信を行い、各機能部を連携動作させることで、上記文字入力機能を提供する構成であってもよい。具体的には、文字入力装置100が、異表記取得部13及び意味情報取得部16を有する外部機器とデータ通信を行い、各機能部を連携動作させることで、上記文字入力機能を提供してもよい。また、文字入力装置100が、異表記取得部13、前方一致異表記取得部23、及び意味情報取得部16を有する外部機器とデータ通信を行い、各機能部を連携動作させることで、上記文字入力機能を提供してもよい。このように、上記実施形態に係る文字入力装置100は、クラウド環境などにも適用できる。
最後に、本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、請求の範囲に記載された発明とその均等の範囲に含まれる。
11 入力文字列取得部
12 単語表記リスト生成部
13 異表記取得部
14 Nベスト経路決定部
15 レイアウト情報生成部
16 意味情報取得部
17 レイアウト制約取得部
18 レイアウト情報出力部
21 終端指示受付部
22 終端挿入部
23 前方一致異表記取得部
100 文字入力装置

Claims (14)

  1. ユーザからの文字入力を受け付けて、入力文字列を取得する第1取得部と、
    前記入力文字列から、前記ユーザの意図する単語表記と単語表記間の接続関係とを推測し、前記ユーザの意図する表記候補として可能性の高い前記接続関係を表す経路を決定する決定部と、
    前記経路に含まれる単語表記群から、出力する前記単語表記を抽出し、抽出した単語表記を、前記表記候補として出力するためのレイアウト情報を生成する第1生成部と、
    前記レイアウト情報を出力する出力部と、
    を備える文字入力装置。
  2. 前記入力文字列に含まれる部分文字列に対する異表記を取得する第2取得部と、
    取得した前記異表記を、前記表記候補の前記単語表記として保持する単語表記情報を生成する第2生成部と、をさらに備え、
    前記決定部は、
    前記単語表記情報が保持する前記単語表記を、前記入力文字列の読みから推測される組み合わせに従って接続し、接続してできる1つの単語表記列を、前記経路の1つとし、前記ユーザの意図する表記候補として可能性の高い順に、前記経路を複数決定する、
    請求項1に記載の文字入力装置。
  3. 前記第1生成部は、
    複数の前記経路に含まれる単語表記群の中から、前記表記候補として非出力とする前記単語表記を特定し、特定した前記単語表記を削除することで、前記表記候補として出力する前記単語表記を抽出する、
    請求項1に記載の文字入力装置。
  4. 前記第1生成部は、
    前記単語表記の品詞が所定の種別品詞か否かを判定し、判定結果から、前記品詞が所定の種別品詞である場合、該当する前記単語表記を、前記表記候補として非出力とする前記単語表記として特定する、
    請求項3に記載の文字入力装置。
  5. 前記単語表記の意味情報を取得する第3取得部を、さらに備え、
    前記第1生成部は、
    前記意味情報に基づき、単語表記間の意味の近さを表す距離を計算し、計算結果から、意味が同じ前記単語表記、又は、意味の近い前記単語表記が存在する場合、該当した前記単語表記のうち、前記ユーザの意図する表記候補として可能性の低い前記経路に含まれる前記単語表記を、前記表記候補として非出力とする前記単語表記として特定する、
    請求項3に記載の文字入力装置。
  6. 前記第1生成部は、
    前記ユーザの意図する表記候補として可能性の最も高い第1位の経路の前記単語表記列と、抽出した前記単語表記とを、出力するための前記レイアウト情報を生成する、
    請求項2に記載の文字入力装置。
  7. 前記第1生成部は、
    前記第1位の経路の前記単語表記列と、前記第1位の経路に対して相対的に可能性の低い第2位以下の経路から抽出した前記単語表記とを、出力するための前記レイアウト情報を生成する、
    請求項6に記載の文字入力装置。
  8. 前記第1生成部は、
    前記第1位の経路の前記単語表記列に隣接する位置に、前記第2位以下の経路から抽出した前記単語表記を出力するための前記レイアウト情報を生成する、
    請求項7に記載の文字入力装置。
  9. 前記第1生成部は、
    前記第1位の経路の前記単語表記列の間に、前記第2位以下の経路から抽出した前記単語表記を出力するための前記レイアウト情報を生成する、
    請求項7に記載の文字入力装置。
  10. 前記第1生成部は、
    前記第1位の経路の前記単語表記列と、前記第2位以下の経路から抽出した前記単語表記とを、異なる表示態様で出力するための前記レイアウト情報を生成する、
    請求項7に記載の文字入力装置。
  11. 前記表記候補を出力する環境のレイアウト制約を取得する第4取得部を、さらに備え、
    前記第1生成部は、
    前記レイアウト制約を満たす出力形式に従って、前記レイアウト情報を生成する、
    請求項1に記載の文字入力装置。
  12. 文字入力を打ち切る指示を受け付ける受付部と、
    受け付けた指示に従って、前記文字入力を打ち切ったことを表す終端記号を、前記入力文字列に挿入する挿入部と、
    前記入力文字列に含まれる部分文字列に対して前方一致する異表記を取得する第5取得部と、をさらに備え、
    前記第2生成部は、
    前記入力文字列に含まれる部分文字列に前記終端記号が含まれているか否かを判定し、判定結果から、前記部分文字列に前記終端記号が含まれている場合、前記第5取得部により、前記部分文字列に対して前方一致する前記異表記を取得する、
    請求項1に記載の文字入力装置。
  13. ユーザからの文字入力を受け付けて、入力文字列を取得する工程と、
    前記入力文字列から、前記ユーザの意図する単語表記と単語表記間の接続関係とを推測し、前記ユーザの意図する表記候補として可能性の高い前記接続関係を表す経路を決定する工程と、
    前記経路に含まれる単語表記群から、出力する前記単語表記を抽出し、抽出した単語表記を、前記表記候補として出力するためのレイアウト情報を生成する工程と、
    前記レイアウト情報を出力する工程と、
    を含む文字入力方法。
  14. コンピュータを、
    ユーザからの文字入力を受け付けて、入力文字列を取得する手段と、
    前記入力文字列から、前記ユーザの意図する単語表記と単語表記間の接続関係とを推測し、前記ユーザの意図する表記候補として可能性の高い前記接続関係を表す経路を決定する手段と、
    前記経路に含まれる単語表記群から、出力する前記単語表記を抽出し、抽出した単語表記を、前記表記候補として出力するためのレイアウト情報を生成する手段と、
    前記レイアウト情報を出力する手段と、
    して機能させる文字入力プログラム。
JP2013151108A 2013-07-19 2013-07-19 文字入力装置、文字入力方法、及び文字入力プログラム Pending JP2015022590A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013151108A JP2015022590A (ja) 2013-07-19 2013-07-19 文字入力装置、文字入力方法、及び文字入力プログラム
CN201410337928.9A CN104298365A (zh) 2013-07-19 2014-07-16 字符输入设备以及字符输入方法
US14/333,884 US20150025877A1 (en) 2013-07-19 2014-07-17 Character input device, character input method, and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013151108A JP2015022590A (ja) 2013-07-19 2013-07-19 文字入力装置、文字入力方法、及び文字入力プログラム

Publications (1)

Publication Number Publication Date
JP2015022590A true JP2015022590A (ja) 2015-02-02

Family

ID=52318126

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013151108A Pending JP2015022590A (ja) 2013-07-19 2013-07-19 文字入力装置、文字入力方法、及び文字入力プログラム

Country Status (3)

Country Link
US (1) US20150025877A1 (ja)
JP (1) JP2015022590A (ja)
CN (1) CN104298365A (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9536011B1 (en) * 2014-08-18 2017-01-03 Google Inc. Applying string matching algorithms to finding ad unit availability interval
JP6466138B2 (ja) * 2014-11-04 2019-02-06 株式会社東芝 外国語文作成支援装置、方法及びプログラム
JP6464839B2 (ja) * 2015-03-13 2019-02-06 セイコーエプソン株式会社 三次元造形装置、製造方法およびコンピュータープログラム
US10761714B2 (en) * 2015-11-23 2020-09-01 Google Llc Recognizing gestures and updating display by coordinator
CN108472956B (zh) * 2016-02-16 2020-06-05 惠普发展公司,有限责任合伙企业 用于喷墨喷嘴喷吐的方法和打印机
CN107704105A (zh) * 2017-10-20 2018-02-16 北京小度信息科技有限公司 输入提示方法、装置、电子设备及计算机可读存储介质
CN109901725B (zh) * 2017-12-07 2022-05-06 北京搜狗科技发展有限公司 一种拼音串切分方法和装置
CN109232791B (zh) 2018-08-20 2020-06-16 珠海赛纳打印科技股份有限公司 一种3d打印用光固化非透明材料及其制备方法、3d打印制品及3d打印机
CN110297549B (zh) * 2019-05-15 2023-06-20 北京百度网讯科技有限公司 输入处理方法、装置、设备和存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001075964A (ja) * 1999-08-31 2001-03-23 Sony Corp 情報処理装置および情報処理方法、並びに記録媒体
US7165019B1 (en) * 1999-11-05 2007-01-16 Microsoft Corporation Language input architecture for converting one text form to another text form with modeless entry
US7403888B1 (en) * 1999-11-05 2008-07-22 Microsoft Corporation Language input user interface
JP4604178B2 (ja) * 2004-11-22 2010-12-22 独立行政法人産業技術総合研究所 音声認識装置及び方法ならびにプログラム
JP2009199255A (ja) * 2008-02-20 2009-09-03 Toshiba Corp 入力支援装置及び方法

Also Published As

Publication number Publication date
US20150025877A1 (en) 2015-01-22
CN104298365A (zh) 2015-01-21

Similar Documents

Publication Publication Date Title
JP2015022590A (ja) 文字入力装置、文字入力方法、及び文字入力プログラム
CN106598939B (zh) 一种文本纠错方法及装置、服务器、存储介质
KR101435265B1 (ko) 언어 변환에 있어서 다중 리딩 모호성 해결을 위한 방법
US8412517B2 (en) Dictionary word and phrase determination
JP4463256B2 (ja) 複数の言語を連動する自動完成推薦語提供システムおよび方法
US8306806B2 (en) Adaptive web mining of bilingual lexicon
CN102439540B (zh) 输入法编辑器
US8010344B2 (en) Dictionary word and phrase determination
JP2007004633A (ja) 言語モデル作成装置およびそれにより作成された言語モデルを使用する言語処理装置
US11531693B2 (en) Information processing apparatus, method and non-transitory computer readable medium
JP2017204018A (ja) 検索処理方法、検索処理プログラムおよび情報処理装置
JP2013196358A (ja) 検索支援装置および検索支援方法
JPH10326275A (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
JP5231484B2 (ja) 音声認識装置、音声認識方法、プログラム、及びプログラムを配信する情報処理装置
JP2014219834A (ja) 情報処理装置、情報処理方法、及びプログラム
JP2000298667A (ja) 構文情報による漢字変換装置
JP5697648B2 (ja) 単語分割装置、単語分割用辞書のデータ構造、単語分割方法、およびプログラム
JP2007206796A (ja) 文字処理装置、方法、プログラムおよび記録媒体
JP2004046438A (ja) テキスト検索方法及び装置及びテキスト検索プログラム及びテキスト検索プログラムを格納した記憶媒体
JP2013134753A (ja) 誤り文修正装置、誤り文修正方法およびプログラム
JP2014137636A (ja) 情報検索装置及び情報検索方法
JP6934621B2 (ja) 方法、装置、及びプログラム
JP5495425B2 (ja) 未知語を含む文章を修正するための文章修正プログラム、方法及び文章解析サーバ
Sosamphan SNET: a statistical normalisation method for Twitter
JP4953431B2 (ja) 品詞バリエーション生成装置

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20151102