JP5344649B2 - 文字列変換装置、文字列変換方法、プログラムおよび記録媒体 - Google Patents

文字列変換装置、文字列変換方法、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP5344649B2
JP5344649B2 JP2011232641A JP2011232641A JP5344649B2 JP 5344649 B2 JP5344649 B2 JP 5344649B2 JP 2011232641 A JP2011232641 A JP 2011232641A JP 2011232641 A JP2011232641 A JP 2011232641A JP 5344649 B2 JP5344649 B2 JP 5344649B2
Authority
JP
Japan
Prior art keywords
conversion
kana
speech
information
connection destination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011232641A
Other languages
English (en)
Other versions
JP2012133754A (ja
Inventor
誠人 下山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Original Assignee
Canon Marketing Japan Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc filed Critical Canon Marketing Japan Inc
Priority to JP2011232641A priority Critical patent/JP5344649B2/ja
Publication of JP2012133754A publication Critical patent/JP2012133754A/ja
Application granted granted Critical
Publication of JP5344649B2 publication Critical patent/JP5344649B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Input From Keyboards Or The Like (AREA)
  • Document Processing Apparatus (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、携帯端末やPCにおいてユーザが入力した入力文字列を受け取り、他の文字列に変換する際に、過去における変換の学習結果に基づきユーザの入力支援をする文字列変換装置に関する。
従来、仮名漢字変換などにおいて、ユーザの入力負荷を削減するために同音異義語の表示順位(優先順位)を如何にユーザに表示し、また全ての文字列を入力しなくても仮名漢字変換辞書を先読みすることにより、ユーザの入力支援をするための様々な技術が提供されている。
特許文献1では、携帯端末の仮名漢字変換において、1)携帯端末が内蔵するGPSで取得した携帯端末の位置情報をサーバに送り、サーバ側では、その位置情報に基づき携帯端末が存在するエリアの地名から構成される専用辞書を携帯端末にダウンロードさせる。そしてそれ以降の文字入力での入力予測や仮名漢字変換には、前述のダウンロードした辞書および該辞書内の単語を優先的に使用する技術を提供している。2)さらに携帯端末に備え付けられたGPSを使用せずに、その携帯端末上で仮名漢字変換結果が地名になった場合に、その地名を含む前述の専用辞書をダウンロードし、優先的に利用する技術を提供している。
また、特許文献2では、文字列を含んで成る表示対象データを表示画面に表示した際に、表示対象データについて、表示画面に表示されている範囲内のみにおける文字列の解析処理を行い、解析処理結果に応じて文字を予測変換辞書に登録する登録する入力支援を行う技術を提供している。
特開2003−330916号公報 特開2007−156975号公報
特許文献1では、1)の場合には、変換結果として、その携帯端末が位置するエリアの地名を優先的にユーザに提供する。また2)の場合には、ユーザが一度利用した地名と近いエリアの地名を、前回ユーザが入力した地名自体ではなくとも優先的に提供する。
しかし、特許文献1の技術に基づく変換結果の変更は、携帯端末の位置情報や直前の変換結果に基づくものであり、例えば携帯端末の位置情報が変わらなければ様々なウェブサイトにアクセスしたとしても、同一の効果しか得られない。
また、特許文献2の方式では、ユーザが入力した文字列と選択した変換結果に基づいて学習するものではなく、例えば同一のウェブサイトに再度アクセスしたとしても、前回のユーザ入力に基づく学習結果をウェブサイトに応じた学習結果とする効果は得られない。
本発明は、文字列変換装置であって、クライアントPCや携帯端末が接続するウェブサイトに応じた変換結果の候補提示を行う技術を提供することを課題とする。
本発明は、入力文字列に対する文字列変換を行う際に、1または複数の変換候補からなる変換候補一覧を提示する文字列変換装置であって、ユーザが入力する入力文字列を取得する入力文字列取得手段と、読みと、表記と、品詞とを対応付けて仮名漢字変換情報として、またはウェブサイトを特定する接続先情報と、読みと、表記と、品詞とを対応付けて仮名漢字変換情報として記憶する仮名漢字変換情報記憶手段と、前記入力文字列取得手段により取得した前記入力文字列を読みに対応させて、前記仮名漢字変換情報記憶手段における前記仮名漢字変換情報を検索し、検索の結果である1または複数の当該仮名漢字変換情報を前記ユーザに前記変換候補一覧として提示する変換候補提示手段と、前記変換候補提示手段により提示された前記変換候補一覧から前記ユーザにより選択された前記変換候補を変換結果として取得する変換結果取得手段と、前記文字列変換装置が接続するウェブサイトの特定する接続先情報を取得する接続先情報取得手段と、前記接続先情報取得手段により取得された前記接続先情報および、前記変換結果取得手段により取得された前記変換結果における読みと、表記と、品詞のうち少なくとも当該品詞と、を対応付けて、学習結果であると識別可能な仮名漢字変換情報として前記仮名漢字変換情報記憶手段に記憶させる仮名漢字変換情報登録手段と、前記接続先情報取得手段により取得された前記接続先情報と、前記仮名漢字変換情報記憶手段における前記仮名漢字変換情報の前記接続先情報と、が一致する当該仮名漢字変換情報を検索の結果として取得する接続先情報検索手段と、
前記接続先情報検索手段により取得された前記仮名漢字変換情報における品詞を取得する品詞取得手段と、を備え、前記変換候補提示手段は、前記接続先情報取得手段により取得した前記接続先情報と、前記入力文字列を前記読みに対応させて、前記仮名漢字変換情報記憶手段における前記仮名漢字変換情報を検索した結果として前記学習結果である当該仮名漢字変換情報が存在する場合には、当該仮名漢字変換情報に含まれる品詞と、前記変換候補一覧に含まれる変換候補ごとの品詞とを比較して、当該品詞が一致する変換候補の優先順位を高く変更して提示し、一方、前記接続先情報取得手段により取得した前記接続先情報と、前記入力文字列を前記読みに対応させて、当該仮名漢字変換情報記憶手段における前記仮名漢字変換情報を検索した結果として前記学習結果である当該仮名漢字変換情報が存在しない場合には、前記読みを用いずに当該接続先情報に基づいて当該仮名漢字変換情報記憶手段における前記仮名漢字変換情報を検索し、当該仮名漢字変換情報から前記品詞取得手段により品詞を取得し、取得した当該品詞と、前記変換候補一覧に含まれる変換候補ごとの品詞とを比較して、当該品詞が一致する当該読みに対応する変換候補の優先順位を高く変更して提示することを特徴とする。
文字列変換装置であって、クライアントPCや携帯端末が接続するウェブサイトに応じた変換結果の候補提示を行うことが可能となる。
本発明の実施形態に係わる携帯端末、クライアントPC、ウェブサーバのシステム構成の一例を示す図である。 携帯端末、クライアントPC、ウェブサーバの各ハード構成の一例を示すブロック図である。 文字列変換装置の機能ブロックの一例を示す図である。 標準辞書の構成と登録されている単語の一例を示す図である。 文字列変換結果の学習処理を説明するフローチャートの一例を示す図である。 文字列変換時に学習結果に基づいた変換結果の優先順位変更の処理を説明するフローチャートの一例を示す図である。 文字列変換の学習結果を記憶する学習結果記憶手段の構成の一例を示す図である。 文字列変換の学習結果を記憶する学習結果記憶手段の構成の一例を示す図である。 文字列変換の学習結果を記憶する学習結果記憶手段の構成の一例を示す図である。 文字列変換の学習結果を記憶する学習結果記憶手段の構成の一例を示す図である。 品詞と接続先情報を直接関連付けたデータを学習結果として記憶する学習結果記憶手段の構成の一例を示す図である ユーザに品詞と接続先情報を直接関連付けて設定させる設定画面の一例を示す図である。 文字列変換の学習と学習結果の説明を示す図である。 前方一致で表記候補をユーザに提供する一例を示す図である。 文字列変換の学習と学習結果の説明を示す図である。 文字列変換の学習と学習結果の説明を示す図である。 文字列変換の学習と学習結果の説明を示す図である。 文字列変換の学習と学習結果の説明を示す図である。 学習結果を利用する際のルールを記載したルールテーブルの一例を示す図である。 文字列変換の学習結果を記憶する学習結果記憶手段の構成の一例を示す図である。
以下、本発明の実施の形態を、図面を参照して詳細に説明する。
図1は、本発明の実施形態に係わる携帯端末、クライアントPC、ウェブサーバのシステム構成の一例を示す図である。携帯端末101、クライアントPC102、ウェブサーバ103a、ウェブサーバ103bは、ネットワーク104a、ネットワーク104bを介して相互に接続される。
携帯端末101、クライアントPC102は、本発明の実施の形態に係わる文字列変換装置である。
ウェブサーバ103a、103bは、携帯端末101、クライアントPC102からウェブサイトを閲覧させるウェブアプリケーションが実行動作するサーバである。
ネットワーク104aはLAN、104bはインターネットとして記載しているが、本発明においてネットワーク104は、LAN、インターネットとして制限されるものではなく、また接続のプロトコルもTCP/IPなどに制限されるものではない。
図2は、携帯端末、クライアントPC、サーバの各ハード構成の一例を示すブロック図である。ディスプレイ装置201と、入力デバイス202と、CPU203と、RAM204と、ROM205と、外部記憶装置206と、ネットワーク・インタフェース207とを備える。
CPU203は、ROM205に記憶された制御プログラムを読み出して実行すると共に、情報処理装置を制御する。RAM204は、データ等を一時記憶するためのバッファやワークエリア等として機能し、またOSを含む各種プログラムを実行する作業領域として使用される。
外部記憶装置206はハードディスクドライブ等の記憶装置であり、OSやファイル管理システムのプログラムを含む各種プログラム及び各種データの短期的、永続的な記憶装置として使用される。
入力デバイス202は、キーボード、マウス等に代表されるユーザ入力機器であり、ディスプレイ装置201は情報処理装置の処理結果等を表示するための機器である。バス208は、上述した各部を互いに接続するシステムバスである。なお、ウェブサーバ103a、ウェブサーバ103bにおいては、ディスプレイ装置201および入力デバイス202は、必須なものではない。
図3は、文字列変換装置の機能ブロックの一例を示す図である。
接続先情報取得手段301は、文字列変換の学習結果を接続先(例えばウェブサイトのURL)と関連付けて記憶するため、接続先情報を取得するためのものである。
変換部は、例えば仮名漢字変換を行うプログラムでありユーザの文字列入力を受け付けて、後述する標準辞書312を利用して他の文字列を出力する。
標準文字列変換手段302は、例えば平仮名またはアルファベット(ローマ字)を受け付けて、仮名漢字交じりの文字列を出力すること、英数字の半角を入力し、半角・全角を表示選択するなどの機能がある。以下、仮名漢字変換は、手書き入力や音声入力と連携して動作することもあり、入力も単純に平仮名に限定しない。例えばアルファベットや音素でもよい。また、任意のユーザ入力機器によって入力された入力記号、入力信号などを文字列変換の入力情報とする。以下の説明では入力情報を入力文字列とすることもある。
また、本発明において提案する学習の効果を伴った文字列変換装置と区別するため、本発明における学習効果を伴わない文字列変換装置を標準文字列変換と呼ぶ。
本発明は、文字列変換の学習の一形態を説明するものであるが、本発明で説明する学習以外の学習機能は、標準文字列変換手段302にあるものとする。例えば、最も単純な学習機能としては、同音異表記語に対して、最近利用したものを次回の出力の最優先候補にする、などは既に備えていてもよい。
標準辞書検索手段303は、標準文字列変換の処理において、入力文字列(通常は平仮名またはローマ字)をキーとして標準辞書312を検索する処理を行う。標準辞書312は図4を用いて後述する。
学習結果処理部は、上記標準文字列変換において、最終的にユーザが確定した結果を記憶可能とするものである。学習結果としては、前述の通り接続先情報と標準文字列変換の結果が必要であるが、変換結果取得手段304は、標準文字列変換の結果を取得する。学習手段305は、接続先情報と前述の変換結果取得手段304で取得した標準文字列変換の結果である単語の情報を対応付けて学習結果とし、学習結果記憶手段314に記憶させる。学習結果記憶手段314は、図5のフローチャートと、学習結果の例である図7から図10を用いて後述する。
学習ノイズ品詞判定手段306は、学習結果を学習結果記憶手段314に登録するかどうかを判定する。どの学習結果を登録するかは例えば品詞によって決定することとし、例えばユーザが不図示のノイズ品詞設定手段により品詞を選択してノイズ品詞記憶手段313に記憶させる。ユーザには設定させず、予め設定されたものであってもよい。
ノイズ品詞記憶手段313は、ノイズ品詞となる品詞のリストを記憶する。またノイズ品詞とはならない学習させたい品詞を選択して登録するものであってもよい。
入力文字列取得手段307は、ユーザが入力している入力文字列を取得する。ユーザが最終的に求める変換結果に対応する入力文字列が全て入力済みではなくても次の処理(入力予測など)を可能とするため、“入力中”の情報を随時取得するものであってもよい。
学習結果検索手段308は、入力文字列取得手段307にて確定した入力結果、あるいは先読みのため途中までしか確定していない“入力中”の入力結果をもとに学習結果記憶手段314を検索する。
品詞一覧取得手段309は、前記の学習結果検索手段308により学習結果記憶手段314から抽出した(過去の)学習結果(複数データがあり得る)から、品詞の一覧を取り出す。学習結果が複数ある場合は、品詞も複数種類の場合があり得る。品詞については図4にて説明する。
優先順位変更手段310は、標準文字列変換手段302が提示した表記の候補一覧において、優先順位を入れ替える。すなわち、標準文字列変換手段302は、あくまで標準辞書312において指定された優先順位にしたがって、表記の候補一覧をユーザに提示する。この時、標準文字列変換手段302および標準辞書312に、本発明とは関係のない学習により優先順位を入れ替える機能が備わっていてもよいが、その結果として提示した表記の候補一覧には、本発明で実施する学習結果による優先順位の入替が反映されていない。そのため優先順位変更手段310により、本発明に係わる学習結果に基づく優先順位の入替を反映させる。
前述の標準文字列変換手段302および標準辞書312の学習結果は、標準辞書312に記憶されているとする。ただし、実際には初期に作成した状態の辞書と、学習結果の情報は、物理的・論理的に別の辞書であってもよいし、1つの辞書であってもよい。本発明の説明の便宜上、双方合わせて標準辞書と呼ぶ。
変換候補表示手段311は、優先順位変更手段310で優先順位の入替た場合にはその反映した変換候補の結果を、優先順位の入替が発生しなかった場合には、標準文字列変換手段302が提示した変換候補の結果をそのままユーザに対して表記の一覧として提示する。
ユーザ指定学習手段315は、ユーザに接続先と品詞を関連付けさせて指定させ、学習結果記憶手段314に記憶させる機能である(設定画面GUIの例は図12)。
ルールテーブル316は、本発明の学習結果を用いて変換候補の優先順位を変更する際に、学習結果に対応する表記の単語のみ優先順位を変えるか、学習結果に対応する品詞と同一の品詞であれば、学習結果に対応するものではなくても優先順位を変えるかを指定する。不図示の設定手段により、ユーザによりいずれか選択可能としてもよい。
図4は、標準辞書の構成と登録されている単語の一例を示す図である。図3における標準辞書312のデータ構成およびデータ(登録される単語。以下単語と呼ぶ)内容の一例を示す図である。
標準辞書312に登録される単語は、読み401、表記402、品詞403の3つの情報から構成される。
単語404を例として説明すると、読み401は“せんだい”という平仮名である。一方、表記402は、標準文字列変換した結果として“先代”が対応する。品詞403は、いわゆる文法的要素を構成する品詞として“普通名詞”が登録されている。ただし、同音異義語405に示すように、読み401が同じであっても表記402、品詞403が異なる単語は複数存在する可能性がある。
ここで品詞403について詳しく説明する。通常、標準文字列変換では、平仮名である文字列の一部を複数に分割し、それぞれの平仮名部分を辞書で検索し対応する“単語”に置き換える。対応する“単語”は複数ある(同音異義語)が、複数に分割した文字列の各単語部分をどの単語に変換するのが最適であるかどうかを、品詞を利用して確率的な処理などにより適切な単語を選択する。その際に、いわゆる学校で習う“学校文法”や“国文法”の品詞では不十分な場合が多く、標準文字列変換特有の品詞(固有名詞(地名)、固有名詞(組織名)、固有名詞(人名姓)など)に品詞を細分化する場合がある。さらに品詞以外に単語の意味(食べ物、乗り物、生物など)を含む意味素、その他の単語の性質を分類する素性を利用する場合がある。本発明ではこれらを統合して品詞403として表現する。
再度“せんだい”を例にすると、同音異義語405の6単語が標準辞書312に登録されている。“固有名詞(地名)”として“仙台”(宮城県)、“川内”(鹿児島県)、固有名詞(組織名)として“専大”(専修大学の略)、数詞“千代”、普通名詞“先代”、“船台”である。以下の説明をするにあたり、標準辞書に登録されている並び順(上から下向き)が、標準文字列変換手段302で変換した場合の当初の優先順位であると仮定する。これらの並び順はあくまで例である。
ここでフローチャートによる処理の説明をする前に、文字列変換の学習結果を記憶する学習結果記憶手段314の構成の一例を示す図7について説明する。
図7は、文字列変換の学習結果を記憶する学習結果記憶手段314の構成の一例を示す図である。
学習結果記憶手段314は、読み702、表記703、品詞704、接続先情報705から構成される情報を1つの学習結果として格納する。図7の例として学習結果701は、読み“せんだい”、表記“仙台”、品詞“固有名詞(地名)”、接続先情報“http://Tohoku−Kankou.co.jp”が登録されている。以下の説明において、図8から図11は、記憶されている学習結果は異なるが、構成は図7と同じであるので、構成の説明は省略し、後述の例で記憶されている学習結果とあわせて説明する。
なお、後述する説明において、学習結果を利用して変換候補の優先順位を変更する際に、品詞の情報を利用しない処理のみを実装するのであれば、品詞704は学習結果記憶手段314の構成に含まれなくともよい。
図5は、文字列変換結果の学習の処理を説明するフローチャートの一例を示す図である。本説明では、携帯端末またはクライアントPCのユーザがウェブサイトにアクセスし、入力フィールドで文字入力をしている時点での処理を想定している。例えば、図13のようにウェブサイト1301(URLは“http://Tohoku−Kankou.co.jp”)の“希望の訪問先”という入力フィールド1302で“せんだい”という入力をする。
ステップS501では、ユーザの入力文字列(“せんだい”)に基づき、図13のように同音異義語の候補一覧1303の通り提示され、ユーザに1つ選択させる。例えば“仙台”を選択したとする。
ステップS502では、接続先情報を取得する。図13の例では、“http://Tohoku−Kankou.co.jp”である。
次にステップS503では、標準文字列変換手段302による変換結果を取得する。ここで、変換結果とは、ユーザが入力した読み“せんだい”、変換結果である表記“仙台”およびその品詞“固有名詞(地名)”の3つ組みである。
ステップS504では、前記の3つ組み(読み、表記、品詞)と接続先情報の4つ組みのデータが、学習結果記憶手段314に、既に前記の処理で選択された表記が学習済みか(学習結果記憶手段314に登録されているか)を判定する。登録されていない場合は、ステップS505に進む。
ステップS505では、品詞(ここでは“固有名詞(地名)”)が学習のノイズとなる品詞かどうかを判定する。例えば固有名詞しか学習に使用させないのであれば、“普通名詞”、“数詞”などはノイズ品詞として設定する。ノイズ品詞でなければステップS506に進む。
ステップS506では、学習結果記憶手段314の1学習結果として読み、表記、品詞、接続先情報の4つ組みを学習手段305により、学習結果記憶手段314に登録する。この結果が図7の学習結果701である。学習結果を登録後、本フローチャートを完了する。
ステップS504で、既に同一(3つ組みおよび接続先情報が同じ)のものが登録されていれば登録せず本フローチャートを完了する。
また、ステップS505で学習ノイズ品詞であると判定されれば登録せず本フローチャートを完了する。
図6は、文字列変換時に学習結果に基づいた変換結果の優先順位変更の処理を説明するフローチャートの一例である。図5で学習した結果を利用する。本説明では、図5の時と同様携帯端末またはクライアントPCのユーザがウェブサイトにアクセスし、入力フィールドで文字入力をしている時点での処理を想定している。例えば、図13のようにウェブサイト1301または1304(接続先情報はURL“http://Tohoku−Kankou.co.jp”)の“希望の訪問先”という入力フィールド1302または1305で“せんだい”という入力をする(この時点では、1303または1306は表示されていない)。
ステップS601では、接続先情報と入力文字列を取得する。前述の例では接続先情報はURL“http://Tohoku−Kankou.co.jp”、読みとして“せんだい”が取得される。
ステップS602では、標準辞書検索手段303により、前記入力文字列“せんだい”を読み401の検索キーとして標準辞書を検索する。結果として、図4の同音異義語405の6単語が取得される。
ステップS603では、前記取得した接続先情報と読みで、学習結果検索手段308により学習結果記憶手段314を検索する。
ステップS604では、ステップS603の処理結果として学習結果があるか否かを判定する。学習結果がある場合には、ステップS607に進む。学習結果がない場合には、ステップS605に進む。最初に学習結果がある場合(図7の701が登録されている場合)を説明する。この場合は、ステップS604で“学習結果あり”と判定されるので、ステップS607に進む。
ステップS607では、学習結果として存在する単語に対してのみ(学習結果が図7であれば“仙台“のみ)変換候補として優先順位を上げるか(“YES”の場合)、“品詞”が一致する単語、すなわち学習結果に含まれる“仙台”だけではなく、学習結果には含まれないがステップS602で標準辞書を検索した結果のうち、品詞が“固有名詞(地名)”である“川内”まで優先順位を上げるか(“NO”の場合)の判定をする。なお、ステップS607による判定はなくともよい。すなわち、ステップS604からステップS611に進む、あるいはステップS608に進むように実装されていてもよい。
どちらの方法で変換候補の優先順位を変更するかをユーザが設定できるようにしてもよい。この設定は、図3のルールテーブル316に登録される。ルールテーブル316の構成は図19を用いて詳細に説明する。
図19は、学習結果を利用する際のルールを記載したルールテーブル316の一例を示す図である。図19において、ルールテーブル316には、“品詞利用条件”が設定可能となっている。品詞利用条件が“false”の場合(1901)には、学習結果として存在する単語のみ、優先順位を上げる。“true”の場合(1902)には、学習結果に含まれる単語だけではなく、学習結果には含まれないがステップS602で標準辞書を検索した結果のうち、品詞が一致する単語の優先順位も上げる。図19の構成はあくまで一例であり、品詞利用条件以外の条件が設定可能であってもよい。
ここでは、前述の品詞利用条件が“false”として、ステップS607の判定が”YES”、即ちステップS611に進む場合を説明する。
ステップS611では、読みが“せんだい”である図4の同音異義語405の6つの単語のうち、学習結果検索手段308で検索された“仙台”を上位になるよう優先順位を変更する。
ステップS612では、図13の1306のように“仙台”を上位になるよう優先順位を変更された変換候補の一覧が表示される。これで図6のフローチャートの1つめの流れの説明を完了した。
次に2つめの流れを説明する。ステップS607までは1つめの流れと同様に処理が進んでいるとする(図7の701が登録されているものとする)。
ここでは、前述の品詞利用条件が“true”(図19の1902)として、ステップS607の判定が”NO”、即ちステップS608に進む場合を説明する。
ステップS608では、学習結果(“仙台”)から品詞“固有名詞(地名)”を取得する。
ステップS609で、標準辞書を検索した結果として、図4の同音異義語405から品詞が前記の“固有名詞(地名)”があるかどうかを判定する。既に学習している“仙台”自身が相当するので、ステップS610に進む。
ステップS610では、読みが“せんだい”である図4の同音異義語405の6つの単語のうち、“固有名詞(地名)”である“仙台”と“川内”を上位なるよう優先順位を変更する。ここで、図4の405ではもともと“川内”よりも“仙台”が上位にあるが、仮に“仙台”の方が“川内”より下位であったとしても、“仙台”のみが学習結果記憶手段314に存在することに基づき、“仙台”を優先してよい。いずれの優先順位を上位にするかは利用者が予め設定可能であってもよい。
ステップS612では、“仙台”、“川内”を他の4つの“せんだい”より優先してユーザに提示する。これで図6のフローチャートの2つめの流れの説明を完了した。
さて、前記の“仙台”が学習されているとして(図7の701)、本フローの最初に戻って、今度は同一の接続先情報(ウェブサイト)で“やまがた”という読みを入力する。学習結果記憶手段314に“やまがた”という読みの学習結果は存在しないとする。前回の処理と同様にステップS604まで処理されるが、ステップS604において“NO”と判定され、S605に進む。
ステップS605で、接続先情報のみで、学習結果検索手段308により学習結果記憶手段314を検索する。
ステップS606では、ステップS605の接続情報のみで検索した学習結果が存在するかどうかを判定する。ここでは、読みは違うものの接続先情報のみの検索であるため、現在の接続先情報に等しい図7の701(“仙台”)が学習結果として得られる。従ってステップS606において“YES”となりS608に進む。
ステップS608では、前述で取得した学習結果(“仙台”)から品詞一覧取得手段309により、品詞情報のみを取得する。ここでは“固有名詞(地名)”が取得される。
ステップS609では、ステップS602で読みを“やまがた”として標準辞書の検索結果として、図4の同音異義語406のように6つの読みを“やまがた”とする単語が登録されているが、その中に品詞が前記の“固有名詞(地名)”があるかどうかを判定する。6つのうち“山方”、“山形”の2つが“固有名詞(地名)”として存在する。従って、ステップS609の判定は“YES”となりステップS610に進む。
ステップS610では、ステップS602で読みを“やまがた”として標準辞書を検索した結果の優先順位(図4の406の通りの並び順)に対して、“固有名詞(地名)”である“山方”、“山形”の2つの優先順位を上位に変更する。
ステップS612においては、他の4つの“やまがた”よりも“山方”、“山形”の2つの優先順位を上位としてユーザに提示する(図15の1501)。
ユーザが提示された表記のうち1つ(例えば“山形”)を選択すると、図5で説明したように学習し、本例では、図8の通り学習結果801が登録される。これで図6のフローチャートの3つめの流れの説明を完了した。なおステップS608で一致する品詞がない場合には、ステップS609で“NO”と判定され、ステップS612に進み、ステップS602で検索した結果のままの並び順として、優先順位をユーザに提示する。
さて、前述と同様、ステップS605まで進んだが、ステップS605の検索で学習結果がなければステップS606で“NO”と判定され、ステップS612に進む。この場合、ステップS602で標準辞書から検索した“やまがた”の同音異義語405に対して、学習結果による優先順位の入替は行われない。従ってステップS612では、標準辞書の優先順位のままでユーザに変換結果の一覧として6つの表記が提示される。これで図6のフローチャートの4つめの流れの説明を完了した。
以上でフローチャートの説明は完了したが、ウェブサイトの例である図13から図18と学習結果記憶手段314である図7から図10を用いて、学習の流れを再度説明する。
図18は、文字列変換の学習と学習結果の説明を示す図である。1801では“せんだい”と入力(1802)し、同音異義語1803がユーザに提示される。ここで“仙台”を選択すると、学習結果記憶手段314は、図7のようになり次回からは1804の通り、“仙台”が同音異義語の最上位に表示される(1806)。
前述の例(1)は、何も学習していない状態から、1つの学習をした結果、同一サイト、同一の読みで起こる変化であり、学習した単語が、同音異義語の変換候補の最上位に提示される例を説明したものである。
図13は、文字列変換の学習と学習結果の説明を示す図である。図6のフローチャートの2つめの流れに対応する例となる。1302では“せんだい”と入力し、同音異義語の候補一覧1303がユーザに提示される。ここで“仙台”を選択すると、次回からは1304の通り、“仙台”のみならず同じ“固有名詞(地名)”を持つ“川内”も上位に表示される(1306)。
前述の例(2)は、何も学習していない状態から、1つの学習をした結果、同一サイト、同一の読みで起こる変化であり、学習した単語のみならず、同音異義語の中で同一の品詞である他の単語の優先順位も変化する例を説明したものである。
図14は、前方一致で表記候補をユーザに提供する一例を示す図である。“せんだ”と入力したときの候補をユーザに提示している状態を示している。図6のフローチャートの説明では、“読み”を用いた検索条件について詳細の説明をしなかったが、必ずしも完全一致である必要はない。すなわち“せんだい”と入力しなくとも、前方の3文字のみの“せんだ”でも、標準辞書検索手段303や学習結果検索手段308により“仙台”が検索結果として得られる処理としてもよい。この前方一致検索をオプションとして提供してもよい。前方一致とした結果、“せんだ”、“せんだい”、“せんだぎ”などの読みを持つ単語が標準辞書312または、学習結果記憶手段314から取得され、優先順位づけがされる。
1402では、“仙台”が学習結果記憶手段314にあるという理由で最上位に来ている。その他は、“せんだ”に完全一致し、さらに“仙台”と同じ“固有名詞(地名)”を品詞とする単語、さらに“川内”が続いている。この優先順位づけはあくまで例であるが、標準辞書312、学習結果記憶手段314、品詞、前方一致を組み合わせて、様々な優先順位に変更し、ユーザが効率的に入力できるように入力支援装置の処理を実行させることができる。
前述の例(3)は、基本的に図13と同一の処理ではあるが前方一致のパターンも考慮した例である。
図15は、文字列変換の学習と学習結果の説明を示す図である。図6のフローチャートの3つめの流れに対応する例である。同一のサイトで“やまがた”は初めて入力する文字列ではあるが、既にこのサイトでは“固有名詞(地名)”を品詞として学習結果が記憶されている(図7の701)ため、優先的に“固有名詞(地名)”の“山方”、“山形”がユーザに提示される(図15の1503)。ここで“山形”を選択、決定すると、図8の801の通りの学習結果とされ、次回のアクセスにおいては図15の1504のように“山形”が優先される。
前述の例(4)は、更に同一サイトで、異なる読みであっても品詞が同一である場合の状態についての説明である。
図16は、文字列変換の学習と学習結果の説明を示す図である。図6のフローチャートとしては1つめの流れに対応するものであり、例(1)と本質的には同じである。初めて“http://Kyushu−Meibutsu.co.jp”(九州名物・販売サイト)にアクセスしたときの状態を示している。
接続中のウェブサイトは初めてのアクセスなので、学習結果は、学習結果記憶手段314には存在しない。すなわち“接続先情報”と“読み”の組み合わせで検索しても学習結果は存在しない。従って例(1)の学習結果はこのサイトにおいては効果がなく、1601において、“せんだい”という入力文字列(1602)に対しての変換候補は1603の通りになる。
さらに、九州のサイトであるので“川内”を選択・決定すれば、図9の901のように学習結果として記憶される。また、次回に同サイトにアクセスした際には、1604に示すように、“せんだい”という入力文字列(1605)に対しての変換候補は1606の通りになる。
前述の例(5)は、学習結果記憶手段314に、学習結果として、読みが“せんだい”であるものが存在しても、接続先と接続先情報が異なれば、学習結果として有効ではない例である。また、“せんだい”に対応する学習結果は接続先情報(サイト)毎に別々の表記、すなわち“仙台”と“川内”に対応するものとして登録される。従って、次回からも接続先毎に別々の学習結果が、優先順位の変更に別々の効果として得られる。
図17は、文字列変換の学習と学習結果の説明を示す図である。本質的には上記に示した例(2)と同じであるが、“固有名詞(地名)”以外の品詞の例として“固有名詞(組織名)”を挙げる。初めて“http://Daigaku−info.co.jp”(大学情報)のサイトにアクセスする例である。大学名入力覧1702で“せんだい”と入力しても、接続先情報が一致する学習結果がないため、例(1)〜(5)の学習結果は効果がない。
しかし、“専大”(専修大学の略称)を選択すると、学習結果記憶手段314に、図10の1001のように品詞が“固有名詞(組織名)”として登録されるため、次回から本ウェブサイトでは“固有名詞(組織名)”が優先されるようになる。さらに例えば“とうだい”と入力されると、“灯台”、“燈台”などよりも“東大”(東京大学の略称)が優先される。
前述の例(6)は、“固有名詞(地名)”以外の品詞“固有名詞(組織名)”が学習された例であり、また“固有名詞(組織名)”に対応する変換候補が、学習結果に含まれていなくても優先順位を上位に変更される例である。また、異なる接続先情報とは別々の学習効果を得るものである。
なお、学習に使用するのは、品詞に限らず前述した意味素、その他、単語の性質を分類する如何なる素性であってもよい。
以上で、標準文字列変換をした結果、自動的に検索された場合の説明をしたが、特定のウェブサイトに対して敢えて特定の品詞を優先的に利用したい場合がある。
図12は、ユーザに品詞と接続先情報を直接関連付けて設定させる設定画面の一例を示す図である。例えば接続先1201には、駅の乗り換え案内のウェブサイト“http://Eki_Norikae.co.jp”を指定し、該サイトでは品詞選択1202で“固有名詞(地名)を優先させることをユーザが指定する。決定ボタン1203を押すと、図11の学習結果1101が登録される。図6のフローチャートでは、学習結果記憶手段314に接続先情報と品詞が登録されている学習効果があるため、ユーザの入力支援が可能となる。
図20は、文字列変換の学習結果を記憶する学習結果記憶手段の構成の一例を示す図である。図20においては、接続先情報毎に複数のサイト別辞書に分かれており、学習結果は、接続先情報に応じたサイト別辞書に登録される。接続先情報一覧は、接続先情報と接続先情報に対応するサイト別辞書のID(辞書ID)から構成されている。ユーザが特定のウェブサイトにアクセスすると接続先情報一覧から接続先情報を検索し、対応する辞書IDに基づきサイト別辞書を特定し、本発明における学習処理をする。初めてアクセスするウェブサイトにおいては、初めて学習しその学習結果を登録する際に、サイト別辞書が作成されて辞書IDが付与され、接続先情報一覧にはそのウェブサイトと新たに作成されたサイト別辞書の辞書IDが登録される。本データ構成はあくまで一例であり他の構成であってもよい。
なお、図7の説明において前述したが、学習結果を利用して変換候補の優先順位を変更する際に、品詞の情報を利用しない処理のみを実装するのであれば、品詞704は学習結果記憶手段314の構成に含まれなくともよい。これは、図20の場合でも同様であり、辞書1〜辞書4は、品詞が含まれない構成であってもよい。
また、図7〜図11では、読み、表記、品詞、接続先情報の構成、または前述のように品詞を含まない場合には、読み、表記、接続先情報の構成を1レコードとして学習結果記憶手段314に登録している。さらに図20では、読み、表記、品詞の構成、または前述のように品詞を含まない場合には、読み、表記の構成を1レコードとして、接続先情報毎に異なる辞書に登録し、各辞書と接続先情報を対応付けている。いずれの方法も、本発明における“接続先情報と、読みと、表記と、品詞と、を対応付けて記憶する”あるいは“接続先情報と、読みと、表記と、を対応付けて記憶する”に含まれるものである。
更にユーザ指定登録手段により、接続先情報と品詞を図11の1101の通り登録することを前述したが、辞書が図20の構成である場合、ユーザ指定登録手段により品詞を1レコードとして、接続先情報毎に異なる辞書に登録し、各辞書と接続先情報を対応付けている(図20の辞書4)。いずれの方法も、本発明における“接続先情報と、品詞と、を対応付けて記憶する”に含まれるものである。
なお、標準辞書312と学習結果記憶手段314は、論理的・物理的に一体のもであってもよい。一体である場合に、さらに前述のように接続先情報毎に複数のサイト別辞書に分かれている場合には、物理的には1つの辞書であり、その中に複数のサイト別辞書が論理的に分かれていてもよい。また、ウェブサイト毎に標準辞書312とサイト別辞書が一体のものであり、一体となった辞書はウェブサイト毎に分かれていてもよい。
なお、図13から図18において、入力文字列の変換候補として表示される一覧は、表記と共に品詞が提示されているが、品詞はなくともよい。また、例えば“千葉”のように固有名詞(人名姓)と固有名詞(地名)の複数の品詞が対応する場合のみ品詞を提示してもよい。
また、前述の例として、接続先と入力文字列に対応した学習結果が存在しない場合には、接続先のみを用いて学習結果記憶手段314を検索して、学習結果があれば対応する品詞に基づいて変換候補の優先順位を変更する処理の説明をした。ここで、接続先情報に対して異なる複数の品詞が得られる場合がある。この時、品詞毎に学習結果の個数を数え、個数が多いものから優先順位を高くするなど、個数に応じて優先順位を変えてもよい。また、学習結果記憶手段314には、同一の単語を学習結果として複数回登録しないが、既に学習結果として登録されている単語がユーザにより繰り返し選択された場合には、選択された回数を記録するようにしてもよい。この回数により、入力文字列や品詞に基づく変換候補の優先順位の結果を変更するようにしてもよい。
また、図13から図18のように入力文字列の変換候補は一覧として表示されなくともよい。例えば、最初に優先順位が最も高い表記が1つ表示され、表示された表記がユーザの所望するものでない場合、次の候補を表示するためのキーボードのキーを押下することで、次に優先順位が高い表記を表示し、所望する表記が現れるまでキーボードのキーの押下を繰り返すものなどであってもよい。
また、学習ノイズ品詞判定手段306は、前述の説明において図5のフローチャートの学習の処理で使用するものとしていた。しかし、図6のフローチャートにおいて、学習結果を検索する際に、既に学習結果記憶手段314に登録されている学習結果であっても、品詞がノイズ品詞として判定される場合には、学習結果として使用しないとするものであってもよい。
以上、本説明では、図1のシステム構成図のように携帯端末やクライアントPCから社外、社内のウェブサイトにネットワークを通じてアクセスしているときの学習を説明した。以上の説明では、接続先情報としてURLを例としたが、ウェブサイトやウェブアプリケーションを特定可能な情報であればよい。
また、本発明の目的は、以下の処理を実行することによって達成される。即ち、上述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)が記憶媒体に格納されたプログラムコードを読み出す処理である。
この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施の形態の機能を実現することになり、そのプログラムコード及び該プログラムコードを記憶した記憶媒体は本発明を構成することになる。
また、プログラムコードを供給するための記憶媒体としては、次のものを用いることができる。例えば、フロッピー(登録商標)ディスク、ハードディスク、光磁気ディスク、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD−RAM、DVD−RW、DVD+RW、磁気テープ、不揮発性のメモリカード、ROM等である。または、プログラムコードを、ネットワークを介してダウンロードしてもよい。
また、コンピュータが読み出したプログラムコードを実行することにより、上記実施の形態の機能が実現される場合も本発明に含まれる。加えて、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれる。
更に、前述した実施形態の機能が以下の処理によって実現される場合も本発明に含まれる。即ち、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行う場合である。
また、コンピュータが読み出したプログラムコードを実行することにより、前述した各実施の形態の機能が実現される場合も本発明に含まれる。加えて、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOSなどが実際の処理の一部または全部を行い、その処理によって前述した実施の形態の機能が実現する場合も含まれる。
この場合、上記プログラムは、該プログラムを記憶した記憶媒体から直接、またはインターネット、商用ネットワーク、若しくはローカルエリアネットワーク等に接続された不図示の他のコンピュータやデータベースなどからダウンロードすることにより供給される。
上記プログラムの形態は、オブジェクトコード、インタプリタにより実行されるプログラムコード、OS(オペレーティングシステム)に供給されるスクリプトデータ等の形態から成ってもよい。
101 携帯端末
102 クライアントPC
103 ウェブサーバ
104 ネットワーク
201 ディスプレイ装置
202 入力デバイス
203 CPU
204 RAM
205 ROM
206 外部記憶装置
207 ネットワーク・インタフェース
208 バス
301 接続先情報取得手段
302 標準文字列変換手段
303 標準辞書検索手段
304 変換結果取得手段
305 学習手段
306 学習ノイズ品詞判定手段
307 入力文字列取得手段
308 学習結果検索手段
309 品詞一覧取得手段
310 優先順位変更手段
311 変換候補表示手段
312 標準辞書
313 ノイズ品詞記憶手段
314 学習結果記憶手段
315 ユーザ指定学習手段
316 ルールテーブル

Claims (10)

  1. 入力文字列に対する文字列変換を行う際に、1または複数の変換候補からなる変換候補一覧を提示する文字列変換装置であって、
    ユーザが入力する入力文字列を取得する入力文字列取得手段と、
    読みと、表記と、品詞とを対応付けて仮名漢字変換情報として、またはウェブサイトを特定する接続先情報と、読みと、表記と、品詞とを対応付けて仮名漢字変換情報として記憶する仮名漢字変換情報記憶手段と、
    前記入力文字列取得手段により取得した前記入力文字列を読みに対応させて、前記仮名漢字変換情報記憶手段における前記仮名漢字変換情報を検索し、検索の結果である1または複数の当該仮名漢字変換情報を前記ユーザに前記変換候補一覧として提示する変換候補提示手段と、
    前記変換候補提示手段により提示された前記変換候補一覧から前記ユーザにより選択された前記変換候補を変換結果として取得する変換結果取得手段と、
    前記文字列変換装置が接続するウェブサイトの特定する接続先情報を取得する接続先情報取得手段と、
    前記接続先情報取得手段により取得された前記接続先情報および、前記変換結果取得手段により取得された前記変換結果における読みと、表記と、品詞のうち少なくとも当該品詞と、を対応付けて、学習結果であると識別可能な仮名漢字変換情報として前記仮名漢字変換情報記憶手段に記憶させる仮名漢字変換情報登録手段と、
    前記接続先情報取得手段により取得された前記接続先情報と、前記仮名漢字変換情報記憶手段における前記仮名漢字変換情報の前記接続先情報と、が一致する当該仮名漢字変換情報を検索の結果として取得する接続先情報検索手段と、
    前記接続先情報検索手段により取得された前記仮名漢字変換情報における品詞を取得する品詞取得手段と、
    を備え、
    前記変換候補提示手段は、
    前記接続先情報取得手段により取得した前記接続先情報と、前記入力文字列を前記読みに対応させて、前記仮名漢字変換情報記憶手段における前記仮名漢字変換情報を検索した結果として前記学習結果である当該仮名漢字変換情報が存在する場合には、当該仮名漢字変換情報に含まれる品詞と、前記変換候補一覧に含まれる変換候補ごとの品詞とを比較して、当該品詞が一致する変換候補の優先順位を高く変更して提示し、一方、前記接続先情報取得手段により取得した前記接続先情報と、前記入力文字列を前記読みに対応させて、当該仮名漢字変換情報記憶手段における前記仮名漢字変換情報を検索した結果として前記学習結果である当該仮名漢字変換情報が存在しない場合には、前記読みを用いずに当該接続先情報に基づいて当該仮名漢字変換情報記憶手段における前記仮名漢字変換情報を検索し、当該仮名漢字変換情報から前記品詞取得手段により品詞を取得し、取得した当該品詞と、前記変換候補一覧に含まれる変換候補ごとの品詞とを比較して、当該品詞が一致する当該読みに対応する変換候補の優先順位を高く変更して提示することを特徴とする文字列変換装置。
  2. 前記変換候補提示手段は、更に、
    前記接続先情報取得手段により取得した前記接続先情報により、前記仮名漢字変換情報記憶手段における前記仮名漢字変換情報を検索した結果として前記学習結果である当該仮名漢字変換情報が存在する場合には、当該仮名漢字変換情報から前記品詞取得手段により品詞を取得し、当該品詞において複数の異なる当該品詞がある場合には、当該品詞ごとに当該学習結果である当該仮名漢字変換情報の数を算出し、当該数の多寡に応じて、当該品詞と、提示される前記変換候補ごとの品詞が一致する変換候補の優先順位を高く変更することを特徴とする請求項に記載の文字列変換装置。
  3. 前記仮名漢字変換情報記憶手段は、更に、
    前記接続先情報と、品詞とを対応付けて仮名漢字変換情報として記憶することが可能であって
    前記接続先情報取得手段により取得された前記接続先情報と、ユーザにより選択された品詞と、を対応付けてユーザに指定させて、前記学習結果であると識別可能な前記仮名漢字変換情報として前記仮名漢字変換情報記憶手段に記憶させるユーザ指定登録手段と、
    を更に備えることを特徴とする請求項1または請求項2のいずれかに記載の文字列変換装置。
  4. 前記変換候補提示手段は、更に、
    前記接続先情報と、前記入力文字列を前記読みに対応させて、前記仮名漢字変換情報記憶手段における前記仮名漢字変換情報を検索する際に、前記入力文字列である当該読みが、前記仮名漢字変換情報に含まれる読みの前方と文字列として一致する場合に、当該仮名漢字変換情報を検索した結果であるすることを特徴とする請求項1乃至請求項のいずれか1項に記載の文字列変換装置。
  5. 前記接続先情報取得手段により取得された前記接続先情報と、前記変換結果取得手段により取得した前記変換結果における読みと、表記と、品詞とを対応付けて、前記学習結果であると識別可能な前記仮名漢字変換情報として前記仮名漢字変換情報記憶手段に記憶させるか否かを当該変換結果の品詞がノイズ品詞であるか否かによって判定するものであって当該変換結果の品詞がノイズ品詞であるか否かは、当該変換結果の品詞がノイズ品詞記憶手段に記憶された品詞のいずれかの品詞に一致するか否かによってノイズ品詞であるか否かを判定する第1のノイズ品詞判定手段と、
    を更に備え、
    前記仮名漢字変換情報登録手段は、更に、
    前記変換結果取得手段により取得した前記変換結果の品詞が、前記第1のノイズ品詞判定手段により前記ノイズ品詞であると判定された場合には、前記接続先情報と、前記変換結果における読みと、表記と、品詞とを対応付けて前記仮名漢字変換情報として前記仮名漢字変換情報記憶手段に記憶させず、ノイズ品詞ではないと判定された場合には、当該仮名漢字変換情報を当該仮名漢字変換情報記憶手段に登録させることを特徴とする請求項乃至請求項のいずれか1項に記載の文字列変換装置。
  6. 前記変換候補提示手段において、前記仮名漢字変換情報記憶手段における前記学習結果に基づき前記変換の優先順位を高く変更して提示するか否かを、当該変換候補一覧に含まれる変換候補ごとに前記品詞取得手段により取得した品詞がノイズ品詞であるか否かによって判定するものであって、当該品詞がノイズ品詞であるか否かは、当該品詞がノイズ品詞記憶手段に記憶された品詞のうちいずれかの品詞に一致するか否かによってノイズ品詞であるか否かを判定する第2のノイズ品詞判定手段と、
    を更に備え、
    前記変換候補提示手段は、更に、
    前記第2のノイズ品詞判定手段により、前記変換候補の品詞が前記ノイズ品詞ではないと判定された変換候補の優先順位を高く変更して、前記変換候補を提示することを特徴とする請求項乃至請求項のいずれか1項に記載の文字列変換装置。
  7. 前記変換候補提示手段において、前記変換候補を提示する際に、ルール記憶手段に記憶される品詞利用条件が真である場合において、前記接続先情報と前記入力文字列を前記読みに対応させて、前記仮名漢字変換情報記憶手段における前記仮名漢字変換情報を検索した結果、当該結果として取得した当該仮名漢字変換情報が前記学習結果である場合に、当該仮名漢字変換情報の品詞と、当該変換候補一覧に含まれる前記変換候補ごと取得した品詞と、が一致する場合に品詞が一致する変換候補の優先順位を高く変更して提示すると判定するルール判定手段と、
    を更に備え、
    前記変換候補提示手段は、更に、
    前記接続先情報取得手段により取得した前記接続先情報と前記入力文字列を前記読みに対応させて、前記仮名漢字変換情報記憶手段の前記仮名漢字変換情報を検索した結果、前記学習結果である当該仮名漢字変換情報が存在する場合には、前記ルール判定手段により当該当該仮名漢字変換情報の品詞を利用するか否かを判定し、前記品詞を利用すると判定された場合には、当該仮名漢字変換情報に含まれる品詞と、前記変換候補一覧に含まれる変換候補ごとに取得された品詞とが一致する場合に、変換候補の優先順位を高く変更し、一方、当該品詞を利用しないと判定された場合には、当該接続先情報検索手段に基づいて取得された当該仮名漢字変換情報の品詞と表記とが、前記変換候補一覧に含まれる変換候補ごとに取得された品詞と表記とに一致する場合に、変換候補の優先順位を高く変更することを特徴とする請求項乃至請求項のいずれか1項に記載の文字列変換装置。
  8. 読みと、表記と、品詞とを対応付けて仮名漢字変換情報として、またはウェブサイトを特定する接続先情報と、読みと、表記と、品詞とを対応付けて仮名漢字変換情報として記憶する仮名漢字変換情報記憶手段を備え、入力文字列に対する文字列変換を行う際に、1または複数の変換候補からなる変換候補一覧を提示する文字列変換装置における文字列変換方法であって、
    入力文字列取得手段が、ユーザが入力する入力文字列を取得する入力文字列取得工程と、
    変換候補提示手段が、前記入力文字列取得工程により取得した前記入力文字列を読みに対応させて、前記仮名漢字変換情報記憶手段における前記仮名漢字変換情報を検索し、検索の結果である1または複数の当該仮名漢字変換情報を前記ユーザに前記変換候補一覧として提示する変換候補提示工程と、
    変換結果取得手段が、前記変換候補提示工程により提示された前記変換候補一覧から前記ユーザにより選択された前記変換候補を変換結果として取得する変換結果取得工程と、
    接続先情報取得手段が、前記文字列変換装置が接続するウェブサイトの特定する接続先情報を取得する接続先情報取得工程と、
    仮名漢字変換情報登録手段が、前記接続先情報取得工程により取得された前記接続先情報および、前記変換結果取得工程により取得された前記変換結果における読みと、表記と、品詞のうち少なくとも当該品詞と、を対応付けて、学習結果であると識別可能な仮名漢字変換情報として仮名漢字変換情報記憶手段に記憶させる仮名漢字変換情報登録工程と、
    接続先情報検索手段が、前記接続先情報取得工程により取得された前記接続先情報と、前記仮名漢字変換情報記憶手段における前記仮名漢字変換情報の前記接続先情報と、が一致する当該仮名漢字変換情報を検索の結果として取得する接続先情報検索工程と、
    品詞取得手段が、前記接続先情報検索工程により取得された前記仮名漢字変換情報における品詞を取得する品詞取得工程と、
    を含み、
    前記変換候補提示工程は、
    前記接続先情報取得工程により取得した前記接続先情報と、前記入力文字列を前記読みに対応させて、前記仮名漢字変換情報記憶手段における前記仮名漢字変換情報を検索した結果として前記学習結果である当該仮名漢字変換情報が存在する場合には、当該仮名漢字変換情報に含まれる品詞と、前記変換候補一覧に含まれる変換候補ごとの品詞とを比較して、当該品詞が一致する変換候補の優先順位を高く変更して提示し、一方、前記接続先情報取得工程により取得した前記接続先情報と、前記入力文字列を前記読みに対応させて、当該仮名漢字変換情報記憶手段における前記仮名漢字変換情報を検索した結果として前記学習結果である当該仮名漢字変換情報が存在しない場合には、前記読みを用いずに当該接続先情報に基づいて当該仮名漢字変換情報記憶手段における前記仮名漢字変換情報を検索し、当該仮名漢字変換情報から前記品詞取得工程により品詞を取得し、取得した当該品詞と、前記変換候補一覧に含まれる変換候補ごとの品詞とを比較して、当該品詞が一致する当該読みに対応する変換候補の優先順位を高く変更して提示することを特徴とする文字列変換装置における文字列変換方法。
  9. コンピュータを、読みと、表記と、品詞とを対応付けて仮名漢字変換情報として、またはウェブサイトを特定する接続先情報と、読みと、表記と、品詞とを対応付けて仮名漢字変換情報として記憶する仮名漢字変換情報記憶手段を備え、入力文字列に対する文字列変換を行う際に、1または複数の変換候補からなる変換候補一覧を提示する文字列変換装置として機能させるためのプログラムであって、
    ユーザが入力する入力文字列を取得する入力文字列取得手段、
    前記入力文字列取得手段により取得した前記入力文字列を読みに対応させて、前記仮名漢字変換情報記憶手段における前記仮名漢字変換情報を検索し、検索の結果である1または複数の当該仮名漢字変換情報を前記ユーザに前記変換候補一覧として提示する変換候補提示手段、
    前記変換候補提示手段により提示された前記変換候補一覧から前記ユーザにより選択された前記変換候補を変換結果として取得する変換結果取得手段、
    前記文字列変換装置が接続するウェブサイトの特定する接続先情報を取得する接続先情報取得手段、
    前記接続先情報取得手段により取得された前記接続先情報および、前記変換結果取得手段により取得された前記変換結果における読みと、表記と、品詞のうち少なくとも当該品詞と、を対応付けて、学習結果であると識別可能な仮名漢字変換情報として前記仮名漢字変換情報記憶手段に記憶させる仮名漢字変換情報登録手段、
    前記接続先情報取得手段により取得された前記接続先情報と、前記仮名漢字変換情報記憶手段における前記仮名漢字変換情報の前記接続先情報と、が一致する当該仮名漢字変換情報を検索の結果として取得する接続先情報検索手段、
    前記接続先情報検索手段により取得された前記仮名漢字変換情報における品詞を取得する品詞取得手段、
    として機能させ、
    前記変換候補提示手段は、
    前記接続先情報取得手段により取得した前記接続先情報と、前記入力文字列を前記読みに対応させて、前記仮名漢字変換情報記憶手段における前記仮名漢字変換情報を検索した結果として前記学習結果である当該仮名漢字変換情報が存在する場合には、当該仮名漢字変換情報に含まれる品詞と、前記変換候補一覧に含まれる変換候補ごとの品詞とを比較して、当該品詞が一致する変換候補の優先順位を高く変更して提示し、一方、前記接続先情報取得手段により取得した前記接続先情報と、前記入力文字列を前記読みに対応させて、当該仮名漢字変換情報記憶手段における前記仮名漢字変換情報を検索した結果として前記学習結果である当該仮名漢字変換情報が存在しない場合には、前記読みを用いずに当該接続先情報に基づいて当該仮名漢字変換情報記憶手段における前記仮名漢字変換情報を検索し、当該仮名漢字変換情報から前記品詞取得手段により品詞を取得し、取得した当該品詞と、前記変換候補一覧に含まれる変換候補ごとの品詞とを比較して、当該品詞が一致する当該読みに対応する変換候補の優先順位を高く変更して提示することを特徴とするプログラム。
  10. 請求項に記載されたプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2011232641A 2010-11-30 2011-10-24 文字列変換装置、文字列変換方法、プログラムおよび記録媒体 Expired - Fee Related JP5344649B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011232641A JP5344649B2 (ja) 2010-11-30 2011-10-24 文字列変換装置、文字列変換方法、プログラムおよび記録媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010266778 2010-11-30
JP2010266778 2010-11-30
JP2011232641A JP5344649B2 (ja) 2010-11-30 2011-10-24 文字列変換装置、文字列変換方法、プログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2012133754A JP2012133754A (ja) 2012-07-12
JP5344649B2 true JP5344649B2 (ja) 2013-11-20

Family

ID=46649240

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011232641A Expired - Fee Related JP5344649B2 (ja) 2010-11-30 2011-10-24 文字列変換装置、文字列変換方法、プログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP5344649B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010237988A (ja) * 2009-03-31 2010-10-21 Nec Corp 文字列処理装置、文字列処理方法、および文字列処理プログラム

Also Published As

Publication number Publication date
JP2012133754A (ja) 2012-07-12

Similar Documents

Publication Publication Date Title
JP2006127509A (ja) 地理的検索機能を提供するシステムおよび方法
JP4502615B2 (ja) 類似文検索装置、類似文検索方法、およびプログラム
JP4724051B2 (ja) キーワード生成方法、文書検索方法、話題範囲推定方法、話題境界推定方法、及びこれらの装置とそのプログラム、その記録媒体
JP2006099428A (ja) 文書要約作成システム、方法、及びプログラム
JPH09114852A (ja) 情報検索装置
JP5344649B2 (ja) 文字列変換装置、文字列変換方法、プログラムおよび記録媒体
JP2007200252A (ja) 省略語生成・妥当性評価方法、同義語データベース生成・更新方法、省略語生成・妥当性評価装置、同義語データベース生成・更新装置、プログラム、記録媒体
JP2009104475A (ja) 類似文書検索装置、類似文書検索方法およびプログラム
JP4416644B2 (ja) 予測機能付き文字処理装置、方法、記録媒体およびプログラム
KR100576549B1 (ko) 한글 주소 문자열의 고속 입력 장치 및 그 방법
JP2010146061A (ja) 例文表示装置、例文表示方法および例文表示プログラム
JP5379416B2 (ja) 言語処理装置および言語処理方法
JPWO2009069239A1 (ja) 地図情報処理装置
KR20090056273A (ko) 키워드 검색 방법
JP2005070856A (ja) 電子辞書における漢字熟語検索機能
JP3498635B2 (ja) 情報検索方法及びその装置並びにコンピュータ可読記録媒体
JP2001109740A (ja) 中国語文書作成装置及び中国語文書作成方法
JP2007065990A (ja) 情報検索装置
JP2007171275A (ja) 言語処理装置及び現後処理方法
JP2008257414A (ja) 情報選択支援システム、端末装置、情報選択支援装置、情報選択支援方法、プログラム
JP2007072786A (ja) 情報表示制御装置および情報表示制御プログラム
JPH1055360A (ja) 住所録処理装置及び住所録処理方法
JP2856450B2 (ja) かな漢字変換方式
JP2006172029A (ja) 検索結果提示方法
JP5843029B2 (ja) 辞書を搭載した辞書端末との通信機能を有する電子機器及び電子機器制御プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130405

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20130531

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130531

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130709

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130808

R150 Certificate of patent or registration of utility model

Ref document number: 5344649

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees