JP2011034441A - 表記変換装置、表記変換方法およびプログラム - Google Patents

表記変換装置、表記変換方法およびプログラム Download PDF

Info

Publication number
JP2011034441A
JP2011034441A JP2009181688A JP2009181688A JP2011034441A JP 2011034441 A JP2011034441 A JP 2011034441A JP 2009181688 A JP2009181688 A JP 2009181688A JP 2009181688 A JP2009181688 A JP 2009181688A JP 2011034441 A JP2011034441 A JP 2011034441A
Authority
JP
Japan
Prior art keywords
word data
notation
position information
character string
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2009181688A
Other languages
English (en)
Inventor
Nobuyoshi Miyokawa
信義 三代川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2009181688A priority Critical patent/JP2011034441A/ja
Publication of JP2011034441A publication Critical patent/JP2011034441A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

【課題】現在位置に応じて適切に文字列を表記変換する。
【解決手段】表記変換装置10は、文字入力部202と、位置情報を取得する取得部204と、単語データと位置情報とが関連付けられているデータベースを記憶している記憶部212と、文字入力部202に入力された文字列に対応する単語データのうち、取得部204により取得された位置情報が単語データに関連付けられている位置情報の範囲内である単語データを優先的に抽出する抽出部208と、文字入力部202に入力された文字列を、抽出部208により抽出された単語データの表記に変換する変換部210と、を備える。
【選択図】図3

Description

本発明は、表記変換装置、表記変換方法およびプログラムに関する。
近日、携帯電話やPC(Personal Computer)などの情報処理装置が広く普及している。この情報処理装置が有する多様な機能の一つとして表記変換機能が挙げられる。表記変換機能によれば、入力された仮名文字列を文節に区切り、各文節の表記を複数の表記から選択することにより、仮名文字列の表記を例えば漢字を含む文字列に変換することができる。なお、このような変換は、単語ごとの読み、漢字、品詞および結合候補の品詞などを含む表記変換用のデータベースに基づいて行われる。
特に、区切られた文節が「こうしゅう」という仮名文字であった場合には、地名である「甲州」と変換すべきか、地名ではない「講習」と変換すべきかの判断が難しい場合がある。そこで、住所を表す文章においては、地名単語が連続していることに着目して、地名を表す単語を容易に仮名漢字変換する技術が開示されている(例えば、特許文献1)。
特開平10−49525号公報 特開平11−96167号公報
しかし、複数の地名を表す仮名文字が入力された場合には、ユーザの意図とは関係なく、予め定められた単語辞書の優先順位に応じて漢字変換されてしまうという問題があった。例えば、「えびす」という単語を変換する場合に、単語辞書の優先順位が「恵比寿」、「恵比須」の順に定められていたとする。この場合、大阪近郊にいるユーザは「恵比須」に変換したいと考えている場合が多いため、優先的に変換された「恵比寿」から適切な変換結果である「恵比須」を手動で選択して変換しなければならなかった。
そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、現在位置に応じて適切に文字列を表記変換することが可能な表記変換装置、表記変換方法を提供することにある。
上記課題を解決するために、本発明のある観点によれば、文字入力部と、位置情報を取得する取得部と、単語データと位置情報とが関連付けられているデータベースを記憶している記憶部と、前記文字入力部に入力された文字列に対応する前記単語データのうち、前記取得部により取得された位置情報が前記単語データに関連付けられている位置情報の範囲内である単語データを優先的に抽出する抽出部と、前記文字入力部に入力された文字列を、前記抽出部により抽出された単語データの表記に変換する変換部と、を備える、表記変換装置が提供される。
また、前記単語データは、少なくとも単語の変換前の表記、変換後の表記、位置情報を含み、前記抽出部は、前記文字入力部に入力された文字列と前記単語データの変換前の表記とが一致する前記単語データのうち、前記取得部により取得された位置情報が前記単語データに関連付けられている位置情報の範囲内である単語データを優先的に抽出するようにしてもよい。
また、前記変換部は、前記文字入力部に入力された文字列を、前記抽出部により抽出された単語データの優先度順に変換するようにしてもよい。
また、表記変換装置は、前記文字入力部に入力された文字列を複数の単語に区切る区切部を備え、前記区切部は、前記取得部により取得された位置情報に基づいて前記文字列を複数の単語に区切るようにしてもよい。
また、前記区切部は、前記取得部により取得された位置情報に基づいて、前記文字列に含まれる複数の単語の結合度を確定するようにしてもよい。
また、上記課題を解決するために、本発明の別の観点によれば、ユーザにより文字列が入力されるステップと、位置情報を取得するステップと、前記文字入力部に入力された文字列に対応する単語データのうち、前記取得された位置情報が前記単語データに関連付けられている位置情報の範囲内である単語データを優先的に抽出するステップと、前記入力された文字列を、前記抽出された単語データの表記に変換するステップと、を含む、表記変換方法が提供される。
また、上記課題を解決するために、本発明の別の観点によれば、コンピュータを、文字入力部と、位置情報を取得する取得部と、単語データと位置情報とが関連付けられているデータベースを記憶している記憶部と、前記文字入力部に入力された文字列に対応する前記単語データのうち、前記取得部により取得された位置情報が前記単語データに関連付けられている位置情報の範囲内である単語データを優先的に抽出する抽出部と、前記文字入力部に入力された文字列を、前記抽出部により抽出された単語データの表記に変換する変換部と、を備える、表記変換装置として機能させるための、プログラムが提供される。
以上説明したように本発明によれば、現在位置に応じて適切に文字列を表記変換することができる。
本発明の一実施形態にかかる表記変換装置の外観を示した説明図である。 同実施形態にかかる表記変換装置のハードウェア構成の一例を示した説明図である。 同実施形態にかかる表記変換装置の機能構成を示すブロック図である。 通常の単語辞書の内容について説明する説明図である。 本発明の一実施形態にかかる単語辞書内容について説明する説明図である。 通常の文字列の表記変換の具体例を説明する説明図である。 本発明の一実施形態にかかる文字列の表記変換の具体例を示す説明図である。 同実施形態にかかる文字列の変換候補の表示例を示す説明図である。 同実施形態にかかる表記変換装置10の動作を示したフローチャートである。
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
また、以下に示す順序に従って、当該「発明を実施するための最良の形態」を説明する。
〔1〕本実施形態の目的
〔2〕表記変換装置のハードウェア構成
〔3〕表記変換装置の機能構成
〔4〕表記変換装置の動作の詳細
〔1〕本実施形態の目的
近日、携帯電話やPC(Personal Computer)などの情報処理装置が広く普及している。この情報処理装置が有する多様な機能の一つとして表記変換機能が挙げられる。表記変換機能によれば、入力された仮名文字列を文節に区切り、各文節の表記を複数の表記から選択することにより、仮名文字列の表記を例えば漢字を含む文字列に変換することができる。なお、このような変換は、単語ごとの読み、漢字、品詞および結合候補の品詞などを含む表記変換用のデータベースに基づいて行われる。
特に、区切られた文節が「こうしゅう」という仮名文字であった場合には、地名である「甲州」と変換すべきか、地名ではない「講習」と変換すべきかの判断が難しい場合がある。そこで、住所を表す文章においては、地名単語が連続していることに着目して、地名を表す単語を容易に仮名漢字変換する技術が開示されている。
しかし、複数の地名を表す仮名文字が入力された場合には、ユーザの意図とは関係なく、予め定められた単語辞書の優先順位に応じて漢字変換されてしまうという問題があった。例えば、「えびす」という単語を変換する場合に、単語辞書の優先順位が「恵比寿」、「恵比須」の順に定められていたとする。この場合、大阪近郊にいるユーザは「恵比須」に変換したいと考えている場合が多いため、優先的に変換された「恵比寿」から適切な変換結果である「恵比須」を手動で選択して変換しなければならなかった。そこで、上記のような問題を一着眼点として、本実施形態にかかる表記変換装置10が創作されるに至った。本実施形態にかかる表記変換装置10によれば、現在位置に応じて適切に文字列を表記変換することができる。
次に、図1を参照して、本発明の実施形態にかかる表記変換装置10の概要について説明する。図1は、本発明の実施形態による表記変換装置10の外観を示した説明図である。図1に示したように、本発明の実施形態による表記変換装置10は、表示部11および入力部12を備える。
入力部12は、ユーザ操作を検出し、ユーザ操作に対応する電気信号を出力する。例えば、入力部12は、ユーザにより文字の入力操作が行われた場合に、入力された文字を示す電気信号を出力する文字入力部として機能する。より具体的には、入力部12が図1に示したようにテンキーなどで構成される場合、入力部12は、ユーザにより押圧されたキーに対応する文字を示す電気信号を出力する。なお、ユーザにより入力される文字の種類としては、例えば、平仮名、カタカナ、およびローマ字があげられる。
また、図1では、文字入力部はテンキーで構成される例を示しているが、かかる例に限定されない。例えば、文字入力部は、タッチパネルやダイヤルなどであってもよい。さらに、音声を収音するマイクロフォン、および収音された音声を音声認識により文字列に変換する音声認識部により文字入力部を構成してもよい。
表記変換装置10は、ユーザにより入力部12を介して入力された文字列を表記変換し、表記変換後の文字列を表示部11に表示させる。図1には、表記変換装置10がユーザにより入力された「ebisudemachiawase。」という文字列を「恵比須で待ち合わせ」という文字列に変換し、表記変換後の「恵比須で待ち合わせ。」という文字列を表示部11に表示させた例を示している。
なお、図1においては表記変換後の文字列が平仮名と漢字からなる例を示しているが、表記変換後の文字列は、カタカナ、アルファベット、記号、または絵文字などを含んでもよい。
また、図1には表記変換装置10として携帯電話を示しているが、表記変換装置10は携帯電話に限られない。例えば、表記変換装置10は、携帯電話やPDA(Personal Digital Assistant)。携帯用ゲーム機器、PC(Personal Computer)など表示装置を備える情報処理装置であってもよい。
また、表記変換装置10は、現在位置の情報を取得する機能を有する。表記変換装置10は、GPS(Global Positioning System)や無線LAN、または携帯電話等の基地局の情報を利用して現在位置の情報を取得することができる。現在位置の情報は、緯度経度の情報であってもよいし、地図情報や住所の情報であってもよい。
GPSは、GPS衛星から発信される情報を利用して現在位置を特定し、緯度経度等の情報を取得することができる。また、GPSは、主に、移動端末が屋外に位置している場合に位置情報を特定するシステムである。また、無線LANや基地局の情報を利用する場合には、無線LANの電波を利用したり、基地局から送信される基地局の位置情報を利用したりして位置情報を特定することができる。
表記変換装置10は、ユーザにより入力された文字列に対応する単語データが複数ある場合に、取得した位置情報に応じた単語データを優先的に抽出することができる。例えば、ユーザにより「ebisudemachiawase。」という文字列が入力された場合に、文字列を「ebisu」、「de」、「machiawase」に区切った後に各単語について漢字変換等を行う。「ebisu」の漢字変換候補としては、例えば、「恵比寿」、「恵比須」が挙げられる。「恵比寿」は東京近郊の地名であり、「恵比須」は大阪近郊の地名である。
表記変換装置10は、取得した位置情報が東京近郊の位置情報であった場合には、「ebisu」の漢字変換候補として「恵比寿」を優先的に表示させる。また、表記変換装置10は、取得した位置情報が大阪近郊の位置情報であった場合には、「ebisu」の漢字変換候補として「恵比須」を優先的に表示させる。このように、表記変換装置10は、位置情報に応じた漢字変換候補を優先的に選択するため、ユーザの意図する漢字変換候補を表示することが可能となる。
〔2〕表記変換装置のハードウェア構成
以上、表記変換装置10の概要を説明した。次に、図2を参照して、表記変換装置10のハードウェア構成について説明する。図2は、本実施形態にかかる表記変換装置10のハードウェア構成の一例を示した説明図である。
表記変換装置10は、CPU(Central Processing Unit)101と、ROM(Read Only Memory)102と、RAM(Random Access Memory)103と、ホストバス104と、ブリッジ105と、外部バス106と、インタフェース107と、入力装置108と、出力装置109と、ストレージ装置(HDD)110と、ドライブ111と、通信装置112とを備える。
CPU101は、演算処理装置および制御装置として機能し、各種プログラムに従って表記変換装置10内の動作全般を制御する。また、CPU101は、マイクロプロセッサであってもよい。ROM102は、CPU101が使用するプログラムや演算パラメータ等を記憶する。RAM103は、CPU101の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一次記憶する。これらはCPUバスなどから構成されるホストバス104により相互に接続されている。
ホストバス104は、ブリッジ105を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス106に接続されている。なお、必ずしもホストバス104、ブリッジ105および外部バス106を分離構成する必要はなく、一のバスにこれらの機能を実装してもよい。
入力装置108は、例えば、マウス、キーボード、タッチパネル、ボタン、マイク、スイッチおよびレバーなどユーザが情報を入力するための入力手段と、ユーザによる入力に基づいて入力信号を生成し、CPU101に出力する入力制御回路などから構成されている。表記変換装置10のユーザは、該入力装置108を操作することにより、表記変換装置10に対して各種のデータを入力したり処理動作を指示したりすることができる。
出力装置109は、例えば、CRT(Cathode Ray Tube)ディスプレイ装置、液晶ディスプレイ(LCD)装置、OLED(Organic Light Emitting Display)装置およびランプなどの表示装置と、スピーカおよびヘッドホンなどの音声出力装置で構成される。出力装置109は、例えば、再生されたコンテンツを出力する。具体的には、表示装置は再生された映像データ等の各種情報をテキストまたはイメージで表示する。一方、音声出力装置は、再生された音声データ等を音声に変換して出力する。
ストレージ装置110は、本実施形態にかかる表記変換装置10の記憶部の一例として構成されたデータ格納用の装置であり、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置および記憶媒体に記録されたデータを削除する削除装置などを含むことができる。ストレージ装置110は、例えば、HDD(Hard Disk Drive)で構成される。このストレージ装置110は、ハードディスクを駆動し、CPU101が実行するプログラムや各種データを格納する。
ドライブ111は、記憶媒体用リーダライタであり、表記変換装置10に内蔵、あるいは外付けされる。ドライブ111は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記憶媒体120に記録されている情報を読み出して、RAM103に出力する。
通信装置112は、例えば、通信網50に接続するための通信デバイス等で構成された通信インタフェースである。また、通信装置112は、無線LAN(Local Area Network)対応通信装置であっても、ワイヤレスUSB対応通信装置であっても、有線による通信を行うワイヤー通信装置であってもよい。
〔3〕表記変換装置の機能構成
以上、表記変換装置10のハードウェア構成について説明した。次に、図3を参照して、表記変換装置10の機能構成について説明する。図3は、表記変換装置10の機能構成を示すブロック図である。図3に示したように、表記変換装置10は、文字入力部202と、取得部204と、区切部206と、抽出部208と、変換部210と、記憶部212などを備える。
文字入力部202は、ユーザ操作に応じて文字列を入力する機能を有する。文字入力部202は、上記した入力装置108の一例である。上記したように、表記変換装置10に備わるテンキーなどで構成される入力部12を介して、ユーザ操作により文字等が入力される。文字入力部202により入力された文字列は、区切部206または抽出部208に提供される。例えば、文字入力部202により入力された文字列が複数の単語から形成されている場合には、区切部206に提供し、文字列が一の文字または一の単語から形成されている場合には抽出部208に提供するようにしてもよい。また、文字入力部202は、入力された文字列のすべてを区切部206に提供するようにしてもよい。
取得部204は、位置情報を取得する機能を有する。取得部204に取得される位置情報は、表記変換装置10の現在位置である。上記したように、取得部204は、GPSや無線LANまたは携帯電話の基地局の情報を利用して現在位置の情報を取得する。例えば、表記変換装置10を所持するユーザが屋外に位置する場合には、GPSにより位置情報を取得するようにしてもよい。
また、表記変換装置10を所持するユーザが屋内に位置する場合には無線LANを利用して位置情報を取得するようにしてもよい。取得部204により取得される位置情報は緯度経度の情報であってもよいし、住所の情報であってもよい。取得部204は、取得した位置情報を区切部206および抽出部208に提供する。
区切部206は、文字入力部202により入力された文字列を、記憶部212に記憶されている単語辞書213に基づいて複数の単語に区切る機能を有する。単語辞書213は、記憶部212に格納されているデータベースである。ここで、図4を参照して、通常の単語辞書を用いた文字列の区切り処理について説明する。記憶部212に記憶されている単語辞書213の内容については、後で詳細に説明する。
図4は、通常の単語辞書200の内容について説明する説明図である。図4に示したように、単語辞書200は、単語ID2001、読み2002、表記2003、品詞2004、優先度2005、前結合品詞2006、後結合品詞2007などから構成される。
各単語データの前結合品詞は、単語データの示す単語の前に結合しやすい単語の品詞の順序を示す。例えば、単語IDが「1001」である単語データの前結合品詞は「any」であり、これは、単語IDが「1001」である「恵比寿」の前にはどんな品詞の単語でも結合可能であることを示す。
同様に、各単語データの後結合品詞は、単語データの示す単語の後に結合しやすい単語の品詞の順序を示す。例えば、単語IDが「1001」である単語データの後結合品詞は「助詞、名詞、サ変動詞、動詞」であり、これは、単語IDが「1001」である「今日」の後には助詞が最も結合しやすいことを示す。
なお、マスター辞書の内容は固定されていてもよい。また、図4においては、1の単語データに単語ID、読み、表記、品詞、優先度、前結合品詞、および後結合品詞などの要素が含まれる例を示したが、これらの要素は分離して管理されていてもよい。例えば、読み、表記、品詞および優先度と、前結合品詞および後結合品詞とは分離されていてもよい。
なお、このような単語辞書を記憶している記憶媒体は、不揮発性メモリ、磁気ディスク、光ディスク、およびMO(Magneto Optical)ディスクなどの記憶媒体であってもよい。不揮発性メモリとしては、例えば、EEPROM(Electrically Erasable Programmable Read−Only Memory)、EPROM(Erasable Programmable ROM)があげられる。また、磁気ディスクとしては、ハードディスクおよび円盤型磁性体ディスクなどがあげられる。また、光ディスクとしては、CD(Compact Disc、DVD−R(Digital Versatile Disc Recordable)およびBD(Blu−Ray Disc(登録商標))などがあげられる。
図3に戻り、区切部206は、例えば、ローマ字からなる文字列がユーザにより入力された場合、ローマ字を平仮名に変換し、平仮名からなる文字列を文節に区切るとともに各文節の品詞を決定し、各文節の表記を複数の同一品詞異表記から選択する。また、区切部206は、取得部204により提供された位置情報に基づいて、文字列を複数の単語に区切るようにしてもよい。区切部206による文字列の区切り処理については後で詳細に説明する。
抽出部208は、文字入力部202により入力された文字列に対応する単語データを、記憶部212に記憶された単語辞書213から抽出する機能を有する。単語辞書213は、記憶部212に格納されているデータベースである。ここで、図5を参照して、本実施形態における単語辞書213の内容について説明する。
図5は、本実施形態における単語辞書213の内容について説明する説明図である。図5に示したように、単語辞書213は図4の単語辞書200と同様に、単語辞書200は、単語ID2101、読み2102、表記2103、品詞2104、優先度2105、前結合品詞2106、後結合品詞2107などを有する。単語辞書213は、位置情報2106を有する点で、図4に示した通常の単語辞書とは異なっている。
位置情報2106は、緯度経度の座標情報であってもよいし、所定の範囲を示す情報であってもよい。例えば、位置情報2106は、単語の表記が「恵比寿」である場合には、東京の恵比寿駅の緯度経度情報であってもよいし、恵比寿駅を含む円形状の範囲を示す情報であってもよい。また、東京都全域を含む地図上の範囲を示すようにしてもよい。また、単語の表記が「恵比須」である場合には、大阪の恵比須駅の緯度経度情報であってもよいし、恵比須駅を含む円形状の範囲を示す情報であってもよい。また、神戸市全域を含む地図上の範囲を示すようにしてもよい。
位置情報2106は、単語データごとに関連付けて記憶されている。しかし、位置情報2106とは関係性のない単語データについては「any」として位置情報を特定しなくてもよい。通常、文字列の各文節の表記を複数の同一品詞異表記から選択する場合には、優先度2105に応じた優先度順に表記変換する。例えば、文字列「えびす」に対しては、「恵比寿」と「恵比須」の2つの表記変換候補がある。優先度2105は「恵比寿」の優先度100で「恵比須」の優先度は80である。
したがって、文字列「えびす」の漢字候補として、優先的に「恵比寿」が選択されることとなる。しかし、単語データに位置情報2106が関連付けられている場合には、位置情報2106をもとに漢字変換候補の優先度が決定される。例えば、取得部204により取得された位置情報が、単語データの位置情報2106の範囲内にある場合には、位置情報2106の範囲内にある単語データが優先的に選択されることとなる。
図3に戻り、抽出部208は、文字入力部202に入力された文字列に対応する単語データのうち、取得部204により取得された位置情報が単語データに関連付けられている位置情報の範囲内である単語データを優先的に抽出する機能を有する。また、単語辞書213に記憶されている単語データのうち、取得部204により取得された位置情報が単語データに関連付けられている位置情報の範囲内である単語データを優先的に抽出する。
さらに、上記した区切部206は、取得部204により取得された位置情報に基づいて文字列を複数の単語に区切るようにしてもよい。すなわち、区切部206は、取得部204により取得された位置情報に基づいて、文字列に含まれる複数の単語の結合度を確定するようにしてもよい。
ここで、図6および図7を参照して、文字列の表記変換の具体例について説明する。図6は、通常の文字列の表記変換の具体例を説明する説明図である。図6に示したように、ユーザにより「ebisudemachiawase」というローマ字からなる文字列が文字入力部202を介して入力されたとする。この場合、区切部206は、「ebisudemachiawase」という文字列を「えびすでまちあわせ」という平仮名からなる文字列に自動変換する。
そして、区切部206は、単語辞書213に基づいて、「えびすでまちあわせ」という文字列を文節に区切る。例えば、区切部206は、単語辞書に基づいてラティス構造の構築を行い、各文節の結合度が高くなるように文字列を区切る。通常、1つの文字列には文節の結合パターンが複数存在する。区切部206は、これらの複数の結合パターンから最も確からしい結合パターンを選択し、選択した結合パターンに従って文字列を文節に区切る。例えば、図5の単語辞書に示した前結合品詞と後結合品詞をもとに、各文節間の結合度が最適化された結合パターンを選択する。
そして、「恵比寿」と「恵比須」のように同一品詞であっても表記の異なる単語が存在する場合には、単語データの優先度2106に基づいて、最も優先度が高い表記を選択する。以上、通常の文字列の表記変換の具体例について説明した。
次に、図7を参照して、位置情報を加味した文字列の表記変換の具体例について説明する。図7は、位置情報を加味した文字列の表記変換の具体例を示す説明図である。図7に示したように、ユーザにより「ebisudemachiawase」というローマ字からなる文字列が文字入力部202を介して入力される。区切部206は、「ebisudemachiawase」という文字列を「えびすでまちあわせ」という平仮名からなる文字列に自動変換する。
そして、取得部204により位置情報が取得された後に、区切部206は、ラティス構造の構築ならびに結合度の確定を行う。このとき、区切部206は、取得部204により取得された位置情報の優先度も加味して、ラティス構造を構築したり結合度を確定したりする。具体的には、1つの文字列に対して複数の結合パターンが存在する場合には、取得された位置情報をもとに結合度を確定する。例えば、取得部204により恵比須駅近郊の位置情報が取得された場合には、「えびすでまちあわせ」という文字列について、位置情報の優先度を加味して「えびす|で|まちあわせ」と区切る。
そして、区切部206により位置情報の優先度を加味して最適な文節に区切られた後、同一品詞異表記からの優先度に基づき表記を確定する。このとき、抽出部208は、単語辞書213の優先度2105をもとに表記を確定する。したがって、「えびす」については、「恵比寿」と「恵比須」の表記の異なる単語が存在するが、優先度の高い「恵比寿」を抽出して表記を確定する。
また、取得部204により取得された位置情報の優先度を加味して表記を確定するようにしてもよい。例えば、位置情報が大阪近郊の位置情報を示している場合には、優先度2105の高い「恵比寿」ではなく、大阪近郊の位置情報2106を有する「恵比須」を「えびす」の表記変換候補として抽出する。
以上、位置情報を加味した文字列の表記変換の具体例について説明した。図3に戻り、表記変換装置10の機能の説明を続ける。変換部240は、文字入力部202により入力された文字列を、抽出部208により抽出された単語データの表記に変換する機能を有する。また、変換部210は、抽出部208により抽出された単語データの優先度順に変換するようにしてもよい。
ここで、図8を参照して、文字列の変換候補の表示例について説明する。図8は、文字列の変換候補の表示例を示す説明図である。例えば、単語辞書213に、「かんこうち」の表記として、「観光地」、「浅草」、「箱根」が関連付けられていたとする。抽出部208により、優先度2105順に単語データが抽出された場合には、「かんこうち」の変換候補は、「観光地」、「浅草」、「箱根」の順に表示される。また、例えば、取得部204により浅草近郊の位置情報が取得された場合には、位置情報をもとに変換候補が抽出されるため、「かんこうち」の変換候補は、「浅草」、「箱根」、「観光地」の順に表示される。
図8に示したように、ユーザが浅草近郊に位置していた場合に、「かんこうち」を含む文字列が入力された場合には、「かんこうち」の変換候補として「浅草」が優先的に表示される。すなわち、表記変換装置10の表示部250の変換候補選択欄252に、「浅草」、「箱根」、「観光地」の順に表記変換後の単語データが表示される。また、「かんこうち」の変換候補として、「観光地」を常に優先的に表示させて、その後に位置情報に基づく変換候補である「浅草」や「箱根」を表示させるようにしてもよい。
また、ユーザ操作に応じて、位置情報を常に加味して文字列の区切りや変換を行うか、位置情報をまったく加味せず通常の優先度をもとに文字列の区切り変換を行うかを選択するようにしてもよい。
〔4〕表記変換装置の動作の詳細
以上、表記変換装置10の機能構成について説明した。次に、図9を参照して、表記変換装置10の動作の詳細について説明する。図9は、表記変換装置10の動作を示したフローチャートである。図9に示したように、まず、文字入力部202を介してユーザ操作に応じて文字列が入力される(S102)。
取得部204は、現在の位置情報を取得する(S104)。ステップS104において取得される位置情報は、上記したように、GPSや無線LANなどにより取得されて、区切部206や抽出部208に提供される。
そして、区切部206は、ステップS102において取得された文字列を文節で区切る(S106)。次に、ステップS106において区切られた各文節の表記を選択する(S108)。ステップS106およびステップS108において、区切部206は、ステップS104において取得した位置情報を加味して文字列を区切ったり、各文節の表記を選択したりするようにしてもよい。
そして、抽出部208は、単語辞書213に基づいて、ステップS108において選択された各文節と一致する単語データがあるか否かを判定する(S110)。ステップS110において、各文節と一致する単語データがあると判定された場合には、ステップS112の処理を実行する。ステップS110において、各文節と一致する単語データがないと判定された場合には、処理を終了する。
抽出部208は、ステップS112において、ステップS110において各文節と一致した単語データに関連付けられている位置情報が、ステップS104において取得された位置情報の範囲内であるか否かを判定する(S112)。そして、抽出部208は、ステップS112において位置情報の範囲内であると判定された単語データを優先的に抽出する(S114)。また、ステップS112において、位置情報の範囲内ではないと判定された場合には、通常の優先度2105にしたがって、単語データを抽出する(S116)。
上記したように、ステップS114では、例えば、位置情報に関連する文節であった場合には、表記変換装置10の現在位置付近の変換候補が優先的に表示される。また、位置情報に関連する文節であったとしても、表記変換装置10の現在位置が、データベースに記憶されている位置情報2106の範囲内ではない場合には、通常の優先度2105に応じて変換候補が表示される。
そして、変換部210は、ステップS102において入力された文字列を、ステップS114またはステップS116において抽出された単語データの表記に変換する(S118)。以上、表記変換装置10の動作の詳細について説明した。
以上説明したように、本実施形態にかかる表記変換装置10は、取得部204により取得した位置情報をもとに、入力された文字列を文節に区切ったり、文節に対応する単語データを抽出したりすることができる。これにより、ユーザが現在位置している場所に応じた表記変換候補を提示することができる。また、表記変換候補として、地域に密着した情報をユーザに提供することが可能となる。したがって、ユーザが意図する変換候補を優先的に表示させることができるため、ユーザの意図とは関係なく定められた単語辞書の優先順位に応じて変換された表記を変更する煩わしさを解消することが可能となる。
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
例えば、上記実施形態では、単語辞書213を格納している記憶部212が表記変換装置10に備わるとして説明したが、本発明はかかる例に限定されない。例えば、記憶部212を表記変換装置10とは別体のサーバに備えてもよい。表記変換装置10とサーバとをネットワークを介して接続して、入力された文字列と位置情報とをサーバに送信するようにしてもよい。この場合、サーバは、表記変換装置10から送信された文字列と位置情報をもとに、最適な変換結果を表記変換装置10に送信するようにしてもよい。
例えば、本明細書の表記変換装置10の処理における各ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はない。例えば、表記変換装置10の処理における各ステップは、フローチャートとして記載した順序と異なる順序で処理されても、並列的に処理されてもよい。
また、表記変換装置10に内蔵されるCPU201、ROM202およびRAM203などのハードウェアを、上述した表記変換装置10の各構成と同等の機能を発揮させるためのコンピュータプログラムも作成可能である。また、該コンピュータプログラムを記憶させた記憶媒体も提供される。また、図3の機能ブロック図で示したそれぞれの機能ブロックをハードウェアで構成することで、一連の処理をハードウェアで実現することもできる。
10 表記変換装置
202 文字入力部
204 取得部
206 区切部
208 抽出部
210 変換部
212 記憶部
213 単語辞書

Claims (7)

  1. 文字入力部と、
    位置情報を取得する取得部と、
    単語データと位置情報とが関連付けられているデータベースを記憶している記憶部と、
    前記文字入力部に入力された文字列に対応する前記単語データのうち、前記取得部により取得された位置情報が前記単語データに関連付けられている位置情報の範囲内である単語データを優先的に抽出する抽出部と、
    前記文字入力部に入力された文字列を、前記抽出部により抽出された単語データの表記に変換する変換部と、
    を備える、表記変換装置。
  2. 前記単語データは、
    少なくとも単語の変換前の表記、変換後の表記、位置情報を含み、
    前記抽出部は、
    前記文字入力部に入力された文字列と前記単語データの変換前の表記とが一致する前記単語データのうち、前記取得部により取得された位置情報が前記単語データに関連付けられている位置情報の範囲内である単語データを優先的に抽出する、請求項1に記載の表記変換装置。
  3. 前記変換部は、
    前記文字入力部に入力された文字列を、前記抽出部により抽出された単語データの優先度順に変換する、請求項1に記載の表記変換装置。
  4. 前記文字入力部に入力された文字列を複数の単語に区切る区切部を備え、
    前記区切部は、
    前記取得部により取得された位置情報に基づいて前記文字列を複数の単語に区切る、請求項1に記載の表記変換装置。
  5. 前記区切部は、
    前記取得部により取得された位置情報に基づいて、前記文字列に含まれる複数の単語の結合度を確定する、請求項4に記載の表記変換装置。
  6. ユーザにより文字列が入力されるステップと、
    位置情報を取得するステップと、
    前記文字入力部に入力された文字列に対応する単語データのうち、前記取得された位置情報が前記単語データに関連付けられている位置情報の範囲内である単語データを優先的に抽出するステップと、
    前記入力された文字列を、前記抽出された単語データの表記に変換するステップと、
    を含む、表記変換方法。
  7. コンピュータを、
    文字入力部と、
    位置情報を取得する取得部と、
    単語データと位置情報とが関連付けられているデータベースを記憶している記憶部と、
    前記文字入力部に入力された文字列に対応する前記単語データのうち、前記取得部により取得された位置情報が前記単語データに関連付けられている位置情報の範囲内である単語データを優先的に抽出する抽出部と、
    前記文字入力部に入力された文字列を、前記抽出部により抽出された単語データの表記に変換する変換部と、
    を備える、表記変換装置として機能させるための、プログラム。
JP2009181688A 2009-08-04 2009-08-04 表記変換装置、表記変換方法およびプログラム Withdrawn JP2011034441A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009181688A JP2011034441A (ja) 2009-08-04 2009-08-04 表記変換装置、表記変換方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009181688A JP2011034441A (ja) 2009-08-04 2009-08-04 表記変換装置、表記変換方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2011034441A true JP2011034441A (ja) 2011-02-17

Family

ID=43763434

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009181688A Withdrawn JP2011034441A (ja) 2009-08-04 2009-08-04 表記変換装置、表記変換方法およびプログラム

Country Status (1)

Country Link
JP (1) JP2011034441A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015193960A1 (ja) * 2014-06-17 2015-12-23 楽天株式会社 情報処理装置、サーバ装置、情報処理システム、情報処理方法及びプログラム
JP2016066336A (ja) * 2014-09-16 2016-04-28 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 候補文字をランク付けするための方法及び装置並びに文字を入力するための方法及びデバイス

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015193960A1 (ja) * 2014-06-17 2015-12-23 楽天株式会社 情報処理装置、サーバ装置、情報処理システム、情報処理方法及びプログラム
JP5839642B1 (ja) * 2014-06-17 2016-01-06 楽天株式会社 情報処理システム及び情報処理方法
JP2016066336A (ja) * 2014-09-16 2016-04-28 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 候補文字をランク付けするための方法及び装置並びに文字を入力するための方法及びデバイス

Similar Documents

Publication Publication Date Title
US7162412B2 (en) Multilingual conversation assist system
JP4058071B2 (ja) 用例翻訳装置、用例翻訳方法および用例翻訳プログラム
US20140297254A1 (en) Text data processing method and electronic device thereof
JP4872323B2 (ja) Htmlメール生成システム、通信装置、htmlメール生成方法、及び記録媒体
KR101183340B1 (ko) 컴퓨팅 장치에 입력을 제공하기 위한 효율적인 멀티모달방법
JP2012079252A (ja) 情報端末装置、文字入力方法および文字入力プログラム
JP2009205579A (ja) 音声翻訳装置およびプログラム
TWI305314B (en) Zhu yin symbol and tone mark input method, and electronic device
JP2008090625A (ja) 文字入力装置、文字入力方法、制御プログラム、および、記録媒体
JP2014049140A (ja) 使用者デバイスで入力文字を利用した知能型サービス提供方法及び装置
JP2014048506A (ja) 単語登録装置及びそのためのコンピュータプログラム
KR20080083290A (ko) 디지털 파일의 컬렉션에서 디지털 파일을 액세스하기 위한방법 및 장치
JP2014219834A (ja) 情報処理装置、情報処理方法、及びプログラム
TW200842662A (en) Stroke number input
CN108986820A (zh) 用于语音翻译的方法、装置、电子设备和存储介质
JP2008040373A (ja) 音声ガイダンスシステム
JP2011034441A (ja) 表記変換装置、表記変換方法およびプログラム
CN100517186C (zh) 基于按键和语音识别的文字输入方法及装置
EP2851891B1 (fr) Terminal mobile utilisateur et procédé de commande d'un tel terminal
JP2004145732A (ja) 音声識別支援漢字入力システムおよび方法
JP2007206796A (ja) 文字処理装置、方法、プログラムおよび記録媒体
KR100834279B1 (ko) 모바일 단말기의 문자 입력 처리방법 및 이를 수행하기위한 모바일 단말기
JP2017126152A (ja) 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム
JP2001109740A (ja) 中国語文書作成装置及び中国語文書作成方法
JP4622861B2 (ja) 音声入力システム、音声入力方法、および、音声入力用プログラム

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20121106