JP5363522B2 - 日本語の単字入力を支援する機能を提供する方法及びシステム - Google Patents

日本語の単字入力を支援する機能を提供する方法及びシステム Download PDF

Info

Publication number
JP5363522B2
JP5363522B2 JP2011055800A JP2011055800A JP5363522B2 JP 5363522 B2 JP5363522 B2 JP 5363522B2 JP 2011055800 A JP2011055800 A JP 2011055800A JP 2011055800 A JP2011055800 A JP 2011055800A JP 5363522 B2 JP5363522 B2 JP 5363522B2
Authority
JP
Japan
Prior art keywords
japanese
single character
input
character
specific
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011055800A
Other languages
English (en)
Other versions
JP2011129159A (ja
Inventor
ド ヨン キム
ス キム
ユー チョル ムン
テ フン リー
ヒョン ミン ユ
ジョン シク パク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naver Corp
Original Assignee
Naver Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naver Corp filed Critical Naver Corp
Publication of JP2011129159A publication Critical patent/JP2011129159A/ja
Application granted granted Critical
Publication of JP5363522B2 publication Critical patent/JP5363522B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、日本語エイリアス(alias)データベースを利用して長音及び促音に対するマッチング情報を提供して日本語入力機の使用の際に単字検索機能を提供する方法及びシステム関するもので、より詳細には、日本語入力機を使用して単字を入力する場合、単字を容易に探すことができるように支援する機能を提供する方法及びシステム、並びにその方法を実行させるためのコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体に関するものである。
最近、韓国政府による日本文化開放政策以来、日本の大衆文化に対する関心が高まり、様々な日本語辞書サービスが登場している。
このような日本語辞書サービスは、多様な単語及び熟語に関する意味をユーザーに提供するだけでなく、当該単語または熟語の含まれた例文などをユーザーに共に提供する。
しかしながら、従来の日本語辞書サービスによれば、図1Aに示すように、ユーザーが日本語辞書に記録されていない「ときょ」という日本語をクエリーで入力して検索を要請する場合、「検索語「ときょ」に関する検索結果がありません。」のような案内文句が出力されるだけで、「ときょ」というクエリーを入力したユーザーが実際に検索しようとした日本語単語が何かに関しては全く考慮されないので、ユーザーが日本語単語のスペリングを明確に知らない状況では検索を遂行することが容易ではなかった。
日本語単語の中には、発音が似ていても長短音の可否(有無)によってその意味が変わる単語が多い。従って、日本語初級者であるユーザーが検索しようとする単語の正確な表記法を知らない状況では、前記ユーザーは、希望する検索結果を得ることができない恐れがあった。
すなわち、従来の日本語辞書サービスは、一般的な日本語辞書に記録されている単語にマッチしている情報だけが検索結果として提供される短所があり、日本語単語に含まれた短音部分(または長音部分)を長音(または短音)に誤入力した可能性を考慮しないので、入力しようとする単語の長短音を明確に知らない多くのユーザーには、希望しない検索結果が提供される恐れがあった。
また、従来の日本語辞書サービスによれば、図1Bに示すように、ユーザーが「がこう」とのクエリーを入力して検索結果を要請する場合、ユーザーは、「学校」との意味の日本語単語である「がっこう」に関して検索したかったが、促音が含まれているか否かに関して知らない場合、希望しない検索結果だけを得ることになった。
すなわち、クエリーが促音の含まれた日本語単語である場合、間違えて促音を入力する可能性を考慮せず、クエリーが促音の含んでいない日本語単語である場合にも、間違えて促音を抜かして入力する可能性も考慮しないため、入力しようとする単語に促音が含まれているか否かに関して明確に知らない多くのユーザーは、希望しない検索結果を得るしかなかった。
一方、従来技術による日本語入力機を使用して、日本語文字(ひらがな又はカタカナ)を入力するためには、図2に示すように、日本語入力機に含まれている、いわゆる日本語文字表上で入力を希望する日本語文字(すなわち、単字)が日本語入力機上のどの部分に位置しているかをいちいち確認して入力しなければならなかった。勿論、日本語のレベルが中級以上であるユーザーにとっては、日本語文字表上で入力を希望する単字の位置を探すことが難しくないこともあり、他の入力方法としてキーボード自体を日本語入力モードに変更して入力することもできるが、そうでないユーザーにとっては、このような日本語文字表を利用して単字を探して入力することが非常に面倒であり、不便であった。
したがって、前述したような従来技術の諸問題を解決するためになされた本発明は、ユーザーが日本語入力機を利用する際、より便利に日本語単字を入力できるように手伝う(支援する)ユーザーインターフェースを提供することにその目的がある。
前述したような本発明の目的を達成し、後述する本発明の特徴的な機能を遂行するための本発明の特徴的な構成は次のようになっている。
本発明の一態様によれば、日本語辞書サービスを利用する端末装置に日本語単字入力を支援する機能を提供する方法であって、(a)ひらがな及びカタカナのうち少なくとも一つを含む日本語文字表及び日本語文字表の周辺に単字検索ウィンドウを端末装置に表示させる段階と、(b)検索を希望する特定の日本語単字に該当する発音記号が日本語以外の言語で単字検索ウィンドウに入力された場合に、日本語単字と発音記号とを関連付けて記憶する言語データベース(エイリアスデータベース)を参照して入力された発音記号に該当する特定の日本語単字を検索し、日本語文字表上における入力された発音記号に対応する特定の日本語単字の位置を活性化表示させる段階と、を含む方法が提供される。
上記エイリアスデータベースは、日本語単語ごとに、日本語単語の発音記号を日本語以外の言語で表記したデータをマッチさせて記憶しており、上記(b)段階は、単字検索ウィンドウを通じて日本語以外の言語で表現された発音記号が入力された場合に、入力された日本語以外の言語の発音記号にマッチする日本語単字をエイリアスデータベースから検索し、日本語文字表上に含まれた日本語単字のうち検索された特定の日本語単字と同一の日本語単字を活性化表示するように構成することができる。
本発明のまた他の態様によれば、上記方法をコンピュータに実行させるためのコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体が提供される。
本発明のまた他の態様によれば、日本語辞書サービスを利用する端末装置に日本語単字入力を支援する機能を提供するためのシステムであって、ひらがな及びカタカナのうち少なくとも一つを含む日本語文字表及び日本語文字表の周辺に単字検索ウィンドウを端末装置に表示させるインターフェース制御を遂行するインターフェース部と、検索を希望する特定の日本語単字に該当する発音記号が日本語以外の言語で単字検索ウィンドウに入力された場合に、日本語単字と発音記号とを関連付けて記憶する言語データベース(エイリアスデータベース)を参照して入力された発音記号に該当する特定の日本語単字を検索し、日本語文字表上における入力された発音記号に対応する特定の日本語単字の位置を活性化表示させる単字マッチング部と、を含むシステムが提供される。
本発明によれば、日本語入力機を使用して日本語単字を入力する場合、日本語以外の外来語(例えば、韓国語、ローマ字など)を使用して日本語単字の発音を入力することによって、単字を容易に探して入力することができる。
従来の日本語辞書サービスにより提供される検索結果を示す図面である。 従来の日本語辞書サービスにより提供される検索結果を示す図面である。 従来の日本語入力機により提供されるユーザーインターフェースを示す図面である。 本発明の一実施形態に係る日本語情報を提供するサービスにおいて、長短音及び促音に関するマッチング情報を提供して日本語入力機の使用の際に単字検索機能を提供する全体システムの構成図である。 本発明の一実施形態に係る辞書データベースの内部構成を詳しく示す図面である。 本発明の一実施形態に係るエイリアスデータベースの内部構成を詳しく示す図面である。 本発明の一実施形態に係る日本語辞書サービスにより提供している検索結果の一例を示す図面である。 本発明の一実施形態に係る日本語辞書サービスにより提供している検索結果の一例を示す図面である。 本発明の一実施形態に係る日本語辞書サービスにより提供している検索結果の一例を示す図面である。 本発明の一実施形態に係る日本語入力機を使用して容易に単字を入力するためのユーザーインターフェースの一例を示す図面である。 本発明の一実施形態に係る日本語入力機を使用して容易に単字を入力するためのユーザーインターフェースの一例を示す図面である。 本発明の一実施形態に係る筆記認識機による単字入力機能の使用例を示す図面である。
以下、本発明を実施できる特定実施形態を例示として示し、添付図面を参照しながら本発明について詳細に説明する。後述するこれらの実施形態は、当業者が本発明を十分に実施できるように詳細に説明する。本発明の多様な実施形態は互いに異なるが、相互排他的である必要はないと理解しなければならない。例えば、ここに記載されている特定形状、構造及び特性は一実施形態に関連して本発明の技術的思想及びその範囲から逸脱せずに他の実施形態として具現することができる。また、ここに開示したそれぞれの実施形態のうち、個別構成要素の位置または配置は、本発明の技術的思想及びその範囲から逸脱せずに変更できることを理解するべきである。したがって、後述する詳細な説明は限定的な意味で扱うものでなく、本発明の技術的範囲は、適切に説明されるならば、その請求項に記載された本発明と均等な全ての技術的範囲と共に添付した特許請求範囲によって定められる。
全体システムの構成
図3は、本発明の一実施形態に係る日本語辞書サービスを利用して日本語情報を提供することにおいて、長短音及び促音に関するマッチング情報を提供して日本語入力機の使用の際に単字検索機能を提供する全体システム300の構成図である。
図3に示すように、本発明の一実施形態に係る全体システム300は、検索結果提供部310、単字マッチング部320、筆記認識部330、辞書データベース340、エイリアスデータベース350、通信部360、インターフェース部370及び制御部380を含むことができる。
本発明の一実施形態によれば、検索結果提供部310、単字マッチング部320、筆記認識部330、辞書データベース340、エイリアスデータベース350、通信部360、インターフェース部370及び制御部380は、そのうち少なくとも一部が全体システム300に含まれたり全体システム300と通信したりするプログラムモジュールである(なお、図3は、検索結果提供部310、単字マッチング部320、筆記認識部330、辞書データベース340、エイリアスデータベース350、通信部360、インターフェース部370及び制御部380が全体システム300に含まれていると示している)。このようなプログラムモジュールは、運営システム(オペレーティングシステム)、応用プログラムモジュール及びその他のプログラムモジュールの形態でシステムに含まれることができ、物理的に様々な公知の記憶装置上に格納されることもできる。また、このようなプログラムモジュールは、システムと通信可能な遠隔記憶装置に格納されることもできる。このようなプログラムモジュールは、本発明によって後述する特定機能を遂行したり、特定の抽象データ類型を実行するルーチン、サブルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを包括するが、これに限定されるものではない。つまり、全体システム300は、1つ又は複数のサーバ装置等のコンピュータ装置で実現することが可能であり、例えば、辞書データベース340及びエイリアスデータベース350を1つ又は個別のデータベースサーバとして構成して、検索結果提供部310、単字マッチング部320、筆記認識部330、及び通信部360、インターフェース部370及び制御部380を、日本語辞書サービスを利用してユーザー端末装置に検索結果を提供するためのサービスサーバ装置として構成したり、また、図3に示すように全体システム300を1つのサーバ装置で構成することも可能である。つまり、全体システム300の各部を1つ又は複数のコンピュータ装置で実現することが可能である。
検索結果提供部310は、ウェブを通じて提供される日本語辞書サービスの検索欄に入力された特定の日本語クエリーが受信されると、日韓辞書データベース341内で特定の日本語に対応して格納された情報を抽出し、検索結果として抽出された情報をユーザーの端末装置200に提供する。
このとき、特定の日本語に含まれた文字が長音であるか短音であるかを判断して、長短音エイリアスデータベース355内で特定の日本語とマッチしている長音または短音単語(例えば、特定の日本語に短音が存在する場合、短音を長音に変えた単語がマッチし、長音が存在する場合、長音を短音に変えた単語がマッチする)を抽出すると同時に、促音エイリアスデータベース356内で特定の日本語とマッチしている単語(例えば、特定の日本語に促音が含まれる場合、促音を除去した単語がマッチし、促音が含まれていない場合、促音を含んだ単語がマッチする)を抽出し(長短音エイリアスデータベース355及び促音エイリアスデータベース356については、以後図4Bを参照してより詳細に説明する)、ユーザーが入力した特定の日本語及び特定の日本語にマッチした単語をクエリーとして日韓辞書データベース341内で検索してユーザー端末装置200に提供することができる。これに関する具体的な例については、以後図5を参照して詳細に説明する。
本発明の一実施形態に係る単字マッチング部320は、ユーザーが日本語入力機に提供される単字発音入力欄を通じて入力された韓国語またはローマ字を受信すると、入力された韓国語またはローマ字にマッチしている日本語単字を韓国語エイリアスデータベース354またはローマ字エイリアスデータベース353から取得して、ユーザー端末装置200に提供する(ローマ字エイリアスデータベース353及び韓国語エイリアスデータベース354は、以後図4Bを参照して詳細に説明する)。ここで、ユーザーが単字発音入力欄を通じて入力する際、検索を希望する特定の日本語単字に該当する発音記号を韓国語またはローマ字で表記したものであればよい。これに関する具体的な例については、以後図6を参照して詳細に説明する。なお、単字発音入力欄を通じた入力は、上記の例に限定されるものではなく、韓国語、ローマ字、中国語、アラビア語など多様な日本語以外の言語を使用して特定の日本語単字に該当する発音記号を表記する例も含むことができる。従って、ユーザー自分自身が使用し易い言語を使って日本語単字の入力を容易に遂行することができる。
本発明の一実施形態に係る筆記認識部330は、ユーザーがマウスなどのポインティングディバイスを利用して日本語筆記認識機上に提供される入力欄に線を引いて、入力された日本語単字(すなわち、筆記体)の字自体の構造または形態を分析し、入力された単字の構造または形態と同一または類似の日本語文字を各種データベースから抽出して、ユーザー端末装置200に提供する。このとき、入力された単字の構造または形態と同一または類似の日本語文字の例としては、日本語漢字、ひらがな、カタカナなどを挙げることができ、これに関する具体的な例の適用については、以後図7を参照して詳細に説明する。
本発明の一実施形態に係る辞書データベース340及びエイリアスデータベース350は、狭い意味のデータベースだけでなく、ファイルシステムに基づいたデータ記録などを含む広い意味のデータベースも含み、単純なログ(log)の集合であっても、これを検索してデータを抽出することができるなら、本発明で言うデータベースに含まれることができる。
本発明の一実施形態に係る辞書データベース340及びエイリアスデータベース350の詳細な構成については、以後図4Aから図4Bを参照して詳細に説明する。
本発明の一実施形態に係る通信部360は、本発明の全体システム300とネットワークを通じて連結されたユーザー端末装置200などとの間で所定のデータを送受信する役割を果たす。たとえば、通信部360は、ユーザー端末装置200のような遠隔コンピュータとの通信のための所定の物理的コネクターなどで構成されることができ、所定の通信プロトコルによってユーザーデータ通信を遂行することができる。また、各構成モジュールの間に伝送される信号を送受信する役割を果たす。
本発明の一実施形態に係るインターフェース部370は、ユーザーがクエリーを入力できるように単語検索ウィンドウをユーザー端末装置200にディスプレイし(提供し)、単語検索ウィンドウの近隣に検索語自動完成リストをディスプレイして、単語検索ウィンドウに日本語入力を容易に遂行できるように、ユーザーから日本語以外の言語(例えば、韓国語のハングル、ローマ字など)の入力を受け取り、入力された発音と同一または類似の発音を有するひらがなまたはカタカナ形態の単字を出力する単字入力機などをディスプレイする。また、検索結果提供部310から提供された検索結果をディスプレイし、ユーザーが検索語に対応する情報をより正確に、且つ速かに得られるように助ける。
本発明に係る制御部380は、検索結果提供部310、単字マッチング部320、筆記認識部330、辞書データベース340、エイリアスデータベース350、及びインターフェース部370の間のデータの流れを制御する機能を遂行する。すなわち、本発明に係る制御部380は、通信部360を通じて各構成モジュールの間に送受信される信号を制御することによって、検索結果提供部310、単字マッチング部320、筆記認識部330、辞書データベース340、エイリアスデータベース350、及びインターフェース部370でそれぞれの固有の機能を遂行できるように制御する。
本発明の一実施形態によれば、ユーザー端末装置200は、日本語情報を受信するために、ユーザーがネットワークを通じて全体システム300に接続した後、通信を遂行する機能を含むデジタル機器として、個人用コンピュータ(例えば、デスクトップパソコン、ノートパソコン、タブレットコンピュータ、パームトップコンピュータなど)、ワークステーション、PDA、ウェブパッド、携帯電話機などのように、メモリ手段を備え、マイクロプロセッサを搭載して演算能力を有したデジタル機器ならば、全て本発明に係るユーザー端末装置200として採択することができる。
データベースの構成
図4Aから図4Bは、本発明の一実施形態に係る辞書データベース340及びエイリアスデータベース350の具体的な構成をそれぞれ示す図面である。
図4Aに示すように、辞書データベース340は、日韓辞書データベース341、韓日辞書データベース342、外来語辞書データベース343、及び漢字読み取り辞書データベース344などを含むことができる。
具体的に、日韓辞書データベース341は、日本語単語または熟語などに対応する発音、意味、語源、用法などを韓国語で分析した情報を格納したものであり、例えば「あさ」という日本語エントリーに対応して
Figure 0005363522
のような韓国語で表現した意味などを格納することができる。これを参照すれば、ユーザーが入力した日本語クエリーに対して韓国語で分析した情報をユーザーに容易に提供することができる。
韓日辞書データベース342は、韓国語単語または熟語などに対応する日本語表現、意味、用法などを格納したものであり、例えば
Figure 0005363522
という韓国語エントリーに対応して「あさ」及びこの「あさ」が含まれた例文「朝あさから晩ばんまで」のような情報などを格納することができる。これを参照すれば、ユーザーが入力した韓国語クエリーに対して日本語で分析した情報をユーザーに容易に提供することができる。
外来語辞書データベース343は、外来語単語または熟語などに対応する日本語情報及び/または韓国語による説明を格納したものであり、例えば「morning」という外来語エントリーに対応して日本語単語「モーニング」、韓国語による説明
Figure 0005363522
、例文
Figure 0005363522
のような情報などを格納することができる。このとき、日本語は、外来語をカタカナで表記する特徴があるので、外来語に対応する日本語単語は、カタカナの形態で格納することができる。これを参照すれば、ユーザーが入力した外来語クエリーに対して日本語及び/または韓国語で説明された情報をユーザーに容易に提供することができる。
漢字読み取り辞書データベース344は、漢字が含まれた単語または熟語などに対応する日本語発音、意味、用法などを格納したものであり、例えば「朝」という漢字エントリーに対応して日本語の訓読みである「あさ」及び音読みである「ちょう」のような情報などを格納することができる。これを参照すれば、ユーザーが入力した漢字クエリーに対して当該漢字の訓読み、音読み、用法などの情報をユーザーに容易に提供することができる。
本発明の一実施形態に係るエイリアスデータベース350は、各辞書の固有エントリーに対する多様な入力方式(いわゆる、エントリーエイリアス)を実現するために各種のマッチング情報をデータベース化したものであり、図4Bに示すように、ひらがなエイリアスデータベース351、カタカナエイリアスデータベース352、ローマ字エイリアスデータベース353、韓国語エイリアスデータベース354、長短音エイリアスデータベース355及び促音エイリアスデータベース356などを含んで構成される。
まず、ひらがなエイリアスデータベース351は、辞書データベース340に記録された全ての単語及び熟語などのエントリーをひらがなで表記したデータが格納される。例を挙げると、「愛する」という単語は、この日本語発音をひらがなで表記した「あいする」にマッチして格納することができる。
カタカナエイリアスデータベース352は、辞書データベース340に格納された全ての単語及び熟語などのエントリーをカタカナで表記したデータが格納される。例えば、「愛する」という単語は、この日本語発音をカタカナで表記した「アイスル」にマッチして格納することができる。
ローマ字エイリアスデータベース353は、辞書データベース340に格納された全ての単語及び熟語などのエントリーをローマ字表記で表記したデータが格納される。例を挙げると、「愛する」という単語は、これの日本語発音をローマ字で表記した「aisuru」にマッチして格納することができる。
韓国語エイリアスデータベース354は、辞書データベース340に格納された全ての単語及び熟語などのエントリーを韓国語表記で表記したデータが格納される。例を挙げると、「愛する」という単語は、これの日本語発音を韓国語で表記した
Figure 0005363522
にマッチして格納することができる。
長短音エイリアスデータベース355は、長短音エラーを許容できるように辞書データベース340に格納された日本語単語に対して、上記日本語単語に含まれた長音を短音に変えたり、日本語単語に含まれた短音を長音に変えたりした長短音変更表現をマッチさせて格納する。勿論、長短音変更表現が意味のある日本語単語に該当する場合にだけマッチングデータとしてエイリアスデータベース355に格納されるようにすることができる。
一方、日本語単語に長短音変更可能なところが2以上の場合、少なくとも一つ以上の部分に対してそれぞれ長短音変更を適用した単語をマッチさせることもできる。
例えば、短音を含む単語である「しょこ」に対して長短音を考慮したマッチングデータを考えてみると、長短音変更可能な部分が二つ(すなわち、「しょ」の部分及び「こ」の部分)であるため、「しょうこ」、「しょこう」、「しょうこう」などがマッチングデータになることができ、これらと互いにマッチして(関連付けて)格納することができる。
促音エイリアスデータベース356は、促音表記エラーを許容できるように辞書データベース340に格納された日本語単語のうち、促音が含まれていない単語に対して促音が挿入可能な位置に促音の挿入された単語を対応させて格納することができる。(ここで促音とは、音と音との間に閉鎖される音として、韓国語ではその音を歯音である
Figure 0005363522
で表記しており、日本語では「っ」または「ッ」と書いて、「小さな‘つ’」と呼ぶ。)また、辞書データベース340に格納された日本語単語のうち、促音が含まれている単語に対して促音を除去した単語を対応させて格納することができる。勿論、促音を挿入したり、除去したりしたデータが意味のある日本語単語に該当する場合にだけマッチングデータとして促音データベース356に格納することができる。
例えば、促音の含まれていない単語である「がこう」は、促音の含まれた単語「がっこう」などと互いにマッチして格納することができる。
一方、日本語単語に2以上の促音が含まれた場合、少なくとも一つ以上の促音に対して促音を削除した単語をマッチすることができ、日本語単語に含まれた促音の数より多くの促音を挿入することができる場合には、促音をさらに挿入した単語をマッチすることもできる。
本発明において、各々の構成を辞書データベース340及びエイリアスデータベース350として分類したのは、ユーザーに日本語情報を提供する際に改善された検索機能を提供するために便宜上分類したもので、必ずしもこれに限定されるものではなく、前述したデータベースは、システム管理の効率性及び便宜に応じて互いに集合したり、別のデータベースなどに分離したりすることができる。
以上、本発明の一実施形態に係る辞書データベース340及びエイリアスデータベース350の構成について説明した。以下では、図5Aから図7を参照して本発明の活用例について詳細に説明する。
本発明の活用例
図5Aは、本発明の一実施形態において、日本語辞書サービスにより提供されるユーザーインターフェース500の構成を簡略に示す図面であり、図5B及び図5Cは、検索結果提供部310により検索結果が提供される画面を例示的に示す図面である。
図5Aに示すように、本発明に係るユーザーインターフェース500は、ユーザーがクエリーを入力するための検索語入力ウィンドウ502、ユーザーが入力したクエリーに対応する検索結果をシステム300に要請するための検索ボタン504、日本語入力機600のディスプレイを要請する日本語入力機ボタン520及び筆記認識機700のディスプレイを要請する筆記認識機ボタン510を含んで構成することができる。
ユーザーは、検索語入力ウィンドウ502に直接クエリーを入力することもでき、筆記認識機ボタン510または日本語入力機ボタン520を押して筆記認識機700や日本語入力機600をディスプレイさせた後、これを使用してクエリーを容易に入力することもできる。つまり、インターフェース部370は、ユーザー端末装置200からの要請に応答してユーザーインターフェース500を伝送し、ユーザーの操作に応じて各ウィンドウ、ボタン、日本語入力機600、筆記認識機700等の表示制御及び入力制御を遂行することができる。
本発明の一実施形態に係る日本語入力機600と筆記認識機700は、ユーザーがひらがな、カタカナ、漢字などからなる検索語を容易に作れるようにするために提供する機能であり、これに対する詳細な説明については、図6から図7を参照して後述する。
図5Bに示すように、検索語入力ウィンドウ502内にクエリーとして入力された日本語がシステム300に伝送されると、検索結果提供部310によって現在入力されたクエリーに対応する情報が日韓辞書データベース341内で検索されて検索結果表示部506上に提供されることができ、上記クエリーと長短音マッチする単語を長短音エイリアスデータベース355から取得してこれに対応する情報を日韓辞書データベース341から検索した情報を検索結果表示部506上に提供している。
例えば、ユーザーが検索語入力ウィンドウ502に「ときょ」との日本語をクエリーとして入力した状態であると仮定すると、検索結果提供部310は、ユーザー端末装置200からユーザーが入力した「ときょ」を受信した後、日韓辞書データベース341から「ときょ」に対応して格納された情報を検索しようとするはずであると同時に(この場合には当該単語がないので検索結果の内容もない)、長短音エイリアスデータベース355から「ときょ」にマッチしている長音単語(例えば、ときょう、とうきょうなど)を抽出した後、また日韓辞書データベース341から「ときょう」、「とうきょう」などに対する情報を抽出してユーザー端末装置200に伝送することができる。
ユーザー端末装置200に伝送された前述したような単語は、検索結果表示部506上にディスプレイされてユーザーが閲覧または選択できるように提供する。すなわち、ユーザーが長短音表記に対して明確に認知していない場合でも、長短音エラーを勘案した検索結果が提供されるので、ユーザーが得ようとした情報により一層近接する確率の高い検索結果を得ることができる。
また、図5Cに示すように、検索結果表示部506は、促音エラーを許容した単語も含むことができる。例えば、検索語入力ウィンドウ502に促音の含まれない単語である「がこう」をユーザーが入力したと仮定する。このとき、検索結果提供部310は、ユーザー端末装置200からユーザーが入力した単語である「がこう」を受信した後、日韓辞書データベース341から「がこう」に対する全ての情報を検索してユーザー端末装置200に伝送する。これと同時に、検索結果提供部310は、促音エイリアスデータベース356から「がこう」とマッチしている促音の含まれた単語(例えば、がっこうなど)を抽出した後、また日韓辞書データベース341から「がっこう」に対する情報(例えば、がっこうに対する意味、例文、これと同一な意味を有する韓国語単語など)を検索してユーザー端末装置200に伝送する。ユーザー端末装置200に伝送された前述したような情報は、検索結果表示部506上にディスプレイされてユーザーが閲覧または選択できるように提供する。このように、促音表記エラーを許容して検索結果を提供することによって、ユーザーが希望する多様な検索結果により一層適合される情報を速かに得ることができる。また、ユーザーは、検索結果表示部506上にディスプレイされた情報のうち特定情報を選択することによって、特定情報に対するより一層詳細な情報を得ることもできる。
以下では、図6及び図7を参照して、日本語入力機600及び筆記認識機700が提供される具体的な例について詳細に説明する。
図6Aから及び図6Bは、本発明の一実施形態に係る日本語入力機600による単字入力方法を示す図面であり、図7は、本発明の一実施形態に係る筆記認識機700による日本語文字入力方法を示す図面である。
図6Aから及び図6Bに示すように、日本語入力機600は、日本語文字表610、単字発音入力欄620、マッチング単字出力欄630などを含んで構成することができる。
ここで、日本語文字表610は、ひらがな及びカタカナのそれぞれに対して日本字の五十音を声音の種類によって、子音が同一なものは同じ行に、音訓が同一なものは同じ段に配列した表で構成し、ひらがなとカタカナを自由に転換できるように構成することができる。
そして、単字発音入力欄620は、検索しようとする日本語単字に対する発音を入力できるように、空いているテキストウィンドウ形態で構成することができ、マッチング単字出力欄630は、ユーザーが単字発音入力欄620に入力したハングルまたはローマ字などと発音が同一または類似の日本語単字などがディスプレイされる箇所で、日本語単字の出力形態をひらがなまたはカタカナなどに予め定めることができる。
具体的に、図6Bに示すように、ユーザーが単字発音入力欄620に
Figure 0005363522
との韓国語文字を入力する場合、単字マッチング部320は、韓国語エイリアスデータベース354から
Figure 0005363522
にマッチしている日本語単字である「あ」及び「ぁ」を検索してマッチング単字出力欄620にディスプレイする。このとき、ユーザーが「あ」を選択する場合、日本語文字表610上の「あ」がハイライティング(活性化)されて検索語入力ウィンドウ502に自動で入力することができる。一方、他の変形実施形態において、ユーザーが単字発音入力欄620に
Figure 0005363522
との韓国語文字を入力すると、これと同時に日本語文字表610上の「か」がハイライティングされる。このとき、ENTERキーが押されると検索語入力ウィンドウ502に自動で「か」が入力されるように構成することができるなど、多様な方法を考えることができる。
図7に示すように、筆記認識機700は、ユーザーから筆記形態の日本語文字の入力を受ける筆記入力部710、ユーザーが入力した文字に対応するひらがな及びカタカナをディスプレイするひらがな及びカタカナ推薦部720、ユーザーが入力した文字に対応する漢字をディスプレイする漢字推薦部730などを含んで構成することができる。
本発明の一実施形態によれば、ユーザーは筆記認識機700を使用して容易に日本語を入力することができる。例えば、ユーザーが筆記入力部710に日本語文字「ニ」を入力する場合、ユーザーの入力情報は、全体システム300に伝送され、筆記認識部330によってユーザーが入力した筆記情報を認識した後、認識された筆記情報と形態が同一または類似のひらがな及びカタカナが検索されて、ひらがな及びカタカナ推薦部720にディスプレイし、認識された筆記情報と形態が同一または類似の漢字を検索して漢字推薦部730にディスプレイする。このとき、ユーザーは、ひらがな及びカタカナ推薦部720にディスプレイした日本語文字または漢字推薦部730にディスプレイした日本語文字のうち、いずれか一つを選択することによって、容易に検索語入力ウィンドウ502に検索語を入力することができる。
日本語単語をクエリーとして入力する場合、長短音エラー及び促音表記エラーなどが反映された単語も検索結果としてディスプレイするので、日本語単語入力のエラーによる検索結果のエラーを減らすことができる。また、日本語入力機を使用して日本語単字を入力する場合、エイリアスデータベースを利用することによって、検索しようとする日本語単字の発音記号を日本語以外の言語で入力することだけでも容易に日本語単字の位置を探して検索ウィンドウに入力できるようにすることができる。従って、本発明の産業利用性はきわめて高いものといえる。
本発明に係る実施形態における日本語エイリアスデータベースを利用して長音及び促音に対するエラーを減らし、日本語入力機の使用の際に単字検索機能を提供する方法は、コンピュータにより具現される多様な動作を実行するためのプログラム命令を含むコンピュータ読取可能な記録媒体を含む。コンピュータ読取可能な記録媒体としては、プログラム命令、データファイル、データ構造などを単独または組合せて含むことができる。この媒体に記録されるプログラム命令は本発明のために特別に設計され構成されたものでもよく、コンピュータソフトウェアの当業者に公知され使用できるものでもよい。コンピュータ読取可能な記録媒体の例は、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体(magnetic media)、CD−ROM、DVDのような光記録媒体(optical media)、フロップティーカールディスク(Floptical disk)のような磁気−光媒体(magneto−optical media)、及びリードオンリーメモリ(ROM)、ランダムアクセスメモリ(RAM)、フラッシュメモリなどのようなプログラム命令を格納して行うように特別に構成されたハードウェア装置を含む。プログラム命令の例には、コンパイラーにより作られるような機械語コードだけでなく、インタープリターなどを使用してコンピュータによって実行されることのできる高級言語コードが含まれる。前述したハードウェア装置は本発明の動作を行うために一つ以上のソフトウェアモジュールとして作動するように構成されることができ、その逆も同様である。
以上のように、本発明では具体的な構成要素などのような特定事項と限定された実施形態及び図面により説明したが、これは本発明のより全体的な理解を助けるために提供されたものであり、本発明は前述の実施形態に限定されるものではなく、本発明が属する分野で通常的な知識を持った者であれば、このような記載から多様な修正及び変形が可能であるはずである。
以上、本発明の詳細な説明では具体的な実施形態について説明したが、本発明の要旨から逸脱しない範囲内で多様に変形できる。よって、本発明の権利範囲は、上述の実施形態に限定されるものではなく、特許請求の範囲の記載及びこれと均等なものに基づいて定められるべきである。
200 ユーザー端末装置
300 全体システム
310 検索結果提供部
320 単字マッチング部
330 筆記認識部
340 辞書データベース
341 日韓辞書データベース
342 韓日辞書データベース
343 外来語辞書データベース
344 漢字読み取り辞書データベース
350 エイリアスデータベース
351 ひらがなエイリアスデータベース
352 カタカナエイリアスデータベース
353 ローマ字エイリアスデータベース
354 韓国語エイリアスデータベース
355 長短音エイリアスデータベース
356 促音エイリアスデータベース
360 通信部
370 インターフェース部
380 制御部
500 ユーザーインターフェース
502 検索語入力ウィンドウ
504 検索ボタン
506 検索結果表示部
510 筆記認識機ボタン
520 日本語入力機ボタン
600 日本語入力機
610 日本語文字表
620 単字発音入力欄
630 マッチング単字出力欄
700 筆記認識機
710 筆記入力部
720 ひらがな及びカタカナ推薦部
730 漢字推薦部

Claims (16)

  1. 日本語辞書サービスを利用する端末装置に日本語単字入力を支援する機能を提供する方法であって、コンピュータによって遂行されるステップが、
    (a)ひらがな及びカタカナのうち少なくとも一つを含む日本語文字表及び前記日本語文字表の周辺に単字検索ウィンドウを前記端末装置に表示させる段階と、
    (b)検索を希望する特定の日本語単字に該当する発音記号が日本語以外の言語で前記単字検索ウィンドウに入力された場合に、前記日本語単字と前記発音記号とを関連付けて記憶する言語データベースを参照して前記入力された発音記号に該当する前記特定の日本語単字を検索し、前記日本語文字表上における前記入力された発音記号に対応する前記特定の日本語単字の位置を活性化表示させる段階と、
    を含むことを特徴とする方法。
  2. 前記(a)段階は、前記日本語文字表または前記単字検索ウィンドウの近隣に前記日本語辞書サービスの単語検索ウィンドウを表示させる段階を含むことを特徴とする請求項1に記載の方法。
  3. 前記(b)段階は、前記特定の日本語単字に該当する発音記号が日本語以外の言語で前記単字検索ウィンドウに入力された場合、前記言語データベースから検索された前記入力された発音記号に該当する前記特定の日本語単字を、前記単語検索ウィンドウに自動的に入力表示する段階を含むことを特徴とする請求項2に記載の方法。
  4. 前記(b)段階は、前記日本語文字表上において前記特定の日本語単字が活性化表示されている状態で前記ユーザーからエンターキーが入力された場合に、前記単語検索ウィンドウに前記特定の日本語単字を入力表示する段階を含むことを特徴とする請求項2に記載の方法。
  5. 前記(a)段階は、前記単字検索ウィンドウの近隣に単字出力ウィンドウを表示させる段階を含むことを特徴とする請求項1から4のいずれか1つに記載の方法。
  6. 前記(b)段階は、前記特定の日本語単字に該当する発音記号が日本語以外の言語で前記単字検索ウィンドウに入力された場合に、前記言語データベースから検索された前記入力された発音記号にマッチした少なくとも一つ以上の前記特定の日本語単字を前記単字出力ウィンドウに表示する段階を含むことを特徴とする請求項5に記載の方法。
  7. 前記(b)段階は、前記単字出力ウィンドウに表示された少なくとも一つ以上の前記特定の日本語単字のうちで前記ユーザーによりクリックされた日本語単字を前記単語検索ウィンドウに入力表示する段階を含むことを特徴とする請求項6に記載の方法。
  8. コンピュータに、請求項1から7のいずれか1つに記載の方法を実行させるためのコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体。
  9. 日本語辞書サービスを利用する端末装置に日本語単字入力を支援する機能を提供するためのシステムであって、
    ひらがな及びカタカナのうち少なくとも一つを含む日本語文字表及び前記日本語文字表の周辺に単字検索ウィンドウを前記端末装置に表示させるインターフェース制御を遂行するインターフェース部と、
    検索を希望する特定の日本語単字に該当する発音記号が日本語以外の言語で前記単字検索ウィンドウに入力された場合に、前記日本語単字と前記発音記号とを関連付けて記憶するエイリアスデータベースを参照して前記入力された発音記号に該当する前記特定の日本語単字を検索し、日本語文字表上における前記入力された発音記号に対応する前記特定の日本語単字の位置を活性化表示させる単字マッチング部と、
    を含むことを特徴とするシステム。
  10. 前記インターフェース部は、前記日本語文字表または前記単字検索ウィンドウの近隣に前記日本語辞書サービスの単語検索ウィンドウを表示させることを特徴とする請求項9に記載のシステム。
  11. 前記単字マッチング部は、前記特定の日本語単字に該当する発音記号が日本語以外の言語で前記単字検索ウィンドウに入力された場合、前記言語データベースから検索された前記入力された発音記号に該当する前記特定の日本語単字を、前記単語検索ウィンドウに自動的に入力表示させることを特徴とする請求項10に記載のシステム。
  12. 前記単字マッチング部は、前記日本語文字表上において前記特定の日本語単字が活性化表示されている状態で前記ユーザーからエンターキーが入力された場合に、前記単語検索ウィンドウに前記特定の日本語単字を入力表示させることを特徴とする請求項10に記載のシステム。
  13. 前記インターフェース部は、前記単字検索ウィンドウの近隣に単字出力ウィンドウを表示させることを特徴とする請求項9から12のいずれか1つに記載のシステム。
  14. 前記単字マッチング部は、前記特定の日本語単字に該当する発音記号が日本語以外の言語で前記単字検索ウィンドウに入力された場合に、前記言語データベースから検索された前記入力された発音記号にマッチした少なくとも一つ以上の前記特定の日本語単字を前記単字出力ウィンドウに表示させることを特徴とする請求項13に記載のシステム。
  15. 前記単字マッチング部は、前記単字出力ウィンドウに表示された少なくとも一つ以上の前記特定の日本語単字のうちで前記ユーザーによりクリックされた日本語単字を前記単語検索ウィンドウに入力表示させることを特徴とする請求項14に記載のシステム。
  16. 前記端末装置でのマウス操作により入力される日本語筆記体文字の形態と同一または類似の形態を有するひらがな、カタカナ、漢字のうち少なくとも一つを前記言語データベースから検索して前記端末装置に提供する筆記認識部をさらに含むことを特徴とする請求項9から15のいずれか1つに記載のシステム。
JP2011055800A 2008-03-14 2011-03-14 日本語の単字入力を支援する機能を提供する方法及びシステム Active JP5363522B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020080024091A KR100916816B1 (ko) 2008-03-14 2008-03-14 일본어 앨리어스 데이터베이스를 이용하여 장음 및 촉음에대한 오류를 줄이고 일본어 입력기 사용 시 단자 찾기기능을 제공하는 방법 및 시스템
KR10-2008-0024091 2008-03-14

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2009061121A Division JP5297234B2 (ja) 2008-03-14 2009-03-13 日本語エイリアスデータベースを利用して長音及び促音に対するエラーを減らし、日本語入力機の使用の際に単字検索機能を提供する方法及びシステム

Publications (2)

Publication Number Publication Date
JP2011129159A JP2011129159A (ja) 2011-06-30
JP5363522B2 true JP5363522B2 (ja) 2013-12-11

Family

ID=41240536

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2009061121A Active JP5297234B2 (ja) 2008-03-14 2009-03-13 日本語エイリアスデータベースを利用して長音及び促音に対するエラーを減らし、日本語入力機の使用の際に単字検索機能を提供する方法及びシステム
JP2011055800A Active JP5363522B2 (ja) 2008-03-14 2011-03-14 日本語の単字入力を支援する機能を提供する方法及びシステム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2009061121A Active JP5297234B2 (ja) 2008-03-14 2009-03-13 日本語エイリアスデータベースを利用して長音及び促音に対するエラーを減らし、日本語入力機の使用の際に単字検索機能を提供する方法及びシステム

Country Status (2)

Country Link
JP (2) JP5297234B2 (ja)
KR (1) KR100916816B1 (ja)

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63211023A (ja) * 1987-02-27 1988-09-01 Hitachi Ltd カナ表現によるデ−タ検索方式
JP2791106B2 (ja) * 1989-06-14 1998-08-27 株式会社日立製作所 文字列検索装置
JP2849263B2 (ja) * 1992-02-20 1999-01-20 富士通エフ・アイ・ピー株式会社 キーワード拡張検索システム
JPH06149790A (ja) * 1992-11-02 1994-05-31 Sharp Corp 文章作成装置
JPH07200615A (ja) * 1993-12-28 1995-08-04 Noriko Yoshii 言語抽出方法
JPH07319909A (ja) * 1994-05-27 1995-12-08 Toshiba Corp 文書検索装置、文書検索方法、文字認識装置及び辞書作成方法
JPH0969109A (ja) * 1995-08-31 1997-03-11 Toshiba Corp 文書検索方法及び文書検索装置
JPH09204432A (ja) * 1996-01-24 1997-08-05 Sharp Corp 電子機器
KR100517970B1 (ko) * 2002-08-01 2005-09-30 엘지전자 주식회사 이동통신 단말기의 일본어 입력 장치 및 방법
JP3677016B2 (ja) * 2002-10-21 2005-07-27 富士ゼロックス株式会社 外国語電子辞書検索装置
JP2004295603A (ja) * 2003-03-27 2004-10-21 Casio Comput Co Ltd 情報表示制御装置、サーバ及びプログラム
KR100599873B1 (ko) * 2003-04-28 2006-07-13 김상근 한글자모를 이용한 다문자 입력장치 및 그 방법
JP2006208514A (ja) * 2005-01-26 2006-08-10 Taito Corp 二ヶ国語で入力し得るカラオケ選曲用キーボードを備えたカラオケ装置及びその装置における選曲方法
JP2007317163A (ja) * 2006-04-28 2007-12-06 Seiko Instruments Inc 電子辞書及び検索方法

Also Published As

Publication number Publication date
JP2011129159A (ja) 2011-06-30
JP2009223894A (ja) 2009-10-01
KR100916816B1 (ko) 2009-09-14
JP5297234B2 (ja) 2013-09-25

Similar Documents

Publication Publication Date Title
US9805718B2 (en) Clarifying natural language input using targeted questions
JP3962763B2 (ja) 対話支援装置
KR20070024771A (ko) 질의어 자동변환을 이용한 자동완성 질의어 제공 시스템 및방법
KR20100029221A (ko) 명칭 엔터티와 신규 단어를 검출하는 것
US10565982B2 (en) Training data optimization in a service computing system for voice enablement of applications
US20190138269A1 (en) Training Data Optimization for Voice Enablement of Applications
JP2009140466A (ja) 使用者製作問答データに基づいた会話辞書サービスの提供方法及びシステム
US20090307183A1 (en) System and Method for Transmission of Communications by Unique Definition Identifiers
JP5323652B2 (ja) 類似語決定方法およびシステム
CN112149403A (zh) 一种确定涉密文本的方法和装置
KR100784287B1 (ko) 한국한자음을 이용하여 일본어 사전을 검색하는 방법 및 그시스템
JP5851130B2 (ja) 日本語のための音声キー
Lawson An assessment of Arabic transliteration systems
JP5363522B2 (ja) 日本語の単字入力を支援する機能を提供する方法及びシステム
JP2004240859A (ja) 言い換えシステム
KR20060104544A (ko) 자동완성 질의어 제공 시스템, 방법 및 상기 방법을실행하기 위한 프로그램이 기록된 컴퓨터에서 판독 가능한기록 매체
Oudah et al. Studying the impact of language-independent and language-specific features on hybrid Arabic Person name recognition
KR100834279B1 (ko) 모바일 단말기의 문자 입력 처리방법 및 이를 수행하기위한 모바일 단말기
KR20130016867A (ko) 민감한 단어를 표시할 수 있는 사용자 단말,및 사용자 단말의 민감한 단어 표시 방법
JP2009223895A (ja) 日本語辞書サービスにおいて2単語以上のクエリー、ハングルクエリーまたは一般的なクエリーの入力の際の検索結果を提供するための方法及びシステム
JP2018072509A (ja) 音声読み上げ装置、音声読み上げシステム、音声読み上げ方法、およびプログラム
Adesina et al. A query-based SMS translation in information access system
HaCohen-Kerner et al. Improved Language Models for Word Prediction and Completion with Application to Hebrew
Chaware et al. Information retrieval in multilingual environment
Trips et al. From original sources to linguistic analysis: Tools and datasets for the investigation of multilingualism in medieval english

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120313

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130820

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130905

R150 Certificate of patent or registration of utility model

Ref document number: 5363522

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250