JP2007317163A - 電子辞書及び検索方法 - Google Patents

電子辞書及び検索方法 Download PDF

Info

Publication number
JP2007317163A
JP2007317163A JP2007029413A JP2007029413A JP2007317163A JP 2007317163 A JP2007317163 A JP 2007317163A JP 2007029413 A JP2007029413 A JP 2007029413A JP 2007029413 A JP2007029413 A JP 2007029413A JP 2007317163 A JP2007317163 A JP 2007317163A
Authority
JP
Japan
Prior art keywords
character
headword
input
characters
pronunciation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007029413A
Other languages
English (en)
Inventor
Kazuhisa Takazawa
一久 高沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Instruments Inc
Original Assignee
Seiko Instruments Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Instruments Inc filed Critical Seiko Instruments Inc
Priority to JP2007029413A priority Critical patent/JP2007317163A/ja
Publication of JP2007317163A publication Critical patent/JP2007317163A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

【課題】 母国語でない言語の綴りや入力方法を知らない使用者でも、簡単に素早く目的の単語を検索でき、特に日本人には馴染みにくい韓国語や中国語の辞書までも日本語的発音表記で簡単に検索できる電子辞書を提供する。
【解決手段】 入力手段により入力された発音表記を、発音規則データに従って見出し語に使われている文字に変換する発音表記文字変換手段と、変換された文字と共に変換に使用された発音表記を表示する表示手段と、発音表記文字変換手段によって変換された文字と一致する文字を含む辞書の見出し語を抽出する抽出手段とを有し、抽出した各見出し語を表示手段にリスト表示する。
【選択図】 図1

Description

本発明は、外国語辞書の見出し語の検索を、音声入力もしくは文字入力により発音を表す文字列を入力し、発音を表す文字列から外国語の見出し語の文字へ、ある一定の規則に従って変換し、変換後の文字により見出し語を検索することで、耳から聞いた発音により外国語辞書を検索できるようにする電子辞書に関するものである。
電子辞書の発展により、日本人にとって便利な、英和辞典、和英辞典、国語辞典等の種々の辞典を収録した電子辞書が広く普及している。また、米国や英国では米国人や英国人にとって便利な英英辞典、英語-スペイン語辞典等の辞典の内容を収録した電子辞書が広く普及している。また、韓国でも韓国人にとって便利な韓英辞典、英韓辞典、韓韓辞典等の内容を収録した電子辞書が広く普及している。
これらの電子辞書では、使用者の母国の言語を基本として構成されている。母国言語以外の言語の辞書としては殆どが英語の意味を調べる辞書であった。最近では韓国語、中国語の意味を調べる辞書や、旅行用の会話文とその意味を調べる電子辞書が発売されている。しかし英語以外の言語の見出し語を検索する場合にはその綴りと、電子辞書での入力方法まで予め知っておく必要があり、英語以外の言語を特別に勉強した使用者以外には、英語以外の言語を入力して検索し、目的の見出し語や会話文を探し出すことは非常に難しかった。
例えば中国語の辞書ではピンインを入力して中国語の漢字を検索するものがあるが、予めピンインを修得しておく必要があり、この入力方式の修得が大きな問題であった。また韓国語の辞書では韓国文字の入力に2ボル式、3ボル式の韓国語の独特な入力方式を修得しておく必要があり、同様の問題が有った。
韓国語にはローマ字入力の方式もあるが、アレアハングル方式など韓国語独特のものであり、字綴を修得する必要がある。例えば「キムチ」を「kimuchi」と入力しても変換できず、韓国語のローマ字綴では「kimch」となる。焼肉の「カルビ」は「karubi」ではなく「galbi」となる。これら全てを修得しておくには多大な労力が必要であり、やはり大きな問題であった。
この様に、母国語でない言語の綴りや入力方法を知らない使用者でもその言語の辞書を使えるようにするための技術として、英語に限っては、発音から連想し、カタカナで表記した日本語的発音表記で辞書を検索する方法が発明されていた(例えば特許文献1、2、3参照)。
特開2001−167093号公報 特開2003−178087号公報 特開2000−127647号公報
従来の発明は、辞書のデータに対応する発音表記データを辞書データと共に記憶させる方式であり、発音表記を付加する為の記憶容量を膨大に必要とし、記憶素子のコストの増大により電子辞書の市場価格を上げるばかりでなく、発音表記データを伴った辞書データの生成に長い開発期間が必要とされた。それは発音から連想される発音表記の振れを補正する必要があり、またその確認を行う作業も必要であったからである。
図3は、従来の母国語でない言語の綴りや、入力方法を知らない使用者でも、その言語の辞書を使えるようにするための技術による、日本語的発音表記によって検索する電子辞書検索装置の辞書データ部分の記憶内容を示した表である。
従来の発明による電子辞書では、日本語的発音表記31を辞書データ30と共に記憶している。図3は、記憶しているデータ全体の例である。
例えば使用者が“reliable”という単語の綴りは知らないが“リライアブル”という言葉を聴いたことが有る場合に、使用者が“リライアブル”と入力装置へ日本語的発音表記を入力すると、電子辞書は、前記入力された日本語的発音表記と記憶装置に記憶された日本語的発音表記31と比較を行う。そして電子辞書は、日本語的発音表記31の中に前記入力装置から入力された“リライアブル”と一致する日本語的発音表記31を探し出し、それに関連付けられている“reliable”へ到達させる。
従来の発明による電子辞書では、記憶装置の中に日本語的発音表記31を辞書データ30と共に記憶する為、辞書データ全体を記憶する為の記憶容量を膨大に増やし、記憶素子のコストを増大させ、電子辞書の市場価格を上げてしまう欠点があった。
また図3に示した辞書データ30が出版社などから供給される場合には、日本語的発音表記31を含んでいない場合がある。そのため、主に発音記号32から手動もしくは一定のアルゴリズムで、日本語的発音標記31を自動的に作り出す必要がある。但し全ての使用者が辞書の全単語について発音記号に対して正確な発音の日本語的発音表記を入力できる可能性は低く、例えば“relief”を“リリーフ”ではなく“レリーフ”と記憶していた場合には、辞書データ30から発見できないこととなる。この事態を避ける為に従来の発明では、図3に示した日本語的発音の補足表記33の様に“レリーフ”を第二の日本語的発音表記として記憶しておく必要があった。この日本語的発音の補足表記33によってカタカナ表記の振れを補正し、使用者がストレス無く希望された単語を検索できるように調整する為には、補足表記の生成の為に、多大な労力と開発期間を要するという欠点もあり、記憶容量をさらに増大させるものであった。
さらに従来技術の電子辞書は、入力装置から電子辞書に検索をさせる単語の、全ての日本語的発音表記を入力した後で、検索起動の為のキーを押し、検索結果を得るという動作であった。そのため、日本語的発音表記の中の1文字でも前記カタカナ表記の振れなどにより異なってしまうと、異なった箇所を発見することが困難であった。このため使用者は、何度も入力と検索を繰り返し行わなければならず、とっさの時に単語の意味を調べたい時に使う外国語電子辞書としては、使い勝手が非常に悪かった。
本発明は、母国語でない言語の綴りや入力方法を知らない使用者でも、簡単に素早く目的の単語を検索でき、特に日本人には馴染みにくい韓国語や中国語の辞書までも日本語的発音表記で簡単に検索できるようにすることを第一の目的としている。
さらに従来の発明の様に、日本語的発音表記を全ての見出し語に追加する作業や記憶容量の追加を無くし、電子辞書に追加的なコストの増大をさせずに、日本語的発音表記による検索を提供することを第二の目的としている。
上記課題を解決するため、請求項1に記載した発明は、発音表記の入力を行う入力手段と、見出し語と該見出し語に対応した訳からなる辞書本体データと、前記入力手段により入力される文字と、前記見出し語の言語における文字との対応を示す発音規則データと、発音規則データを使用して、前記入力手段により入力された発音表記を、前記見出し語の言語における文字に変換する発音表記文字変換手段と、前記発音表記文字変換手段によって変換された文字と一致する文字を含む見出し語を、前記辞書本体データから抽出する抽出手段と、前記抽出手段で抽出した見出し語を表示する表示手段とを具備することを特徴とする電子辞書とする。
これにより、実際に聞こえた音の発音表記から、未知の言語の見出し語を検索することが可能になる。
請求項2に記載の発明では、請求項1に記載の電子辞書において、前記表示手段が、前記入力手段により入力された発音表記を表示し、該発音表記のなかで、前記発音表記文字変換手段が変換処理に使用した文字を、変換処理に使用していない文字と区別して表示するものとする。
これにより、発音表記の入力状況や、入力途中における見出し語の候補を確認しながら、発音表記の入力作業を行うことが可能になり、綴りの分からない未知の言語の見出し語でも高い確度で検索することが可能になる。
請求項3に記載の発明では、請求項2に記載の電子辞書において、前記抽出手段が、前記発音表記文字変換手段によって変換された文字を使用して、前記辞書本体データから見出し語と該見出し語に対応した訳を抽出し、前記表示手段は、前記抽出手段が抽出した訳を、前記発音表記文字変換手段が変換処理に使用した文字に対応する訳として表示するものとする。
これにより、発音表記の入力状況や、入力途中における見出し語の候補およびその訳を確認しながら、発音表記の入力作業を行うことが可能になり、綴りの分からない未知の言語の見出し語でも高い確度で検索することが可能になる。
請求項4に記載の発明では、請求項1から3のいずれかに記載の電子辞書において、前記発音表記が、ローマ字、カタカナ文字、もしくは平仮名文字であり、前記発音規則データは、前記見出し語の言語における文字と、該文字の発音を表したローマ字、カタカナ文字、もしくは平仮名文字を含むものとする。
これにより、使用者は、馴染みのある入力し易い文字を使用して発音表記を入力することができ、未知の言語の見出し語の検索が可能になる。
請求項5に記載の発明では、請求項4に記載の電子辞書において、前記見出し語の言語が韓国語であるものとする。
請求項6に記載の発明では、請求項4に記載の電子辞書において、前記見出し語の言語が中国語であるものとする。
請求項7に記載の発明では、請求項4に記載の電子辞書において、前記見出し語の言語がアルファベットを使用した言語であるものとする。
このように、様々な言語の見出し語について発音表記から検索することが可能になる。
請求項8に記載の発明では、請求項1に記載の電子辞書において、前記辞書本体データが、多種の言語の辞書本体データを含み、前記辞書本体データの言語ごとに、発音規則データおよび前記発音表記文字変換手段を有するものとする。
これにより、多種の言語の辞書本体データを搭載し、個々の辞書本体データについて、発音表記によって見出し語を検索することが可能な電子辞書を提供することが可能になる。
請求項9に記載の発明では、請求項8に記載の電子辞書において、検索に使用する辞書本体データを選択する手段をさらに有し、前記発音規則データおよび前記発音表記文字変換手段が、選択された辞書本体データの言語に基づいて選択されるものとする。
これにより、使用者に特別な操作を強いることなく、本発明の発音表記による見出し語検索を遂行することが可能になる。
請求項10に記載の発明は、見出し語と該見出し語に対応した訳からなる辞書本体データを有する電子機器において発音表記によって前記見出し語を検索する検索方法であって、前記電子機器は、入力手段と、発音表記文字変換手段と、抽出手段と、前記入力手段により入力される文字と前記見出し語の言語における文字とを対応を示す発音規則データとを有し、検索方法は、前記入力手段によって、発音表記を入力するステップと、前記発音表記文字変換手段によって、前記発音規則データを使用して、前記入力手段により入力された発音表記を、前記見出し語の言語における文字に変換するステップと、前記抽出手段によって、前記発音表記文字変換手段によって変換された文字と一致する文字を含む見出し語を、前記辞書本体データから抽出するステップと、を具備することを特徴とする検索方法とする。
これにより、電子辞書以外の電子機器等に、本発明の発音表記による見出し語検索の機能を搭載させることが可能になる。
また上記課題を解決する他の方法として、請求項11に記載した発明は、音声入力手段と、入力された音声を認識し発音表記へ変換する音声認識手段と、見出し語と該見出し語に対応した訳からなる辞書本体データと、前記音声入力手段で入力され前記音声認識手段にて変換される発音表記と、前記見出し語の言語における文字との対応を示す発音規則データと、発音規則データを使用して、前記音声認識手段により変換された発音表記を、前記見出し語の言語における文字に変換する発音表記文字変換手段と、前記発音表記文字変換手段によって変換された文字と一致する文字を含む見出し語を、前記辞書本体データから抽出する抽出手段と、前記抽出手段で抽出した見出し語を表示する表示手段とを具備することを特徴とする電子辞書とする。
これにより、実際に聞こえた音から、未知の言語の見出し語を検索することが可能になる。
請求項12に記載の発明では、請求項1に記載の電子辞書において、前記表示手段が、前記音声入力手段により入力され前記音声認識手段により変換された発音表記を表示し、該発音表記のなかで、前記発音表記文字変換手段が変換処理に使用した文字を、変換処理に使用していない文字と区別して表示するものとする。
これにより、音声による発音表記の入力状況や、入力途中における見出し語の候補を確認しながら、発音表記の音声入力作業を行うことが可能になり、綴りの分からない未知の言語の見出し語でも高い確度で検索することが可能になる。
請求項13に記載の発明では、請求項12に記載の電子辞書において、前記抽出手段が、前記発音表記文字変換手段によって変換された文字を使用して、前記辞書本体データから見出し語と該見出し語に対応した訳を抽出し、前記表示手段は、前記抽出手段が抽出した訳を、前記発音表記文字変換手段が変換処理に使用した文字に対応する訳として表示するものとする。
これにより、音声による発音表記の入力状況や、入力途中における見出し語の候補およびその訳を確認しながら、発音表記の入力作業を行うことが可能になり、綴りの分からない未知の言語の見出し語でも高い確度で検索することが可能になる。
請求項14に記載の発明では、請求項11から13のいずれかに記載の電子辞書において、前記発音表記が、ローマ字、カタカナ文字、もしくは平仮名文字であり、前記発音規則データは、前記見出し語の言語における文字と、該文字の発音を表したローマ字、カタカナ文字、もしくは平仮名文字を含むものとする。
これにより、使用者は、馴染みのある発音表記の為の文字を使用して発音表記を確認することができ、未知の言語の見出し語の検索が可能になる。
請求項15に記載の発明では、請求項14に記載の電子辞書において、前記見出し語の言語が韓国語であるものとする。
請求項16に記載の発明では、請求項14に記載の電子辞書において、前記見出し語の言語が中国語であるものとする。
請求項17に記載の発明では、請求項14に記載の電子辞書において、前記見出し語の言語がアルファベットを使用した言語であるものとする。
このように、様々な言語の見出し語について発音表記から検索することが可能になる。
請求項18に記載の発明では、請求項11に記載の電子辞書において、前記辞書本体データが、多種の言語の辞書本体データを含み、前記辞書本体データの言語ごとに、発音規則データおよび前記発音表記文字変換手段を有するものとする。
これにより、多種の言語の辞書本体データを搭載し、個々の辞書本体データについて、音声入力による発音表記によって見出し語を検索することが可能な電子辞書を提供することが可能になる。
請求項19に記載の発明では、請求項18に記載の電子辞書において、検索に使用する辞書本体データを選択する手段をさらに有し、前記発音規則データおよび前記発音表記文字変換手段が、選択された辞書本体データの言語に基づいて選択されるものとする。
これにより、使用者に特別な操作を強いることなく、本発明の音声入力による発音表記によって見出し語検索を遂行することが可能になる。
請求項20に記載の発明は、見出し語と該見出し語に対応した訳からなる辞書本体データを有する電子機器において音声入力による発音表記によって前記見出し語を検索する検索方法であって、前記電子機器は、音声入力手段と、入力された音声を認識し発音表記へ変換する音声認識手段と、発音表記文字変換手段と、抽出手段と、前記入力手段により入力される文字と前記見出し語の言語における文字とを対応を示す発音規則データとを有し、検索方法は、前記音声入力手段と前記音声認識手段によって、発音表記を入力するステップと、前記発音表記文字変換手段によって、前記発音規則データを使用して、前記入力手段により入力された発音表記を、前記見出し語の言語における文字に変換するステップと、前記抽出手段によって、前記発音表記文字変換手段によって変換された文字と一致する文字を含む見出し語を、前記辞書本体データから抽出するステップと、を具備することを特徴とする検索方法とする。
これにより、電子辞書以外の電子機器等に、本発明の音声入力による発音表記によって見出し語検索の機能を搭載させることが可能になる。
本発明によれば、母国語でない言語の綴りや入力方法を知らない使用者でも簡単に素早く目的の単語を検索でき、尚且つ日本語的発音表記を辞書データに追加する作業と記憶容量の追加を無くし、電子辞書に追加的なコストの増大をさせずに音声入力もしくは文字入力により、日本語的発音表記による検索を可能とすることが実現される。
さらに、使用者が複数の言語の辞書を収録した電子辞書において、言語の切替わりを意識することなく、音声入力もしくは文字入力による日本語的発音表記をもとにして、全ての言語の単語を検索できる。
本発明によって、例え何の言語の辞書であっても耳から聞いた発音をもとに日本語的な発音表記を音声もしくは文字で入力することで、電子辞書が簡単に活用でき、調べられるようになり、日本人が外国人の話した言葉を理解する為の補助が可能な電子辞書を実現できる。
以下、本発明の電子辞書における好適な実施の形態について、図1から図10を参照して詳細に説明する。
図1は、本発明の一実施形態における電子辞書の構成を表したブロック図である。図2は、電子辞書の外観を示す平面図である。
図1に示されるように、電子辞書は、各部の制御を行うと共に、辞書検索を含む本実施形態における音声認識と発音表記文字の変換や、見出し語の抽出等の各種制御を行う制御部11を備えている。
この制御部11には、入力手段12、表示手段13、ROM等の記憶手段で構成される辞書データ記憶手段14、及びRAM15、及び音声入力手段16が接続されている。
入力手段12は、電子辞書を使用する際に各種入力を行う為に使用される。
入力手段12は、図2に示されるように、電源のオンオフを行う電源キー20、文字を入力するための文字キー21(以後キーボード21という)、カーソルや選択箇所の移動を行うカーソルキー22(十字キー)、入力文字を確定させて入力に対する検索結果の表示を指示する決定キー23、辞書の種類を選択する辞書選択キー24を備えている。
発音表記の入力を行う入力手段12は、主にアルファベットのキーを使い、ローマ字などの入力を行う。本実施形態では、入力したローマ字と共にカタカナ表記を表示する為、制御部11において、一般的な電子辞書の日本語入力で行われているローマ字カナ変換を行い、入力されるアルファベットと共に変換後のカタカナを表示手段13へ表示する。
音声入力手段16は、音声を入力する際に使用される。
音声入力手段16は、図2に示されるように、マイク26を備えている。
発音表記の入力を行う音声入力手段16は、入力された音声を音声認識手段11dで、ローマ字などの発音表記へ変換する。本実施形態では、音声によって入力した変換したローマ字と共にカタカナ表記を表示する為、制御部11において、一般的な電子辞書の日本語入力で行われているローマ字カナ変換を行い、音声によって入力される発音表記であるローマ字と共に、ローマ字カナ変換後のカタカナを表示手段13へ表示する。
表示手段13は液晶表示装置が使用され、図2における液晶表示画面25が対応している。表示手段13には、キーボード21から入力された文字やローマ字カナ変換後のカタカナ、または音声入力手段16から入力された音声を音声認識手段11dで変換したローマ字やローマ字カナ変換後のカタカナ、及び辞書データ記憶手段14から抽出された見出し語とその訳や例文、成句等が表示される。
本実施形態における、耳から聞いた発音をもとに日本語的発音表記で検索できる電子辞書において、表示手段13には、辞書データ記憶手段14から抽出した見出し語をリスト表示する際に、入力手段12より入力されたローマ字による発音表記文字列とローマ字カナ変換を行ったカタカナ表記とを、共に表示する場合と、音声入力手段16から入力された音声を音声認識手段11dで発音表記文字へ変換した後のローマ字による発音表記と、ローマ字カナ変換を行ったカタカナ表記とを、共に表示す場合がある。そのため、表示手段14の表示画面は複数に分割されるようになっている。
辞書データ記憶手段14は、電子辞書として見出し語や訳等を検索するための辞書データが格納されている辞書本体データ14aを有する。本実施形態では、辞書本体データ14aは英和・和英辞書、韓和・和韓辞書と、中和・和中辞書の各辞書における見出し語とその訳を備える。またローマ字による発音表記と外国語の文字との対応付けを示す発音規則データ14bを有する。本実施形態では、ローマ字による発音表記と韓国語の文字、ローマ字による発音表記と中国語の文字、ローマ字による発音表記と英語の文節単位の文字列との対応付けを表した発音規則データ14bを備えている。
制御部11は、入力手段12から入力するか、または音声入力手段16から入力された音声を音声認識手段11dで変換した日本語的発音表記から、検索する対象の言語の文字へ変換する発音表記文字変換手段11aと、検索する対象の言語の文字へ変換された文字から、この文字を含む見出し語を辞書データ記憶手段14の中から抽出する抽出手段11bと、抽出手段11bが抽出した見出し語を表示手段13に表示する為に、表示制御を行う表示制御手段11cとを備える。
ここで発音表記文字変換手段11aは、耳から聞いた発音を表した日本語におけるローマ字表記と検索する言語における正確な発音表記との差異を調整する機能を有する。すなわち、ローマ字表記等の発音表記と検索する言語の文字との対応表を使用し、検索する言語に特有の規則に則って、入力された発音表記を検索する言語の文字へと変換する。これについての詳細は後述する。
RAM15は、データを一時的に記憶する為の記憶手段である。発音表記文字変換手段11aがローマ字による日本語的発音表記から、検索する対象の言語の文字へ変換する時に、ローマ字と発音規則データ14bの内容を比較する為に両者の文字列を一時的に記憶する文字データ一時記憶手段15aを備える。
図4および図5は、本発明による実施形態の韓国語−日本語辞書において、ローマ字から韓国語の文字へ変換する為の発音規則データ14bを作成するときの、元になるデータを表す。図4は、韓国語の文字(この場合は母音+子音の例を示す)とローマ字の対応表を示し、図5は、同韓国語の2重母音文字とローマ字の対応表を示している。図4と図5に限定されないが、これらの対応表をもとに、同じ発音表記を示すローマ字に対応する韓国語の文字の対応させた表が、図6に示したローマ字/カタカナ−韓国文字対応表である。
図4と図5では、韓国語が、基本となる10個の母音と19個の子音と、11個の2重母音と19個の子音の組み合わせで発音が組み立てられることを利用し、韓国語本来の発音をローマ字と対応させている。そしてそれと共に、日本語独特の、必ず子音+母音で終わる形式や、発音から連想され易い表記を追加している。
例えば、2重母音の表である図5における母音51と子音52の組み合わせでは、韓国語本来の発音表記は“gyae”53である。本実施形態では、それに加えて、54として、“gye”(カタカナではギェ)と“gie”(カタカナではギエ)を追加すると共に、一般的にはカタカナでは表せない“ghe”(カタカナで無理に表すとすればギヘ)までも追加している。これは、電子辞書の使用者が連想しうるローマ字表記をできる限り広く網羅することによって、使用者が耳から聞いた発音をローマ字として入力したり音声入力した場合に、実際に発音された単語の見出し語と一致する確立を高めるためである。
図6は、前記図4と図5の対応表からローマ字に対応する韓国語の文字を表した対応表である。データの形式に制限は無いが、少なくとも図6の対応表の情報が、発音規則データ14bとして辞書データ記憶手段14に備えられる。
韓国語の場合には同じ文字であっても、単語の先頭で使われる場合とそれ以外の場所で使われる場合で発音が異なる文字がある。この種の文字に対応する為に、図6に示す対応表に有るように、先頭に使われた場合に発音が変わる文字を、一定の付加情報を付けて記憶している。本実施形態による対応表では括弧を付けて記憶している。
例えば図6の文字列61は、“ga”の発音をする文字であるが、単語の先頭で使われ場合には“ka”となる。先頭の文字の変換を行う際、発音表記文字変換手段11aではこの括弧付きの文字を使用して文字の変換を行う。
図7は、文字入力もしくは音声入力による、ローマ字形式の発音表記文字の入力から韓国語の文字への変換を行って、韓国語の見出し語を検索するまでの、表示手段13における表示画面の例である。
図の表示画面には、表示内容を辞書名表示領域71と、発音表記入力領域72と、カタカナ表示領域73と、抽出手段11bにより辞書本体データ14aから抽出された見出し語のリストを表示するリスト表示領域74と、リスト中の任意の見出し語をカーソルで選択して、選択された見出し語の訳をプレビュー表示するプレビュー表示領域75とがある。このように使用者が実際に文字入力もしくは音声入力した発音表記文字列と、ローマ字カタカナ変換を行ったカタカナを共に表示することにより、入力した発音表記が意図した発音表記であるかどうかを確認し易くしている。
また本発明の韓国語−日本語辞書は、文字入力もしくは音声入力した発音表記文字列を発音表記文字変換手段11aによって(図6の対応表に基づいて)韓国語の文字列へ変換し、変換した文字列を含んだ見出し語を抽出手段11bにより辞書本体データ14aから抽出し、その見出し語を表示する。この際、発音表記文字が1文字入力されるまたは音声入力によって追加される度に、リアルタイムで見出し語の抽出とリスト表示の更新を行う。このため、使用者が検索しようとしている見出し語が存在するかどうかが、入力しながら確認できる。
またさらに、プレビュー表示によって抽出された見出し語の訳をも確認できるので、使用者が検索している単語であるかどうかを用意に素早く確認できるのである。
尚、本実施形態によるプレビュー表示領域75は、カーソルによって選択されたリスト表示領域74のひとつの見出し語のみの訳を表示しているが、これに限定されず、リスト中の全ての見出し語について同時にプレビュー表示を行っても良い。
耳から聞いた発音をもとに辞書を検索する場合に、耳から聞いた発音は曖昧な場合が多く、発音表記が正しい綴りとなっていなかったり、音声入力が正しい発音表記になりにくい場合がある。この様な場合に、リスト表示領域74に表示された見出し語の訳をプレビュー表示領域75で確認しながら、何度か発音表記の入力を修正することで、会話などの状況から、耳から聞いた単語を特定することができる。また、音声入力から音声認識手段11dによって変換した発音表記を入力手段12で直接発音表記文字を修正することも出来る。
次に、その言語特有の規則に則って、文字入力または音声入力されたローマ字からその言語の単語に変換する機能について説明する。図8は、本発明による韓国語−日本語辞書における、ローマ字による発音表記文字の入力から、韓国語の文字への変換を行う動作の中で、パッチム(韓国語の母音字の下に書く、子音字のこと)を含んだ文字への対応を発音表記文字変換手段11aで行う例を表す。
文字入力もしくは“かむ”という音声入力によって“kamu”とローマ字が入力された場合、韓国語では“kamu”の全てを使用した(パッチムを使用しない)文字列82と、“kam”だけを使用した(パッチムを使用する)文字列81とに変換できる。この場合、抽出手段11bでは変換後の文字列81と文字列82の両方で見出し語の抽出を試みる。その結果、文字列82を含む見出し語が対象とする韓国語−日本語辞書の見出し語の中に存在しないことから、文字列81のみ採用されることを発音表記文字変換手段11aへ伝達する。
発音表記文字変換手段11aは文字列81への変換のみ残し、文字列82への変換は削除する。また“kam”だけが文字列81へ変換されることで、“u”は保留されることになる。このときに“u”は保留されたことを表す為、本実施形態では表示画面において反転表示を行っている。
図9は、本発明による韓国語−日本語辞書における、ローマ字による発音表記文字の入力から韓国語の文字への変換を行う中で、日本語独特の発音表記と、韓国語の文字の発音との、発音の差異を補正する動きの例を表す。
上記図8に示した働きの例に続き、図9aでは“kamus”まで入力された状態を表す。“kam”までは図8における文字列81に変換されている。上記保留されている“u”と“s”では、変換できる文字が発音規則データ14bに存在しない為、次の文字入力が待たれる。
図9bでは、続いて“a”が入力された状態を表す。これは上記図8に示した働きの例に続き、“さ”という音声入力が追加されて“kamusa”まで入力された状態とおなじである。“kamusa”の“sa”が文字列92へ変換できる。この動作によって保留されていた“u”は、日本語独特の発音表記規則(必ず子音+母音の組み合わせで表される)によって入力された母音と判断され、韓国語の文字には変換されない文字として確定される。
また本実施形態では表示画面において、下線9aと下線9bにより変換に使用済みのアルファベットを示すことによって、使用者が文字入力または音声入力したローマ字による発音表記に対応する韓国語の文字が存在するのか、結果的に使用者が耳から聞いた発音に対応する韓国語が存在するのかを、入力途中で確認をすることができる。使用者が文字入力または音声入力した発音表記から変換される韓国語の文字を含んだ見出し語が、辞書本体データ14aに存在しない場合、後続の文字を続けて入力しても、アンダーラインは入力した文字の下へ伸びない。
なお本実施形態での、パッチムを含んだ文字への対応で変換を保留された文字を反転表示して表す方法や、ローマ字による発音表記と韓国語の文字との発音の差異を補正する時に変換された文字とまだ変換されていない文字とを下線で区別して表す方法は、これらに特定されることは無く、大文字と小文字や、文字の色を変化させる方法の他、変換されない文字を非表示として変換後の韓国語文字列の発音を表すアルファベットに変える方法などを採用しても良い。
以上のように構成された電子辞書における、耳から聞いた単語を、文字入力による発音表記ローマ字によって検索する動作について、図2の外観図と、図7の表示例と、図8と図9(a)、図9(b)の変換動作の例と、図10に示すフローチャートと、図12の韓国語の文字列の図を使って説明する。本実施形態では、使用者が“カムサハムニダ”と聞き、その意味を調べる例を示す。
まず電源キー20により電子辞書は動作待ち状態になる。この状態はフローチャートではS0である。次に本実施形態では辞書選択キー24が使用者によって押下され、韓和辞書が選択される。すると、S1で辞書の選択とローマ字から韓国語の文字への変換テーブルであるローマ字韓変換テーブル(図6のローマ字/カタカナ−韓国文字対応表に相当する。)に切り替えられる。その後S2で入力文字列が初期化される。この直後の表示状態が図7(a)である。
次にS3で、カーソルキー22が押下されたか否かを確認する。カーソルキー22が押下された場合、S8でカーソルを移動させプレビュー表示を更新させる。そして再度S3に戻り、カーソルキー22が押下されたか否かを確認する。
S3で、カーソルキー22が押下されなかった場合、S4で決定キー23(ENTERキー)が押されたか否かを確認する。決定キー23が押下された場合、S7でカーソル位置の見出し語についての訳を表示画面に全面表示させる。
S4で決定キー23が押下されなかった場合、S5でキーボード21が押下されて文字入力がなされたか否か確認する。キーボード21が押下されていない場合、再度S3に戻り、カーソルキー22が押下されたか否かを確認する。
このように、S3、S4、S5でカーソルキー22、決定キー23、キーボード21が押下されたか否かを確認しながらS3からS5をループして、カーソルキー22、決定キー23、キーボード21を監視する。
S5において、文字入力がなされたことが確認された場合、例えば“k”キーが押下された場合、“k”がS6で文字データ一時記憶手段15aの入力文字列に追加される。この場合“k”は1文字目なのでそのまま記憶される。
そして発音表記文字変換手段11aはS9において、入力されて記憶された文字のローマ字への変換を試み、変換した文字がローマ字韓変換テーブルにあるか否かを確認する。しかし“k”のみではローマ字への変換は行なわれない。従って“k”はローマ字韓変換テーブルには存在しないため、S18に進む。尚、S18からS21は、入力された最終文字が母音の際に韓国語特有の言語規則に則った処理を行うためのフローである。
S18では、入力された文字が母音であるか子音であるかを確認する。”k”は母音ではない為、再びS3へ戻り、S3からS5の繰り返すことでキーの監視状態へ戻る。
続いて“a”キーが押下されると、“a”がS6で文字データ一時記憶手段15aの入力文字列に追加される。
この場合、入力文字列は“ka”となるため、S9において発音表記文字変換手段11aはローマ字/カタカナ変換を行い、“ka”を“カ”への変換する。そして図6に示す発音規則データ14bに備えられたローマ字韓変換テーブルに“ka”が存在するか否かが確認される。存在が確認された場合、ローマ字がS10で韓国語の文字列に変換される。この場合、変換される文字としては、入力文字列の1文字目となるので、括弧付きの文字へ変換される。具体的には、図12の文字列101へ変換される。
S11では“ka”が変換済み文字列となり、図7の(b)のように、これら2文字に下線が加えられて表示される。
次にS12において、韓国語特有の言語規則の1つである、パッチム変換の有無について確認する。“ka”は子音+母音の2文字なのでパッチム変換無しとなり、S14で抽出手段11bは文字列101を含む見出し語を辞書本体データ14aから抽出する。
S15において、抽出した見出し語の中に文字列101が含まれているか否か確認する。本実施形態による韓和辞書では、文字列101を含む見出し語が多数存在する為、表示制御手段11cは、抽出された見出し語の辞書本体データ14aに収録されている順番に従い、S16で表示手段13へ表示する。
S17で、抽出した見出し語に続く見出し語をリストに続けて表示する。しかし今回は、既に抽出した見出し語でリスト表示領域74を使っているので、追加の見出し語の表示は行わない。その代わり表示制御手段11bは、使用者がカーソルを移動させリストを下方へスクロールダウンした場合に表示し得る様に、抽出した見出し語に続く見出し語をRAM15へ一時的に記憶する。
そしてS3へ戻り、S3からS5の繰り返すことで再びキーの監視へ戻る。この状態での表示例を図7(b)へ示す。発音表記入力領域72には、入力した文字“ka”に対して、変換済みを表す下線が引かれている。カーソルはリスト中の先頭の見出し語である文字列76に有り、文字列76の訳がプレビュー表示領域75へ表示されている。この表示状態で、カーソルキー22によりリスト表示領域74の中のカーソルを上下に移動させることによって、リスト中の他の見出し語の訳をもプレビュー表示により確認することができる。
続いて“m”キーが押下されると、“m”がS6で文字データ一時記憶手段15aの入力文字列に追加される。この場合入力文字列は“kam”となる。
S9ではまず、ローマ字への変換を行うが、“m”のみではローマ字にならない為、カタカナへの変換の結果は変換済みの“カ”のままとなる。そして、図6に示す発音規則データ14bに備えられたローマ字韓変換テーブルに“kam”が存在するか否かが確認される。この場合、変換される文字としては入力文字列の1文字目となるので括弧付きの文字へ変換される。
S10で、ローマ字韓変換テーブルにより、図12の文字列102へ変換される。そしてS11では“kam”が変換済み文字列となりこれら3文字に下線が加えられて表示される。
S12において“kam”は子音+母音+子音の3文字なのでパッチム変換有りとなり、S13で抽出手段11bは文字列102を含む見出し語を辞書本体データ14aから抽出する。但し、次に入力される文字によっては“kam”を変換した文字列102だけではなく、“ka”を変換した文字列101と“m”と次の文字で変換した何かしらの文字の2文字にも変換される可能性がある。よって、S13でパッチム変換後である状態を設定しておく。これは、当該見出し語にパッチム変換後であることを示すコントロールコードを付加して、文字データ一時記憶手段15aに記憶する等して設定する。
S15で、本実施形態による韓和辞書では文字列102を含む見出し語が多数存在する為、表示制御手段11cは抽出された見出し語の辞書本体データ14aに収録されている順番に従い、S16で表示手段13へ表示する。
S17で、抽出した見出し語に続く見出し語をリストに続けて表示しようとするが、既に抽出した見出し語でリスト表示領域74を使っているので、追加の見出し語の表示は行わない。その代わり表示制御手段11bは使用者がカーソルを移動させリストを下方へスクロールダウンした場合に表示し得る様に、抽出した見出し語に続く見出し語をRAM15へ一時的に記憶するものとする。
そしてS3へ戻り、S3からS5の繰り返すことで再びキーの監視へ戻る。この状態での表示例を図7(c)へ示す。カーソルがリスト中の先頭の見出し語である文字列77に有り、文字列77の訳がプレビュー表示領域74へ表示されている。
この表示状態で、カーソルキー22によりリスト表示領域43の中のカーソルを上下に移動させることによって、リスト中の他の見出し語の訳をも確認することができる。
続いて“u”キーが押下されると、“u”がS6で文字データ一時記憶手段15aの入力文字列に追加される。この場合入力文字列は“kamu”となり、S9においてローマ字“カム”へ変換をされる。
そしてS9で図6に示す発音規則データ14bに備えられたローマ字韓変換テーブルに“kamu”が存在するか否かが確認される。この場合、“kamu”、“kam”、“ka”+“mu”の3種類について確認される。
“kamu”、“kam”、“ka”は変換される文字としては入力文字列の1文字目となるので、括弧付きの文字へ変換される。しかし、“kamu”の4文字はローマ字韓変換テーブルに存在しない文字である。そのためS10では、“kam”が文字列102へ変換され、“ka”+“mu”が文字列101+文字列103へ変換される。このときの動作が図8で示した動作である。“kamu”の4文字は、文字列102+“u”と、文字列101+文字列103、の2種類の文字列に変換される。
S10では、この2種類のどちらが適切であるかを確認するため、文字列102と文字列101+文字列103の両方の文字列を含んだ見出し語の抽出を試みる。文字列101+文字列103を含んだ見出し語は存在しないため、文字列102+“u”が採用され、文字列101+文字列103は消去される。そして未変換文字として残る“u”については後続の文字と共に変換される可能性があるので保留される。
従ってS11では“kam”が変換済み文字列となり、これら3文字に下線が加えられて表示される。
S12において、“kam”は子音+母音+子音の3文字なのでパッチム変換有りとなり、S13で抽出手段11bは文字列102を含む見出し語を辞書本体データ14aから抽出する。そして、パッチム変換後である状態が設定される。
韓国語の場合、子音+母音+子音+母音以上の長い文字列の組み合わせによる文字は無いので、この時点で“kam”までを変換した文字列102は確定され、これ以後の変換には“kam”は含まれないこととなる。S15、S16、S17からS3へ戻り、S3からS5の繰り返すことで再びキーの監視へ戻るまでは、上記“kam”までの入力と同様となる。
続いて“s”キーが押下されると、“s”がS6で文字データ一時記憶手段15aの入力文字列に追加される。この場合、入力文字列は“us”となり、S9においてローマ字“ウ”へ変換をされる。そして図6に示す発音規則データ14bに備えられたローマ字韓変換テーブルに“us”が存在するか否かが確認されるが、これは存在しない。そのため、S18で“s”の前の最終文字が母音で有ったか確認される。
“u”は母音であるので、次にS19でパッチム変換後状態であったか否かを確認する。韓国語では、パッチム変換をした後の母音は無視されることになっている。今回の“u”は、“kam”を変換した後のパッチム変換後状態であり、母音であるため、S20において母音は無視され、変換されない文字として残される。このときの動作が図9(a)で示した動作であり、従って“us”は変換されない。
その後、S21において“us”のパッチム変換後状態を解除し、S3へ戻りS3からS5の繰り返すことで再びキーの監視へ戻る。この場合“s”もローマ字には変換されない為、“kam”が変換済み文字列のまま変わらず、下線は変化しない。この状態での表示例を図7(d)へ示す。“u”を入力したときとリスト表示領域43の見出し語とプレビュー表示領域の訳表示の内容は変化しない。
続いて“a”キーが押下されると、“a”がS6で文字データ一時記憶手段15aの入力文字列に追加される。この場合入力文字列は“sa”となり、S9において発音表記文字変換手段11aはローマ字“サ”への変換する。
S9では、ローマ字韓変換テーブルに“sa”が存在するか否かを確認する。この場合、変換される文字としては入力文字列の1文字目ではないので、括弧無しの文字へ変換される。このときの動作が図8(b)で示した動作である。“sa”の前の“u”は既に変換されない文字として残されている為、変換される文字列に入らず、“sa”のみが変換される。
S10で、ローマ字韓変換テーブルにある文字列104へ変換され、S11では“sa”が変換済み文字列となり、これらまで下線が伸びて表示される。
S12において“sa”は子音+母音の2文字なのでパッチム変換無しとなり、S14で抽出手段11bは文字列105を含む見出し語を辞書本体データ14aから抽出する。
S15で、本実施形態による韓和辞書では文字列105を含む見出し語が多数存在する為、表示制御手段11cは抽出された見出し語の辞書本体データ14aに収録されている順番に従い、S16で表示手段13へ表示する。
S17で、抽出した見出し語に続く見出し語をリストに続けて表示しようとするが、既に抽出した見出し語でリスト表示領域74を使っているので、追加の見出し語の表示は行わない。その代わり、表示制御手段11bは使用者がカーソルを移動させリストを下方へスクロールダウンした場合に、表示し得る様にRAM15へ一時的に記憶するものとする。
そしてS3へ戻り、S3からS5の繰り返すことで再びキーの監視へ戻る。この状態での表示例を図7(e)へ示す。カーソルがリスト中の先頭の見出し語であるに文字列78に有り、文字列78の訳がプレビュー表示領域74へ表示されている。この表示状態で、カーソルキー22によりリスト表示領域74の中のカーソルを上下に移動させることによって、リスト中の他の見出し語の訳をプレビュー表示で確認することができる。
続いて“ha”が入力された状態の表示例を図7(f)へ示す。“ha”がS6で文字データ一時記憶手段15aの入力文字列に追加される。この場合入力文字列は“ha”となり、S9において発音表記文字変換手段11aはローマ字“ハ”への変換する。
S9では、ローマ字韓変換テーブルに“ha”が存在するかを確認する。この場合、変換される文字としては入力文字列の1文字目ではないので括弧無しの文字へ変換される。
S10で、ローマ字韓変換テーブルにある文字列106へ変換され、S11では“ha”が変換済み文字列となり、これらまで下線が伸びて表示される。
S12において“ha”は子音+母音の2文字なのでパッチム変換無しとなり、S14で抽出手段11bは文字列107を含む見出し語を辞書本体データ14aから抽出する。
S15で、本実施形態による韓和辞書では文字列107を含む見出し語が多数存在しない為、リスト表示の更新は行わず、S3へ戻り、S3からS5の繰り返すことで再びキーの監視へ戻る。
前記文字入力と同様の入力処理を繰り返し、“munida” が入力された状態の表示例を図7(g)へ示す。上記入力の“ha”に続く“m”の入力で、“m”はパッチムとなり“ham”は文字列108に変換され、さらに続く“u”は変換されない文字となる。
そしてさらに続く“ni”は文字列109に、“da”は文字列110にそれぞれ変換される。
ここまでで変換された韓国語の文字列は文字列111となり、辞書本体データ14aにある文字列111が抽出手段11bによって抽出され、表示手段13のリスト表示領域74へ表示される。
また、S17で抽出した見出し語に続く見出し語である文字列105等が続けてリスト表示領域74の残りの行へ表示される。
ここまでで使用者は、“カムサハムニダ”までの入力を終了し、図7(g)では入力したローマ字の全てのアルファベット文字に下線が引かれていることから、全ての入力文字が韓国語の文字列へ変換されていることを知ることができる。このときにリスト表示領域74で先頭に表示されている見出し語が、入力されたローマ字による発音表記を韓国語へ変換した文字を最も多く含む見出し語である。
プレビュー領域75にプレビューされている訳を同時に参照することにより、使用者は、“カムサハムミダ”と聞いた状況から、その場から話し手が話した言葉であるかどうかを瞬時に想像できる。

次に、耳から聞いた単語を、音声入力による発音表記ローマ字によって検索する動作について、図2の外観図と、図7の表示例と、図8と図9(c)、図9(d)の変換動作の例と、図11に示すフローチャートと、図12の韓国語の文字列の図を使って説明する。本実施形態では、使用者が“カムサハムニダ”と聞き、その意味を調べる例を示す。
まず電源キー20により電子辞書は動作待ち状態になる。この状態はフローチャートではS0である。次に本実施形態では辞書選択キー24が使用者によって押下され、韓和辞書が選択される。すると、S1で辞書の選択とローマ字から韓国語の文字への変換テーブルであるローマ字韓変換テーブル(図6のローマ字/カタカナ−韓国文字対応表に相当する。)に切り替えられる。その後S2で音声入力文字列が初期化される。この直後の表示状態が図7(a)である。
次にS3で、カーソルキー22が押下されたか否かを確認する。カーソルキー22が押下された場合、S8でカーソルを移動させプレビュー表示を更新させる。そして再度S3に戻り、カーソルキー22が押下されたか否かを確認する。
S3で、カーソルキー22が押下されなかった場合、S4で決定キー23(ENTERキー)が押されたか否かを確認する。決定キー23が押下された場合、S7でカーソル位置の見出し語についての訳を表示画面に全面表示させる。
S4で決定キー23が押下されなかった場合、S5でマイク26から音声入力がなされたか否か確認する。音声入力がされていない場合、再度S3に戻り、カーソルキー22が押下されたか否かを確認する。
このように、S3、S4、S5でカーソルキー22、決定キー23のキー入力か、マイク26による音声入力がなされたか否かを確認しながらS3からS5をループして、カーソルキー22、決定キー23、マイク26による音声入力を監視する。
S5において、音声入力がなされたことが確認された場合、例えば“か”という音声が入力された場合、音声認識手段11dにより“ka”という発音表記であるローマ字がS6で文字データ一時記憶手段15aの入力文字列に追加される。この場合、発音表記であるローマ字の文字列は“ka”となるため、S9において発音表記文字変換手段11aはローマ字/カタカナ変換を行い、“ka”を“カ”への変換する。
発音表記文字変換手段11aはS9において、変換されて記憶されたローマ字の韓国語文字への変換を試み、音声認識手段11dで変換した文字列がローマ字韓変換テーブルにあるか否かを確認する。もしもローマ字韓変換テーブルに無かった場合には、S18に進む。尚、S18からS21は、音声入力されたローマ字の最終文字が母音の際に韓国語特有の言語規則に則った処理を行うためのフローである。S18では、変換された文字列の末尾が母音であるか子音であるかを確認する。
この場合S9において、図6に示す発音規則データ14bに備えられたローマ字韓変換テーブルに“ka”が存在するか否かが確認される。存在が確認された場合、ローマ字がS10で韓国語の文字列に変換される。この場合、変換される文字としては、入力文字列の1文字目となるので、括弧付きの文字へ変換される。具体的には、図12の文字列101へ変換される。
S11では“ka”が変換済み文字列となり、図7の(b)のように、これら2文字に下線が加えられて表示される。
次にS12において、韓国語特有の言語規則の1つである、パッチム変換の有無について確認する。“ka”は子音+母音の2文字なのでパッチム変換無しとなり、S14で抽出手段11bは文字列101を含む見出し語を辞書本体データ14aから抽出する。
S15において、抽出した見出し語の中に文字列101が含まれているか否か確認する。本実施形態による韓和辞書では、文字列101を含む見出し語が多数存在する為、表示制御手段11cは、抽出された見出し語の辞書本体データ14aに収録されている順番に従い、S16で表示手段13へ表示する。
S17で、抽出した見出し語に続く見出し語をリストに続けて表示する。しかし今回は、既に抽出した見出し語でリスト表示領域74を使っているので、追加の見出し語の表示は行わない。その代わり表示制御手段11bは、使用者がカーソルを移動させリストを下方へスクロールダウンした場合に表示し得る様に、抽出した見出し語に続く見出し語をRAM15へ一時的に記憶する。
そしてS3へ戻り、S3からS5の繰り返すことで再びキーの監視へ戻る。この状態での表示例を図7(b)へ示す。発音表記入力領域72には、音声入力したローマ字“ka”に対して、変換済みを表す下線が引かれている。カーソルはリスト中の先頭の見出し語である文字列76に有り、文字列76の訳がプレビュー表示領域75へ表示されている。この表示状態で、カーソルキー22によりリスト表示領域74の中のカーソルを上下に移動させることによって、リスト中の他の見出し語の訳をもプレビュー表示により確認することができる。
続いて“む” という音声が入力ると、“mu”がS6で文字データ一時記憶手段15aの変換文字列に追加される。この場合ローマ字は“kamu”となり、S9においてカタカナ“カム”へ変換をされる。
そしてS9で図6に示す発音規則データ14bに備えられたローマ字韓変換テーブルに“kamu”が存在するか否かが確認される。この場合、“kamu”、“kam”、“ka”+“mu”の3種類について確認される。
“kamu”、“kam”、“ka”は変換される文字としては入力文字列の1文字目となるので、括弧付きの文字へ変換される。しかし、“kamu”の4文字はローマ字韓変換テーブルに存在しない文字である。そのためS10では、“kam”が文字列102へ変換され、“ka”+“mu”が文字列101+文字列103へ変換される。このときの動作が図8で示した動作である。“kamu”の4文字は、文字列102+“u”と、文字列101+文字列103、の2種類の文字列に変換される。
S10では、この2種類のどちらが適切であるかを確認するため、文字列102と文字列101+文字列103の両方の文字列を含んだ見出し語の抽出を試みる。文字列101+文字列103を含んだ見出し語は存在しないため、文字列102+“u”が採用され、文字列101+文字列103は消去される。そして未変換文字として残る“u”については後続の文字と共に変換される可能性があるので保留される。
従ってS11では“kam”が変換済み文字列となり、これら3文字に下線が加えられて表示される。
S12において、“kam”は子音+母音+子音の3文字なのでパッチム変換有りとなり、S13で抽出手段11bは文字列102を含む見出し語を辞書本体データ14aから抽出する。そして、パッチム変換後である状態が設定される。
韓国語の場合、子音+母音+子音+母音以上の長い文字列の組み合わせによる文字は無いので、この時点で“kam”までを変換した文字列102は確定され、これ以後の変換には“kam”は含まれないこととなる。S15、S16、S17からS3へ戻り、S3からS5の繰り返すことで再びキーの監視へ戻るまでは、上記“kam”までの入力と同様となる。

続いて“さ” という音声が入力されると、“sa”がS6で文字データ一時記憶手段15aの入力文字列に追加される。この場合、ローマ字の未変換文字列“usa”となり、S9においてローマ字“u”はカタカナ“ウ”へ変換をされる。そして図6に示す発音規則データ14bに備えられたローマ字韓変換テーブルに“usa”が存在するか否かが確認されるが、これは存在しない。そのため、S18で“s”の前の最終文字が母音で有ったか確認される。
“u”は母音であるので、次にS19でパッチム変換後状態であったか否かを確認する。韓国語では、パッチム変換をした後の母音は無視されることになっている。今回の“u”は、“kam”を変換した後のパッチム変換後状態であり、母音であるため、S20において母音は無視され、変換されない文字として残される。このときの動作が図9(c)で示した動作であり、従って“usa”は変換されない。
その後、S21において“usa”のパッチム変換後状態を解除し、S3へ戻りS3からS5の繰り返すことで再びキーの監視へ戻る。この場合S9において発音表記文字変換手段11aは“sa”をカタカナ“サ”への変換する。
S9では、ローマ字韓変換テーブルに“sa”が存在するか否かを確認する。この場合、変換される文字としては入力文字列の1文字目ではないので、括弧無しの文字へ変換される。このときの動作が図9(d)で示した動作である。“sa”の前の“u”は既に変換されない文字として残されている為、変換される文字列に入らず、“sa”のみが変換される。
S10で、ローマ字韓変換テーブルにある文字列104へ変換され、S11では“sa”が変換済み文字列となり、これらまで下線が伸びて表示される。
S12において“sa”は子音+母音の2文字なのでパッチム変換無しとなり、S14で抽出手段11bは文字列105を含む見出し語を辞書本体データ14aから抽出する。
S15で、本実施形態による韓和辞書では文字列105を含む見出し語が多数存在する為、表示制御手段11cは抽出された見出し語の辞書本体データ14aに収録されている順番に従い、S16で表示手段13へ表示する。
S17で、抽出した見出し語に続く見出し語をリストに続けて表示しようとするが、既に抽出した見出し語でリスト表示領域74を使っているので、追加の見出し語の表示は行わない。その代わり、表示制御手段11bは使用者がカーソルを移動させリストを下方へスクロールダウンした場合に、表示し得る様にRAM15へ一時的に記憶するものとする。
そしてS3へ戻り、S3からS5の繰り返すことで再びキーの監視へ戻る。この状態での表示例を図7(e)へ示す。カーソルがリスト中の先頭の見出し語であるに文字列78に有り、文字列78の訳がプレビュー表示領域74へ表示されている。この表示状態で、カーソルキー22によりリスト表示領域74の中のカーソルを上下に移動させることによって、リスト中の他の見出し語の訳をプレビュー表示で確認することができる。
続いて“は”という音声が入力され“ha”が追加された状態の表示例を図7(f)へ示す。“ha”がS6で文字データ一時記憶手段15aの入力文字列に追加される。この場合入力文字列は“ha”となり、S9において発音表記文字変換手段11aはカタカナ“ハ”への変換する。
S9では、ローマ字韓変換テーブルに“ha”が存在するかを確認する。この場合、変換される文字としては入力文字列の1文字目ではないので括弧無しの文字へ変換される。
S10で、ローマ字韓変換テーブルにある文字列106へ変換され、S11では“ha”が変換済み文字列となり、これらまで下線が伸びて表示される。
S12において“ha”は子音+母音の2文字なのでパッチム変換無しとなり、S14で抽出手段11bは文字列107を含む見出し語を辞書本体データ14aから抽出する。
S15で、本実施形態による韓和辞書では文字列107を含む見出し語が多数存在しない為、リスト表示の更新は行わず、S3へ戻り、S3からS5の繰り返すことで再びキーの監視へ戻る。
前記文字入力と同様の入力処理を繰り返し、“むにだ”という音声が入力され“munida” が追加された状態の表示例を図7(g)へ示す。上記入力の“ha”に続く“m”の入力で、“m”はパッチムとなり“ham”は文字列108に変換され、さらに続く“u”は変換されない文字となる。
そしてさらに続く“ni”は文字列109に、“da”は文字列110にそれぞれ変換される。
ここまでで変換された韓国語の文字列は文字列111となり、辞書本体データ14aにある文字列111が抽出手段11bによって抽出され、表示手段13のリスト表示領域74へ表示される。
また、S17で抽出した見出し語に続く見出し語である文字列105等が続けてリスト表示領域74の残りの行へ表示される。
ここまでで使用者は、“カムサハムニダ”までの入力を終了し、図7(g)では入力したローマ字の全てのアルファベット文字に下線が引かれていることから、全ての入力文字が韓国語の文字列へ変換されていることを知ることができる。このときにリスト表示領域74で先頭に表示されている見出し語が、入力されたローマ字による発音表記を韓国語へ変換した文字を最も多く含む見出し語である。
プレビュー領域75にプレビューされている訳を同時に参照することにより、使用者は、“カムサハムミダ”と聞いた状況から、その場から話し手が話した言葉であるかどうかを瞬時に想像できる。

さらに使用者は、図7(g)の表示状態から、決定キー23を押下し、文字列111の訳を表示装置13である液晶表示画面28の全画面に表示させ、話し手に見せて、話し手が話した言葉であるかどうかを確認することもできる。
以上のように本発明による韓和辞書の実施形態において、使用者が“カムサハムミダ”と聞き、その通りのローマ字による発音表記を文字入力または音声入力することによって、“カムサハムミダ”が文字列111と変換され、“ありがとう”という意味を知るところまでを、図2の外観図、図7の表示例、図8と図9の変換動作の例、図10、図11に示すフローチャート、および図12の韓国語の文字列の図を使って説明した。
本実施形態で実現されているように、母国語でない言語の綴りや入力方法を知らない使用者でも、簡単に素早く目的の単語を検索でき、尚且つ日本語的発音表記を辞書データに追加する作業と記憶容量の増大を防ぎ、電子辞書に追加的な市場価格の上昇をさせずに日本語的発音表記による検索を可能とすることが実現される。
本発明による技術を使えば例えば「キムチ」を「kimuchi」と入力もしくは“きむち”と音声入力して、韓国語のローマ字綴である「kimch」を入力した場合と同様の検索結果が得られ、また焼肉の「カルビ」も「karubi」と文字入力または“かるび”という音声入力で「galbi」と入力した場合と同様の検索結果が得られることとなる。
さらに本発明によれば、日本人には馴染みにくい韓国語などの(2ボル、3ボル等)独特の入力方式を知らない使用者でも、日本語的発音表記で簡単に検索できるようにすることができる。例え何の言語の辞書であっても耳から聞いた発音をもとにした日本語的発音表記で電子辞書が簡単に活用でき、調べられるようになり、日本人が外国人の話した言葉を理解する補助が可能な電子辞書を実現できるのである。
以上、本発明の電子辞書における一実施形態について説明したが、本発明は説明した実施形態に限定されるものではなく、各請求項に記載した範囲において各種の変形を行うことが可能である。
例えば、説明した実施形態では、韓国語−日本語の韓和辞書について説明したが、中国語の漢字毎の日本語的発音表記を発音規則データに記憶させ、発音表記文字変換手段11aにおいて中国語独特の四声と日本語の発音表記との差異を調整せしめ、中国語の耳から聞いた発音から引くことのできる中和辞書も実現可能となる。
また英語などアルファベットを使用した言語については、音節毎の文字列の塊をひとつの文字と位置付けて、韓国語や中国語の1文字の時と同様に日本語的発音表記を対応付けることで、英語の耳から聞いた発音から引くことのできる英和辞書へも応用することができるのである。
本発明の本実施形態では日本語的発音表記としてローマ字を使用したが、カタカナやひらがななど使用者になじみ易い発音表記を選択することもできる。また、発音表記文字の入力手法として文字入力によるローマ字入力や音声認識によってローマ字への変換も、平仮名入力や音声認識による平仮名へ変換など、別のの手法を採用することも可能である。
また、本実施形態による電子辞書の外観図に示したように、複数の辞書をひとつの電子辞書に収録し、それら複数の辞書の異なる言語毎に対応した発音規則データ14bと、各言語の発音特性と日本語的発音の差異を調整する発音表記文字変換手段11aを備える用にしてもよい。この際、前記辞書選択キー24による辞書の選択と連動して、辞書とともに発音規則データ14bと発音表記文字変換手段11aが切替わるようにすることも可能である。また、辞書ごとに発音規則データ14bと発音表記文字変換手段11aを備えることによって、日本語的発音表記による異なる言語の複数の辞書に対する一括検索までも可能となる。
また、本実施形態では電子辞書に関して説明してきたが、辞書データや辞書データ検索機能を有するコンピュータ等の機器に、本発明の発音規則データ14bおよび発音標記文字変換手段11aを搭載して、本発明の検索方法を実行することも可能である。さらに、本発明の発音規則データ14bは電子データであり、発音表記記文字変換手段11aはソフトウエアとして具現化が可能であるため、記憶媒体に記憶して配布したり、ネットワークを使って配信したりことも可能である。
このように本発明によって、例え何の言語の辞書であっても、耳から聞いた発音をもとにした日本語的発音表記で、聞いた単語を電子辞書で簡単に検索でき、調べられるようになり、日本人が外国人の話した言葉を電子辞書の助けを借りながら理解できるようなる。
さらに最近では、日本語を学ぶ欧米人が増えており、ローマ字を読んだり書いたりすることができる欧米人も増えている。本発明による技術を和英辞典に活用すれば、日本語を学ぶ外国人にとっても耳から聞いた発音をもとに日本語的発音表記で電子辞書が簡単に活用でき、調べられるようになる。
さらには、この様な上記日本語を学ぶ欧米人にとっても日本語的発音や日本語的発音表記さえ覚えていれば、何の言語の辞書であっても耳から聞いた発音をもとに日本語的発音表記で電子辞書が簡単に活用できる環境を提供できる。
なお、本発明による実施形態では、日本語的発音表記から辞書データの中の見出し語を検索した例を示したが、検索対象の言語をそれぞれ独特の入力方式で直接入力して検索させる方法を備えていることは言うまでも無い。
本発明の一実施形態における電子辞書の構成を表したブロック図である。 本発明の一実施形態における電子辞書の外観を示す平面図である。 従来技術による日本語的発音表記から検索する電子辞書の、辞書データ部分の記憶内容の説明図である。 本発明の一実施形態における韓国語の発音と文字の対応を示した説明図である。 本発明の一実施形態における韓国語の2重母音を持つ文字に関する発音と文字の対応を示した説明図である。 本発明の一実施形態における韓国語の発音規則データ14bの説明図である。 本発明の一実施形態における韓国語−日本語辞書の表示例を表した図である。 本発明の一実施形態における日本語的発音表記から韓国語の文字への変換を行う場合の、パッチムを含んだ文字と含まない文字の処理を示した説明図である。 本発明の一実施形態における日本語的発音表記から韓国語の文字への変換を行う場合の、日本語的発音表記と韓国語の発音との差異を調整する動作例を示した説明図である。 本発明の一実施形態における電子辞書の、文字入力による日本語的発音表記から韓国語の見出し語を検索する動作の流れを表したフローチャートである。 本発明の一実施形態における電子辞書の、音声入力による日本語的発音表記から韓国語の見出し語を検索する動作の流れを表したフローチャートである。 韓国語の文字列の図である。
符号の説明
11 制御部
11a 発音表記文字変換手段
11b 抽出手段
11c 表示制御手段
11d 音声認識手段
12 入力手段
13 表示手段
14 辞書データ記憶手段
14a 辞書本体データ
14b 発音規則データ
15 RAM
15a 文字データ一時記憶手段
16 音声入力手段
20 電源キー
21 文字入力キー
22 カーソルキー
23 決定キー
24 辞書選択キー
25 液晶表示画面
26 マイク
30 従来の発明による辞書データ
31 日本語的発音表記
32 発音記号
33 日本語的発音の補足表記
9a 入力文字列の途中までのアンダーライン
9b 入力文字列全てにかかるアンダーライン

Claims (20)

  1. 発音表記の入力を行う入力手段と、
    見出し語と該見出し語に対応した訳からなる辞書本体データと、
    前記入力手段により入力される文字と、前記見出し語の言語における文字との対応を示す発音規則データと、
    発音規則データを使用して、前記入力手段により入力された発音表記を、前記見出し語の言語における文字に変換する発音表記文字変換手段と、
    前記発音表記文字変換手段によって変換された文字と一致する文字を含む見出し語を、前記辞書本体データから抽出する抽出手段と、
    前記抽出手段で抽出した見出し語を表示する表示手段と
    を具備することを特徴とする電子辞書。
  2. 前記表示手段は、前記入力手段により入力された発音表記を表示し、該発音表記のなかで、前記発音表記文字変換手段が変換処理に使用した文字を、変換処理に使用していない文字と区別して表示する、請求項1に記載の電子辞書。
  3. 前記抽出手段は、前記発音表記文字変換手段によって変換された文字を使用して、前記辞書本体データから見出し語と該見出し語に対応した訳を抽出し、
    前記表示手段は、前記抽出手段が抽出した訳を、前記発音表記文字変換手段が変換処理に使用した文字に対応する訳として表示する、請求項2に記載の電子辞書。
  4. 前記発音表記は、ローマ字、カタカナ文字、もしくは平仮名文字であり、
    前記発音規則データは、前記見出し語の言語における文字と、該文字の発音を表したローマ字、カタカナ文字、もしくは平仮名文字を含む、請求項1から3のいずれかに記載の電子辞書。
  5. 前記見出し語の言語は韓国語である、請求項4に記載の電子辞書。
  6. 前記見出し語の言語は中国語である、請求項4に記載の電子辞書。
  7. 前記見出し語の言語はアルファベットを使用した言語である、請求項4に記載の電子辞書。
  8. 前記辞書本体データは、多種の言語の辞書本体データを含み、
    前記辞書本体データの言語ごとに、発音規則データおよび前記発音表記文字変換手段を有する、請求項1に記載の電子辞書。
  9. 検索に使用する辞書本体データを選択する手段をさらに有し、
    前記発音規則データおよび前記発音表記文字変換手段は、選択された辞書本体データの言語に基づいて選択される、請求項8に記載の電子辞書。
  10. 見出し語と該見出し語に対応した訳からなる辞書本体データを有する電子機器において、発音表記によって前記見出し語を検索する検索方法であって、
    前記電子機器は、入力手段と、発音表記文字変換手段と、抽出手段と、前記入力手段により入力される文字と前記見出し語の言語における文字とを対応を示す発音規則データとを有し、
    検索方法は、
    前記入力手段によって、発音表記を入力するステップと、
    前記発音表記文字変換手段によって、前記発音規則データを使用して、前記入力手段により入力された発音表記を、前記見出し語の言語における文字に変換するステップと、
    前記抽出手段によって、前記発音表記文字変換手段によって変換された文字と一致する文字を含む見出し語を、前記辞書本体データから抽出するステップと、
    を具備することを特徴とする検索方法。
  11. 音声入力手段と、入力された音声を認識し発音表記へ変換する音声認識手段と、
    見出し語と該見出し語に対応した訳からなる辞書本体データと、
    前記音声入力手段で入力され前記音声認識手段にて変換される発音表記と、前記見出し語の言語における文字との対応を示す発音規則データと、
    発音規則データを使用して、前記音声認識手段にて変換された発音表記を、前記見出し語の言語における文字に変換する発音表記文字変換手段と、
    前記発音表記文字変換手段によって変換された文字と一致する文字を含む見出し語を、前記辞書本体データから抽出する抽出手段と、
    前記抽出手段で抽出した見出し語を表示する表示手段と
    を具備することを特徴とする電子辞書。
  12. 前記表示手段は、前記音声認識手段にて変換された発音表記を表示し、該発音表記のなかで、前記発音表記文字変換手段が変換処理に使用した文字を、変換処理に使用していない文字と区別して表示する、請求項10に記載の電子辞書。
  13. 前記抽出手段は、前記発音表記文字変換手段によって変換された文字を使用して、前記辞書本体データから見出し語と該見出し語に対応した訳を抽出し、
    前記表示手段は、前記抽出手段が抽出した訳を、前記発音表記文字変換手段が変換処理に使用した文字に対応する訳として表示する、請求項12に記載の電子辞書。
  14. 前記発音表記は、ローマ字、カタカナ文字、もしくは平仮名文字であり、
    前記発音規則データは、前記見出し語の言語における文字と、該文字の発音を表したローマ字、カタカナ文字、もしくは平仮名文字を含む、請求項11から13のいずれかに記載の電子辞書。
  15. 前記見出し語の言語は韓国語である、請求項14に記載の電子辞書。
  16. 前記見出し語の言語は中国語である、請求項14に記載の電子辞書。
  17. 前記見出し語の言語はアルファベットを使用した言語である、請求項14に記載の電子辞書。
  18. 前記辞書本体データは、多種の言語の辞書本体データを含み、
    前記辞書本体データの言語ごとに、発音規則データおよび前記発音表記文字変換手段を有する、請求項11に記載の電子辞書。
  19. 検索に使用する辞書本体データを選択する手段をさらに有し、
    前記発音規則データおよび前記発音表記文字変換手段は、選択された辞書本体データの言語に基づいて選択される、請求項18に記載の電子辞書。
  20. 見出し語と該見出し語に対応した訳からなる辞書本体データを有する電子機器において、発音表記によって前記見出し語を検索する検索方法であって、
    前記電子機器は、音声入力手段と、入力された音声を認識し発音表記へ変換する音声認識手段と、発音表記文字変換手段と、抽出手段と、前記音声認識手段にて変換された発音表記を前記見出し語の言語における文字とを対応を示す発音規則データとを有し、
    検索方法は、
    前記音声入力手段と前記音声認識手段によって、発音表記を入力するステップと、
    前記発音表記文字変換手段によって、前記発音規則データを使用して、前記音声入力手段と前記音声認識手段により入力された発音表記を、前記見出し語の言語における文字に変換するステップと、
    前記抽出手段によって、前記発音表記文字変換手段によって変換された文字と一致する文字を含む見出し語を、前記辞書本体データから抽出するステップと、
    を具備することを特徴とする検索方法。
JP2007029413A 2006-04-28 2007-02-08 電子辞書及び検索方法 Pending JP2007317163A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007029413A JP2007317163A (ja) 2006-04-28 2007-02-08 電子辞書及び検索方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006125034 2006-04-28
JP2007029413A JP2007317163A (ja) 2006-04-28 2007-02-08 電子辞書及び検索方法

Publications (1)

Publication Number Publication Date
JP2007317163A true JP2007317163A (ja) 2007-12-06

Family

ID=38850935

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007029413A Pending JP2007317163A (ja) 2006-04-28 2007-02-08 電子辞書及び検索方法

Country Status (1)

Country Link
JP (1) JP2007317163A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009223895A (ja) * 2008-03-14 2009-10-01 Nhn Corp 日本語辞書サービスにおいて2単語以上のクエリー、ハングルクエリーまたは一般的なクエリーの入力の際の検索結果を提供するための方法及びシステム
JP2011129159A (ja) * 2008-03-14 2011-06-30 Nhn Corp 日本語の単字入力を支援する機能を提供する方法及びシステム
US8335680B2 (en) 2009-06-05 2012-12-18 Casio Computer Co., Ltd Electronic apparatus with dictionary function background
WO2016080473A1 (ja) * 2014-11-19 2016-05-26 高 元祐 子音、母音、パッチムを同じキーで3回毎の繰返し操作により入力する韓国語入力方法
JP2020154629A (ja) * 2019-03-19 2020-09-24 富士ゼロックス株式会社 文書検索支援装置及びプログラム並びに文書検索支援システム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009223895A (ja) * 2008-03-14 2009-10-01 Nhn Corp 日本語辞書サービスにおいて2単語以上のクエリー、ハングルクエリーまたは一般的なクエリーの入力の際の検索結果を提供するための方法及びシステム
JP2011129159A (ja) * 2008-03-14 2011-06-30 Nhn Corp 日本語の単字入力を支援する機能を提供する方法及びシステム
US8335680B2 (en) 2009-06-05 2012-12-18 Casio Computer Co., Ltd Electronic apparatus with dictionary function background
WO2016080473A1 (ja) * 2014-11-19 2016-05-26 高 元祐 子音、母音、パッチムを同じキーで3回毎の繰返し操作により入力する韓国語入力方法
JP2020154629A (ja) * 2019-03-19 2020-09-24 富士ゼロックス株式会社 文書検索支援装置及びプログラム並びに文書検索支援システム

Similar Documents

Publication Publication Date Title
KR100259407B1 (ko) 중국어 텍스트 입력키보드, 중국어 텍스트 처리 컴퓨터 시스템, 중국어 텍스트 입력장치, 음성 중국어의 음절 및 단어 저장방법
US8977535B2 (en) Transliterating methods between character-based and phonetic symbol-based writing systems
JP4277903B2 (ja) 辞書機能を備えた電子機器及びプログラム
JP2013117978A (ja) タイピング効率向上のためのタイピング候補の生成方法
Singh A computational phonetic model for indian language scripts
JP2010198241A (ja) 中国語入力装置およびプログラム
KR20000057355A (ko) 명확한 점자 입력 및 번역을 위한 방법 및 시스템
JP2007317163A (ja) 電子辞書及び検索方法
WO2000060560A1 (en) Text processing and display methods and systems
JP5751537B2 (ja) 国際対応型日本語入力システム
JP3364976B2 (ja) 中国語学習装置
KR20130122437A (ko) 영어의 한글 표기 방법 및 시스템
JPS634206B2 (ja)
JP2002207728A (ja) 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体
JP4232957B2 (ja) 音素索引多要素行列構造の英語と他言語の対訳辞書
JP2007048187A (ja) 見出語表示制御装置及びプログラム
JPS58123129A (ja) 仮名漢字変換装置
JP2003178087A (ja) 外国語電子辞書検索装置および方法
Joshi et al. Input Scheme for Hindi Using Phonetic Mapping
CN111581991B (zh) 一种基于端到端神经机器翻译的汉盲翻译方法及系统
US6327560B1 (en) Chinese character conversion apparatus with no need to input tone symbols
JP2008140074A (ja) 例文検索装置および例文検索処理プログラム
JPH0969109A (ja) 文書検索方法及び文書検索装置
JP4395620B2 (ja) 表示制御装置及びプログラム
Sawalha et al. Text analytics and transcription technology for quranic arabic