JP5416033B2 - オンライン辞書サービス提供装置及びオンライン辞書サービス提供方法 - Google Patents

オンライン辞書サービス提供装置及びオンライン辞書サービス提供方法 Download PDF

Info

Publication number
JP5416033B2
JP5416033B2 JP2010116530A JP2010116530A JP5416033B2 JP 5416033 B2 JP5416033 B2 JP 5416033B2 JP 2010116530 A JP2010116530 A JP 2010116530A JP 2010116530 A JP2010116530 A JP 2010116530A JP 5416033 B2 JP5416033 B2 JP 5416033B2
Authority
JP
Japan
Prior art keywords
word
dictionary
information
web page
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010116530A
Other languages
English (en)
Other versions
JP2010272114A (ja
Inventor
在 洪 安
淳 植 蘇
贊 皓 尹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naver Corp
Original Assignee
Naver Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naver Corp filed Critical Naver Corp
Publication of JP2010272114A publication Critical patent/JP2010272114A/ja
Application granted granted Critical
Publication of JP5416033B2 publication Critical patent/JP5416033B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、オンライン辞書サービスの提供装置及びオンライン辞書サービス提供方法に関するものである。
最近、インターネットを使用する人の人口の増加及びインターネットを介した情報検索の活性化により、母国語で作成されたウェブページのみならず、他の国の言語で作成されたウェブページを表示や実行などさせることが多くなった。他の国の言語で作成されたウェブページを解読するためには該当言語に堪能でなければならないが、このような言語駆使能力を有するユーザは小数に過ぎない。したがって、インターネットユーザの便宜を図るために、言語の障壁を解消するための翻訳サービス又は辞書サービスが提供されている。
通常の翻訳サービスの場合、ウェブページに含まれた文章又は翻訳しようとするウェブページのURLをコピーして翻訳サービス提供ウェブページなどに入力すれば、翻訳サーバに前記入力された原文が送られ、原文に対する翻訳結果をユーザ端末に伝送する方式が使用される。しかしながら、このような翻訳サービスの翻訳品質は、満足できる水準でなく、原文又はURLをコピーして入力する煩雑な手順を経るようになる。
また、通常の辞書サービスの場合、検索しようとする単語をマウスなどのポインティング装置で指示すれば、該当単語がウェブサーバに伝送され、それに対する解釈結果が表示される。すなわち、単語単位で解釈が提供される。
図1は、通常提供されるオンライン辞書サービスを説明するための図である。
ネイバー(www.naver.com)又はダウム(www.daum.net)のようなポータルサイトなどでは、ユーザの便宜のため、種々の簡単なアプリケーションが含まれるツールバーサービスが提供されている。前記ツールバーサービスに含まれた一つのサービスとしてオンライン辞書サービスが提供されている。図示したように、マウスなどのポインティング装置の指示子10がウェブページに含まれた単語「research」を指示すれば、該当単語「research」に対する解釈20がツールチップ形態で提供される。このとき、指示子10が単語の周辺に位置することを示しているが、ほとんどの実施例の場合、指示子10は単語の直上に位置する。
一方、従来技術は、指定された第1の言語(例えば、英語)に対する指定された第2の言語(例えば、韓国語)への解釈のみを提供しており、その他の言語に対する解釈を動的に提供できずにいる。したがって、多様なユーザのニーズに合うオンライン辞書サービスを提供する必要がある。
本発明の一実施例に係る課題の一つは、多様な種類の言語に対して母国語解釈を動的に提供することができるオンライン辞書サービス提供装置及びオンライン辞書サービス提供方法を提供することである。
上述した技術的課題を達成するための技術的手段として、本発明の第1の側面として、原本言語の単語を単語のインデックスとマッチングさせて格納する辞書データを含む辞書データ格納部を有するオンライン辞書サービス提供装置であって、前記単語のインデックスを有するユーザ端末からユーザ母国語情報、ローディングされたウェブページのエンコーディング言語情報及び前記ウェブページと前記インデックスとの両方に含まれた検索語情報を含むクエリを受信し、前記ユーザ母国語情報、ウェブページのエンコーディング言語情報及び検索語情報を抽出するクエリ分析部と、原本言語の各単語に対する対象言語による各解釈データを含む少なくとも一つの辞書データを含む辞書データ格納部と、前記ユーザ母国語情報及びウェブページエンコーディング言語情報に基づいて前記辞書データを選択する辞書選択部と、前記選択された辞書データから前記検索語情報に対応する前記解釈データを検索する検索部と、前記解釈データを前記ユーザ端末に伝送する検索結果伝送部とを含むオンライン辞書サービス提供装置を提供する。
また、本発明の第2の側面として、原本言語の単語を単語のインデックスとマッチングさせて格納する辞書データを含む辞書データ格納部を有するオンライン辞書サービス提供装置によるオンライン辞書サービス提供方法であり、前記オンライン辞書サービス提供装置は、クエリ分析部と、辞書選択部と、検索部と、検索結果伝送部とを有し、前記クエリ分析部は、前記単語のインデックスを有するユーザ端末からユーザ母国語情報、ローディングされたウェブページのエンコーディング言語情報及び前記ウェブページと前記インデックスとの両方に含まれた検索語情報を含むクエリを受信し、前記クエリから前記ユーザ母国語情報、ウェブページのエンコーディング言語情報及び検索語情報を抽出し、前記辞書選択部は、原本言語の各単語に対する対象言語による各解釈データを含む少なくとも一つの辞書データから、前記ユーザ母国語情報及びウェブページエンコーディング言語情報に基づいて辞書データを選択し、前記検索部は、前記選択された辞書データから前記検索語情報に対応する前記解釈データを検索し、前記検索結果伝送部は、前記解釈データを前記ユーザ端末に伝送することを含むオンライン辞書サービス提供装置を提供する。
また、本発明の第3の側面として、原本言語の単語を単語のインデックスとマッチングさせて格納する辞書データを含む辞書データ格納部を有するオンライン辞書サービス提供装置に接続され、前記単語のインデックスを有するユーザ端末を含むシステムによるオンライン辞書サービス提供方法であり、ユーザ端末は、ユーザの母国語情報を確認し、前記ユーザ端末は、前記ユーザ端末にローディングされたウェブページのエンコーディング言語情報を確認し、前記ウェブページ上でポインティング装置を介してポインティングされた単語を抽出して検索語情報を生成し、前記ユーザ端末は、前記ユーザ母国語情報、前記ウェブページのエンコーディング言語情報及び前記インデックスの両方に含まれる前記単語の前記検索語情報を含むクエリを生成し、前記ユーザ端末は、前記クエリに基づいた辞書サーバの検索結果を受信して前記ユーザ端末に表示することを含むオンライン辞書サービス提供方法を提供する。
また、本発明の第4の側面として、前記オンライン辞書サービス提供方法に記載された段階を行うプログラムが記録されたコンピュータ読取可能な記録媒体を提供する。
上述した本発明の課題解決手段によれば、ユーザの母国語によって、ウェブページに表示された多様な国の言語に対して自動に解釈サービスを提供することができる。特に、ユーザの母国語に基づいて解釈サービスを提供するので、ユーザに最適化したサービスを提供することができる。
また、ユーザの母国語をユーザ端末の設定に基づいて自動に確認するので、便利性がより増加する。
通常提供されるオンライン辞書サービスを説明するための図である。 本発明の一実施例に係るオンライン辞書サービス提供装置を示した図である。 ウェブページのエンコーディング情報を含むヘッダ部分の一例を示した図である。 本発明の一実施例に係る検索語生成部の詳細構成を示した図である。 本発明の一実施例に係るオンライン辞書サービス提供方法を示したフローチャートである。
以下、本発明の属する技術分野における通常の知識を有する者が容易に実施できるように、添付の図面を参照して本発明の実施例を詳細に説明する。本発明は、多様な異なる形態で具現可能であり、ここで説明する実施例によって限定されるものでない。そして、図面では、本発明を明確に説明するために、説明と関係のない部分は省略し、明細書全体にわたって類似した部分には類似した図面符号を付した。
明細書全体で、一つの部分が他の部分と「連結」または「接続」されているというとき、これは、「直接的に連結または接続」されている場合だけでなく、その中間に他の素子を挟んで「電気的に連結または接続」されている場合も含む。また、一つの部分が一つの構成要素を「含む」というとき、これは、特別に反対の記載がない限り、他の構成要素を除外するのでなく、他の構成要素をさらに含むことができることを意味する。
以下、図面を参照して本発明の内容を説明する。
図2は、本発明の一実施例に係るオンライン辞書サービス提供装置を示した図である。
オンライン辞書サービス提供装置100は、クライアント200及び辞書サーバ300を含む。クライアント200は、ユーザ端末にインストール(設置)され、各種情報を収集し、これを、ネットワークを介して辞書サーバ300に伝達する。ネットワークは、近距離通信網(Local Area Network;LAN)、広域通信網(Wide Area Network;WAN)又は付加価値通信網(Value Added Network;VAN)などのような有線ネットワークや、移動通信網又は衛星通信網などのようなあらゆる種類の無線ネットワークで具現される。
クライアント200は、ユーザの母国語情報、ウェブページのエンコーディング情報及び検索語情報を含むクエリを生成して辞書サーバ300に伝送する。クライアント200は、ユーザ母国語確認部210、ウェブページ言語確認部220、検索語生成部230、クエリ生成部240、検索結果表示部250及び環境設定部260を含む。
クライアント200は、ネットワークを介してダウンロードされ、コンピュータや携帯用端末などのユーザ端末にインストール(設置)される。ここで、コンピュータは、例えば、ウェブブラウザが搭載されたノートブック、デスクトップ、ラップトップなどを含み、携帯用端末は、例えば、携帯性と移動性が保障される無線通信装置であって、PCS(Personal Communication System)、GSM(Global System for Mobile communications)、PDC(Personal Digital Cellular)、PHS(Personal Handyphone System)、PDA(Personal Digital Assistant)、IMT(International Mobile Telecommunication)―2000、CDMA(Code Division Multiple Access)―2000、W―CDMA(W―Code Division Multiple Access)、Wibro(Wireless Broadband Internet)端末などのようなあらゆる種類のハンドヘルド(Handheld)ベースの無線通信装置を含むことができる。
ユーザ母国語確認部210は、ユーザ端末の設定状態からユーザの母国語を確認する。例えば、コンピュータや携帯用端末にインストール(設置)されたオペレーティングシステム(OS)又はアプリケーションプログラムの情報からユーザの母国語を確認する。通常使用されるオペレーティングシステム(OS)としては、マイクロソフト社のウィンドウズ(登録商標)(WINDOWS(登録商標))シリーズを例に挙げることができる。前記ウィンドウズ(登録商標)OSの場合、英語の他に、各国の国語をメーン言語として表示する各製品に分類される。例えば、韓国語、中国語、日本語などをメーン言語として使用するウィンドウズ(登録商標)OSがユーザ端末にインストール(設置)される。したがって、ユーザ端末にインストール(設置)されたOSに基づいてユーザの母国語を判断することができる。すなわち、ユーザ端末にインストール(設置)されたオペレーティングシステムのメーン言語が英語である場合、ユーザの母国語は英語であると判断する。
また、ユーザ端末のオペレーティングシステム(OS)の他に、各種アプリケーションプログラムの情報からユーザの母国語を確認することができる。アプリケーションプログラムには、オフィスプログラム及びウェブブラウザなどの多様なソフトウェアが含まれる。このようなアプリケーションプログラムも、オペレーティングシステムと同様に、各国の国語をメーン言語として表示する各製品に分類される。したがって、ユーザ端末にインストール(設置)されたアプリケーションプログラムのメーン言語に基づいてユーザの母国語を確認することができる。
一方、相当数のユーザ端末においては、オペレーティングシステムのメーン言語とアプリケーションプログラムのメーン言語とが一致するので、二つの基準のうち何れか一つのみを使用してユーザの母国語を確認することができる。オペレーティングシステムのメーン言語とアプリケーションプログラムのメーン言語とが異なる場合は、オペレーティングシステムのメーン言語に基づいてユーザの母国語を決定したり、アプリケーションプログラムのメーン言語に基づいてユーザの母国語を決定したりする。
ウェブページ言語確認部220は、ユーザ端末のウェブブラウザにローディングされたウェブページのエンコーディング言語を確認する。通常のウェブページはHTML言語により作成され、ウェブページのプログラミング文書のヘッダ領域には、該当ウェブページがどの言語を基準にしてエンコーディングされたかに関する情報が格納される。
図3は、ウェブページのエンコーディング情報を含むヘッダの一例を示した図である。
ウェブページのエンコーディング情報は、「charset」の設定値によって決定される。図示したように、「charset」が「euc―kr」に設定された場合、該当ウェブページは、「euc―kr」コードによってエンコーディングされたと判断する。「euc―kr」コードは、韓国語をベースにするエンコーディング方法であるので、該当ウェブページは、韓国語に基づいて作成されたと判断する。
このようなエンコーディング方法は、言語の種類及び開発主体などによって多様な種類に区分される。日本語を基盤にするエンコーディング方法としてはShift_JIS、EUC―JP、ISO―2022―JPなどがあり、中国語を基盤にするエンコーディング方法としてはGB 2312、GBK、GB 18030、Big5などがあり、韓国語を基盤にするエンコーディング方法としてはEUC―KR、ISO―2022―KRなどがある。その他に、アラビア語、バルト語、中央ヨーロッパ語、ギリシャ語、ヘブライ語、タイ語、トルコ語、ベトナム語、西ヨーロッパ語などの各言語を基盤にする多様なエンコーディング方法が知られている。
したがって、各ウェブページのエンコーディング情報を確認すれば、該当ウェブページに記述された言語がどの言語で作成されているかを確認することができる。
ウェブページ言語確認部220は、各ウェブページのプログラミング文書のヘッダ部分の「charset」に設定された値を抽出し、エンコーディング情報を確認することができる。また、BHO(Browser Helper Objects)モジュールを用いてウェブページのエンコーディング情報を確認することができる。
検索語生成部230は、マウスなどのポインティング装置を介して指示される位置にある単語を抽出し、検索語情報を生成する。以下、図面を参照して詳細構成を説明することにする。
図4は、本発明の一実施例に係る検索語生成部の詳細構成を示した図である。
検索語生成部230は、単語認識部232、トリミング処理部234、単語インデックス検索部236及び単語インデックス格納部238を含む。
単語認識部232は、ポインティング装置の指示子が単語の上に位置することを示すイベントを感知し、イベントが発生した地点の単語を認識してトリミング処理部234に伝達する。このとき、ポインティング装置は、マウス、タブレット、タッチパッド又はタッチスクリーンなどのような多様な形態の入力装置である。タッチスクリーンの場合、別途の装置の他に、指によって指示子の移動が制御される。
単語認識部232は、ポインティング装置の移動有無を持続的に感知し、指示子が単語の上に位置する時間が基準値以上である場合、指示子が位置する地点の単語を認識する。このとき、前記基準値をユーザの設定によって調節することによって、単語認識の敏感度を調節することができる。すなわち、指示子が単語の上に位置する時間の基準値を増加させれば、単語認識の敏感度が減少し、逆に、指示子が単語の上に位置する時間の基準値を減少させれば、単語認識の敏感度が増加する。
トリミング処理部234は、単語認識部232が認識した単語からノイズ文字を除去する。ノイズ文字は、単語の解釈と関係のない多様な文字や各種特殊文字を含む。すなわち、認識された単語の前、後、中間部分などに位置した「''」、「""」、「!」、「?」などの各種文章符号などがノイズ文字に含まれ、トリミング処理部234は、このようなノイズ文字を除去するトリミング動作を行う。
単語インデックス検索部236は、単語認識部232によって認識された単語、又は単語認識部232によって認識されてトリミング処理部234によってトリミング処理された単語のインデックスを単語インデックス格納部238から検索する。また、検索された単語のインデックスを検索語情報に設定し、これをクエリ生成部240に伝送する。検索された単語のインデックスがない場合は、該当単語に対する解釈が辞書サーバ300にもないと判断し、該当単語に対するクエリが生成されないようにする。
単語インデックス格納部238は、辞書サーバ300に登録された各単語に対して固有のインデックスを指定して格納する。単語認識部232で認識された単語には、辞書サーバ300に登録されていない単語があり得る。このような単語がクエリに含まれる場合、辞書サーバ300は、該当単語に対する検索値を返すことができないので、不必要な演算を行うようになるという問題が発生する。そのため、本発明では、辞書サーバ300に登録された各単語のインデックス情報をクライアント200に格納し、辞書サーバ300に登録された各単語のみに対してクエリが生成されるようにする。
一方、単語インデックス格納部238は、言語別に区別されるインデックステーブルを有することができる。すなわち、韓国語、英語、日本語、中国語などの各種言語別に互いに異なるインデックステーブルを含むようにする。
再び図2を参照すれば、クエリ生成部240は、ユーザ母国語情報、ウェブページエンコーディング言語情報及び検索語情報を含むクエリを生成する。ユーザ母国語情報はユーザ母国語確認部210から受信し、ウェブページエンコーディング言語情報はウェブページ言語確認部220から受信し、検索語情報は検索語生成部230から受信する。このとき、検索語情報は、検索語生成部230から出力される単語のインデックスとしての形態になり得る。これは、辞書サーバ300に伝送され、辞書サーバ300は、クエリに含まれたユーザ母国語情報及びウェブページエンコーディング言語情報から適切な辞書データを選択し、選択された辞書データから検索語情報に該当する解釈データを検索するようになる。このとき、クエリ生成部240は、検索語情報によって識別される単語が辞書データに登録された場合に限って前記クエリを生成する。すなわち、単語インデックス格納部238にインデックスが登録されていない単語に対してはクエリを生成しない。
検索結果表示部250は、辞書サーバから受信される解釈データをユーザ端末の各種表示手段に表示する。望ましくは、解釈データは、ポインティング装置が指示する検索対象単語と隣接した位置にツールチップ形態で表示する。
環境設定部260は、ユーザが選択する各設定事項の入力を受け、これを格納し、それによってオンライン辞書サービスが提供されるようにする。上述したユーザ母国語を確認する基準をユーザ端末のオペレーティングシステム又はアプリケーションプログラムのうち何れか一つに固定したり、ユーザ母国語自体をユーザが直接設定したりするようにする。また、検索語生成部230の単語認識部232で、ポインティング装置の指示子が単語の上に位置する時間の基準値をユーザが直接設定できるようにする。
以下、辞書サーバ300の構成を説明することにする。
辞書サーバ300は、クライアント200からクエリを受信し、ユーザの母国語情報及びウェブページのエンコーディング言語に基づいて最適の辞書データを選択し、選択された辞書データから検索対象単語に対する解釈を検索してクライアント200に伝送する。辞書サーバ300は、クエリ分析部310、辞書選択部320、検索部330、検索結果伝送部340及び辞書データ格納部350を含む。
辞書サーバ300のクエリ分析部310は、クライアント200から受信したクエリを分析し、ユーザ母国語情報、ウェブページエンコーディング言語情報及び検索語情報を抽出する。また、ユーザ母国語情報及びウェブページエンコーディング言語情報を辞書選択部320に伝達し、検索語情報は検索部330に伝達する。
辞書選択部320は、ユーザ母国語情報及びウェブページエンコーディング言語情報に基づいて最適の辞書データを辞書データ格納部350から選択する。
まず、辞書データ格納部350について説明すれば、辞書データ格納部350は、複数の辞書データ352、354、356を含む。辞書データは、原本言語の各単語に対する対象言語への解釈を含む。このとき、原本言語は、解釈を必要とする単語の言語種類を意味する。また、対象言語は、解釈を行う言語を意味する。すなわち、原本言語の各単語を、対象言語を用いて翻訳する。このとき、原本言語と対象言語とは同一の言語になり得る。例えば、韓国語、日本語、中国語、英語のうち何れか一つの言語を原本言語にし、韓国語、日本語、中国語、英語のうち何れか一つの言語を対象言語にする計16種類の辞書データを考慮することができる。すなわち、英単語を英語で解釈する辞書データ、英単語を中国語で解釈する辞書データ、英単語を日本語で解釈する辞書データ、英単語を韓国語で解釈する辞書データ、中国語単語を英語で解釈する辞書データ、中国語単語を中国語で解釈する辞書データ、中国語単語を日本語で解釈する辞書データ、中国語単語を韓国語で解釈する辞書データ、日本語単語を英語で解釈する辞書データ、日本語単語を中国語で解釈する辞書データ、日本語単語を日本語で解釈する辞書データ、日本語単語を韓国語で解釈する辞書データ、韓国語単語を英語で解釈する辞書データ、韓国語単語を中国語で解釈する辞書データ、韓国語単語を日本語で解釈する辞書データ又は韓国語単語を韓国語で解釈する辞書データを考慮することができる。
すなわち、n個の言語のうち何れか一つの言語を原本言語にし、m個の言語のうち何れか一つの言語を対象言語にすると、計n*m種類の辞書データが含まれる。
一方、辞書データの原本言語の各単語は、単語のインデックスとマッチングされて格納される。すなわち、クライアント200から受信した検索語情報が単語のインデックスを含む実施例の場合、単語のインデックスに基づいて検索が行われるので、辞書データは、単語のインデックス情報を含むように構成される。
一方、本発明の辞書データは、通常の辞書に比べて簡略な解釈を含ませることができる。すなわち、ツールチップ形態の解釈を提供するので、検索対象になる単語に対する代表的な解釈のみが含まれるように辞書データを構成することができる。
再び辞書選択部320を説明すれば、辞書選択部320は、原本言語がウェブページのエンコーディング言語情報に該当し、対象言語がユーザ母国語情報に該当する辞書データを選択する。例えば、ユーザ母国語情報が英語で、ウェブページエンコーディング言語情報が日本語である場合、原本言語が日本語で、対象言語が英語である辞書データを選択する。すなわち、ウェブページに含まれた各種日本語単語を英語で解釈する辞書データが選択される。また、ユーザ母国語情報が韓国語で、ウェブページエンコーディング言語情報が中国語である場合、原本言語が中国語で、対象言語が韓国語である辞書データを選択する。すなわち、ウェブページに含まれた各種中国語単語を韓国語で解釈する辞書データが選択される。
検索部330は、辞書選択部320によって選択された辞書データから検索語情報に該当する解釈データを検索する。このとき、検索語情報が単語のインデックスの形態である場合、単語のインデックスに基づいて解釈データを検索する。検索された解釈データは検索結果伝送部340に伝送される。
検索結果伝送部340は、検索された解釈データを、ネットワークを介してクライアント200に伝送する。
参考として、本発明の実施例に係る図2と図4に示した各構成要素は、ソフトウェア、FPGA(Field Programmable Gate Array)又はASIC(Application Specific Integrated Circuit)のようなハードウェア構成要素を意味し、所定の役割を行う。
しかし、「各構成要素」は、ソフトウェア又はハードウェアに限定される意味でなく、各構成要素は、アドレッシングできる格納媒体に含まれるように構成されたり、一つ又はそれ以上のプロセッサを再生するように構成されたりすることも可能である。
したがって、一例として、構成要素は、各ソフトウェア構成要素、各客体指向ソフトウェア構成要素、各クラス構成要素及び各タスク構成要素のような各構成要素と、各プロセス、各関数、各属性、各プロシージャ、各サブルーチン、プログラムコードの各セグメント、各ドライバー、ファームウェア、マイクロコード、回路、データ、データベース、各データ構造、各テーブル、各アレイ及び各変数を含む。
各構成要素と該当構成要素内で提供される機能は、より少ない数の構成要素に結合されたり、追加の構成要素にさらに分離されたりする。
以下、本発明に係るオンライン辞書サービス提供方法について説明する。
図5は、本発明の一実施例に係るオンライン辞書サービス提供方法を示したフローチャートである。
まず、ユーザ端末の設定状態からユーザの母国語情報を確認する(S510)。例えば、ユーザ端末のオペレーティングシステムの設定言語又はアプリケーションプログラムの設定言語からユーザの母国語を確認することができる。
次に、ユーザ端末にローディングされたウェブページのエンコーディング言語情報を確認する(S520)。ウェブページのエンコーディング言語は、ウェブページヘッダ部分の「charset」の設定値から確認することができる。
次に、ウェブページからポインティング装置の指示子を通して識別された単語を抽出し、検索語情報を生成する(S530)。
以下、検索語情報を生成する方法を詳細に説明する。
まず、ポインティング装置の指示子が前記ウェブページの単語上に基準値以上の時間の間位置する場合、該当単語を認識する。次に、認識された単語に含まれた特殊文字をトリミングする段階を行う。次に、辞書サーバに登録された各単語に対して付与された固有の各インデックスから前記認識された単語又は前記トリミングされた単語に対するインデックスを検索する段階を行う。
次に、ユーザ母国語情報、ウェブページのエンコーディング言語情報及び検索語情報を含むクエリを生成し(S540)、これを辞書サーバ300に伝送する。ユーザ端末にインストール(設置)されたクライアント200でクエリを生成し、ユーザ端末と辞書サーバ300との間を接続させるネットワーク手段を介してクエリが伝送される。
辞書サーバ300は、受信したクエリを分析し、ユーザ母国語情報、ウェブページのエンコーディング言語情報及び検索語情報を抽出する(S550)。抽出されたユーザ母国語情報及びウェブページのエンコーディング言語情報は、辞書選択部320に伝達され、検索語情報は検索部330に伝達される。
次に、ユーザ母国語情報及びウェブページのエンコーディング言語情報に基づいて適切な辞書データを選択する(S560)。このとき、ウェブページのエンコーディング言語情報が辞書データの原本言語として使用され、ユーザ母国語情報が辞書データの対象言語として使用される。すなわち、ウェブページのエンコーディング言語をユーザ母国語に解釈する辞書データが選択される。
次に、選択された辞書データから検索語情報に該当する解釈データを検索する(S570)。実施例によって、検索語情報に含まれた単語のインデックス情報を利用し、それに該当する解釈データを検索する。
次に、検索された解釈データを含む検索結果がクライアント200に伝送され、伝送された解釈データがクライアント200を介してユーザ端末に表示される(S580)。望ましくは、解釈データは、ポインティング装置が指示する検索対象単語と隣接した位置にツールチップ形態で表示する。
本発明の一実施例は、コンピュータによって実行されるプログラムモジュールのようなコンピュータによって実行可能な命令語を含む記録媒体の形態でも具現される。コンピュータ読取可能な媒体は、コンピュータによってアクセスされる任意の媒体(可用媒体)であって、揮発性及び非揮発性媒体、分離型及び非分離型媒体を全て含む。また、コンピュータ読取可能な媒体は、コンピュータ格納媒体及び通信媒体を全て含むことができる。コンピュータ格納媒体は、コンピュータ読取可能な命令語、データ構造、プログラムモジュール又はその他データのような情報の格納のための任意の方法又は技術で具現された揮発性及び非揮発性、分離型及び非分離型媒体を全て含む。通信媒体は、典型的にコンピュータ読取可能な命令語、データ構造、プログラムモジュール、搬送波のような変調されたデータ信号のその他データ、又はその他伝送メカニズムを含み、任意の情報伝達媒体を含む。
本発明の方法及びシステムを特定の実施例と関連して説明したが、これらの構成要素、動作の一部又は全部は、汎用ハードウェアアーキテクチャを有するコンピュータシステムを使用して具現される。
上述した本発明の説明は、例示のためのものであり、本発明の属する技術分野における通常の知識を有する者であれば、本発明の技術的思想や必須の特徴を変更しない範囲で他の具体的な形態に容易に変形可能であることを理解することができる。したがって、上述した各実施例は、全ての面で例示的なものであり、限定的なものでないことを理解しなければならない。例えば、単一型として説明されている各構成要素は、分散されて実施されることも可能であり、これと同様に、分散されたものとして説明されている各構成要素も結合形態で実施されることが可能である。
本発明の範囲は、上述した詳細な説明よりも後述する特許請求の範囲によって定められる。特許請求の範囲の意味及び範囲、そして、その均等概念から導出される全ての変更又は変形された形態は、本発明の範囲に含まれるものと解釈されなければならない。
100:オンライン辞書サービス提供装置、200:クライアント、210:ユーザ母国語確認部、220:ウェブページ言語確認部、230:検索語生成部、240:クエリ生成部、250:検索結果表示部、260:環境設定部、300:辞書サーバ、310:クエリ分析部、320:辞書選択部、330:検索部、340:検索結果伝送部、350:辞書データ格納部

Claims (15)

  1. 原本言語の単語を単語のインデックスとマッチングさせて格納する辞書データを含む辞書データ格納部を有するオンライン辞書サービス提供装置であって、
    前記単語のインデックスを有するユーザ端末から、ユーザ母国語情報、ローディングされたウェブページのエンコーディング言語情報及び前記ウェブページと前記インデックスとの両方に含まれた検索語情報を含むクエリを、受信し、前記ユーザ母国語情報、ウェブページのエンコーディング言語情報及び検索語情報を抽出するクエリ分析部と、
    原本言語の各単語に対する対象言語による各解釈データを含む少なくとも一つの辞書データを含む辞書データ格納部と、
    前記ユーザ母国語情報及びウェブページエンコーディング言語情報に基づいて前記辞書データを選択する辞書選択部と、
    前記選択された辞書データから前記検索語情報に対応する前記解釈データを検索する検索部と、
    前記解釈データを前記ユーザ端末に伝送する検索結果伝送部と、を含むオンライン辞書サービス提供装置。
  2. 前記ユーザ母国語情報は、前記ユーザ端末にインストールされたオペレーティングシステム又はアプリケーションプログラムに基づいて確認されることを特徴とする、請求項1に記載のオンライン辞書サービス提供装置。
  3. 前記ウェブページのエンコーディング言語情報は、前記ウェブページのプログラミング文書のヘッダに含まれたキャラクタセット(charset)に基づいて確認されることを特徴とする、請求項1に記載のオンライン辞書サービス提供装置。
  4. 前記検索語情報は、前記辞書データに登録された各単語に対して付与された固有の単語のインデックス情報を含むことを特徴とする、請求項1に記載のオンライン辞書サービス提供装置。
  5. 前記辞書データ格納部は、n個の言語のうち何れか一つの言語を前記原本言語にし、m個の言語のうち何れか一つの言語を前記対象言語にする計n*m個の辞書データを含むことを特徴とする、請求項1に記載のオンライン辞書サービス提供装置。
  6. 前記辞書選択部は、前記原本言語が前記ウェブページのエンコーディング言語情報に該当し、前記対象言語が前記ユーザ母国語情報に該当する辞書データを選択することを特徴とする、請求項1に記載のオンライン辞書サービス提供装置。
  7. 前記クエリは、前記ユーザ端末にインストールされたクライアントが生成し、
    前記クライアントは、
    前記ユーザ端末にインストールされたオペレーティングシステム又はアプリケーションプログラムに基づいて前記ユーザ母国語情報を確認するユーザ母国語確認部と、
    前記ユーザ端末にローディングされたウェブページのエンコーディング言語情報を確認するウェブページ言語確認部と、
    前記ウェブページ上でポインティング装置を介してポインティングされた単語を抽出し、検索語情報を生成する検索語生成部と、
    前記クエリを生成するクエリ生成部と、
    前記解釈データを受信して前記ユーザ端末に表示する検索結果表示部と、を含むことを特徴とする、請求項1に記載のオンライン辞書サービス提供装置。
  8. 原本言語の単語を単語のインデックスとマッチングさせて格納する辞書データを含む辞書データ格納部を有するオンライン辞書サービス提供装置によるオンライン辞書サービス提供方法であり、
    前記オンライン辞書サービス提供装置は、クエリ分析部と、辞書選択部と、検索部と、検索結果伝送部とを有し、
    前記クエリ分析部は、前記単語のインデックスを有するユーザ端末から、ユーザ母国語情報、ローディングされたウェブページのエンコーディング言語情報及び前記ウェブページと前記インデックスとの両方に含まれた検索語情報を含むクエリを、受信し、
    前記クエリから、前記ユーザ母国語情報、ウェブページのエンコーディング言語情報及び検索語情報を、抽出し、
    前記辞書選択部は、原本言語の各単語に対する対象言語による各解釈データを含む少なくとも一つの辞書データから、前記ユーザ母国語情報及びウェブページエンコーディング言語情報に基づいて辞書データを、選択し、
    前記検索部は、前記選択された辞書データから、前記検索語情報に対応する前記解釈データを、検索し、
    前記検索結果伝送部は、前記解釈データを前記ユーザ端末に伝送することを含むオンライン辞書サービス提供方法。
  9. 前記ユーザ母国語情報は、前記ユーザ端末にインストールされたオペレーティイングシステム又はアプリケーションプログラムに基づいて確認されることを特徴とする、請求項に記載のオンライン辞書サービス提供方法。
  10. 前記ウェブページのエンコーディング言語情報は、前記ウェブページのプログラミング文書のヘッダに含まれたキャラクタセット(charset)に基づいて確認されることを特徴とする、請求項に記載のオンライン辞書サービス提供方法。
  11. 原本言語の単語を単語のインデックスとマッチングさせて格納する辞書データを含む辞書データ格納部を有するオンライン辞書サービス提供装置に接続され、前記単語のインデックスを有するユーザ端末を含むシステムによるオンライン辞書サービス提供方法であり、
    前記ユーザ端末は、ユーザの母国語情報を確認し、
    前記ユーザ端末は、前記ユーザ端末にローディングされたウェブページのエンコーディング言語情報を確認し、
    前記ユーザ端末は、前記ウェブページ上でポインティング装置を介してポインティングされた単語を抽出して検索語情報を生成し、
    前記ユーザ端末は、前記ユーザ母国語情報、前記ウェブページのエンコーディング言語情報及び前記インデックスの両方に含まれる前記単語の前記検索語情報を含むクエリを生成し、
    前記ユーザ端末は、前記クエリに基づいた辞書サーバの検索結果を受信して前記ユーザ端末に表示することを含むオンライン辞書サービス提供方法。
  12. 前記ユーザの母国語情報の確認として、
    前記ユーザ端末にインストールされたオペレーティングシステム又はアプリケーションプログラムに基づいて前記ユーザ母国語情報を確認することを特徴とする、請求項11に記載のオンライン辞書サービス提供方法。
  13. 前記ウェブページのエンコーディング言語情報を確認するのは、
    前記ウェブページのプログラミング文書のヘッダに含まれたキャラクタセット(charset)に基づいて前記ウェブページのエンコーディング言語情報を確認することを特徴とする、請求項11に記載のオンライン辞書サービス提供方法。
  14. 前記検索語情報を生成するのは、
    前記ポインティング装置の指示子が前記ウェブページの単語の上に基準値以上の時間の間位置する場合、該当単語を認識し、
    前記認識された単語から特殊文字を含むノイズ文字をトリミングし、
    前記辞書サーバに登録された各単語に対して付与された固有の各インデックスから前記認識された単語又は前記トリミングされた単語に対するインデックスを検索し、
    前記検索された単語のインデックスを前記検索語情報として設定することを含むことを特徴とする、請求項11に記載のオンライン辞書サービス提供方法。
  15. 請求項から請求項14のうち何れか一つの項に記載された方法を行うプログラムが記録されたコンピュータ読取可能な記録媒体。
JP2010116530A 2009-05-21 2010-05-20 オンライン辞書サービス提供装置及びオンライン辞書サービス提供方法 Active JP5416033B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020090044356A KR101072254B1 (ko) 2009-05-21 2009-05-21 온라인 사전 서비스 제공 장치 및 방법
KR10-2009-0044356 2009-05-21

Publications (2)

Publication Number Publication Date
JP2010272114A JP2010272114A (ja) 2010-12-02
JP5416033B2 true JP5416033B2 (ja) 2014-02-12

Family

ID=43420041

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010116530A Active JP5416033B2 (ja) 2009-05-21 2010-05-20 オンライン辞書サービス提供装置及びオンライン辞書サービス提供方法

Country Status (2)

Country Link
JP (1) JP5416033B2 (ja)
KR (1) KR101072254B1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101328092B1 (ko) * 2011-11-17 2013-11-13 서울신용평가정보 주식회사 도메인 주소 자동완성 처리 방법
KR101647098B1 (ko) * 2014-12-12 2016-08-10 네이버 주식회사 단어장에 단어를 추가하는 방법과 시스템 및 기록 매체

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03110673A (ja) * 1989-09-25 1991-05-10 Canon Inc 電子辞書
JPH05324709A (ja) * 1992-05-19 1993-12-07 Ricoh Co Ltd 対訳画像形成装置
JP3281639B2 (ja) * 1992-05-26 2002-05-13 三洋電機株式会社 文書検索システム
JPH1056491A (ja) * 1996-08-09 1998-02-24 Toshiba Corp 機械翻訳システム及び機械翻訳方法
JP4547474B2 (ja) * 1998-12-31 2010-09-22 俊彦 岡部 Www検索装置
AUPR360701A0 (en) * 2001-03-06 2001-04-05 Worldlingo, Inc Seamless translation system

Also Published As

Publication number Publication date
KR20100125579A (ko) 2010-12-01
JP2010272114A (ja) 2010-12-02
KR101072254B1 (ko) 2011-10-12

Similar Documents

Publication Publication Date Title
US8745051B2 (en) Resource locator suggestions from input character sequence
EP1450267B1 (en) Methods and systems for language translation
CN101395608B (zh) 在搜索结果的站点内搜索
EP2472428B1 (en) Response determining device, response determining method, response determining program, recording medium and response determining system
US20070106653A1 (en) Search engine
JP2003529845A (ja) ネットワーク経由の多言語翻訳を提供する方法と装置
JP2006501582A (ja) 電子文書のテキスト情報に関するポインタにより瞬時に起動される2ヶ国語注釈
WO2005122005A1 (ja) Webページ翻訳装置及びwebページ翻訳方法
JP2004252944A (ja) プログラム、文字入力編集方法、装置及び記録媒体
KR102079289B1 (ko) 와인 추천 시스템 및 방법
CN112955882A (zh) 信息提供系统、信息提供方法、以及知识数据的数据结构
US20150199337A1 (en) Smart device capable of easily converting into multinational languages
Ghose et al. Architecture of a web browser for visually handicapped people
JP5416033B2 (ja) オンライン辞書サービス提供装置及びオンライン辞書サービス提供方法
JP5693046B2 (ja) オンライン辞書サービス提供システム、オンライン辞書サービス提供装置及びその方法並びにその方法を実行するプログラムが記録されたコンピュータ読取可能な記録媒体
KR101537555B1 (ko) 인스턴트 메신저 상의 메시지 바로 검색 지원 방법
JPH10187752A (ja) 言語間情報検索支援システム
KR20090083747A (ko) 웹 문서 요약 제공을 위한 사용자 단말 장치 및 웹 문서제공 방법
WO2009002091A2 (en) Internet search service method and system thereof
WO2001095151A1 (fr) Dispositif de transfert de donnees
JP4773761B2 (ja) 情報検索サーバー、情報検索方法、情報検索プログラム
Cisco Preface
CN107943799B (zh) 获得注解的方法、终端及系统
KR100836023B1 (ko) 키워드 검출을 통한 웹페이지 제공 방법 및 이를 위한이동통신 단말기
KR20090095939A (ko) 검색결과 출력 방법 및 시스템과 이를 위한 기록매체

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121121

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130514

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130813

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130917

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131022

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131114

R150 Certificate of patent or registration of utility model

Ref document number: 5416033

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250