JP2003536139A - 非ラテン文字urlをレゾルブする方法 - Google Patents

非ラテン文字urlをレゾルブする方法

Info

Publication number
JP2003536139A
JP2003536139A JP2002502628A JP2002502628A JP2003536139A JP 2003536139 A JP2003536139 A JP 2003536139A JP 2002502628 A JP2002502628 A JP 2002502628A JP 2002502628 A JP2002502628 A JP 2002502628A JP 2003536139 A JP2003536139 A JP 2003536139A
Authority
JP
Japan
Prior art keywords
url
character
domain
user
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002502628A
Other languages
English (en)
Inventor
チア、イェオー・ケン・ロデリック
オング、チン・キアット
リー、チー・メン
Original Assignee
スパイラル・コミュニケーションズ・ピーティーイー・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by スパイラル・コミュニケーションズ・ピーティーイー・リミテッド filed Critical スパイラル・コミュニケーションズ・ピーティーイー・リミテッド
Publication of JP2003536139A publication Critical patent/JP2003536139A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/221Parsing markup language streams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)

Abstract

(57)【要約】 インターネットブラウザを使用してユーザによって入力されたドメインネームを有する非ラテン文字URLをレゾルブする方法は、非ラテン文字URLレゾルブをサポートするウエブサイトとコンタクトし、ウエブサイトから非ラテン文字URL入力プログラムをダウンロードし、プログラムを使用してそのURLを入力してウエブサイトにURLを送信し、URLの文字セットを使用して選択され文字セット中のドメインネームをサポートする1以上のネームサーバを決定し、ウエブサイトからドメインネームヲ有する1以上のネームサーバを問合わせてその問合わせが満足された場合にはURLから内容を取出してuuに内容を転送する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】
本発明は、非ラテン文字URLをレゾルブする方法に関する。
【0002】
【従来の技術】
各インターネットウエブサイトは、ユーザがそのサイトにアクセスするために
ユーザのウエブブラウザを使用して入力した特有のウエブサイトURL(ユニホ
ームリソース位置)アドレスを有する。URLは2つの部分、すなわち、ホスト
アドレスまたはIP(インターネットプロトコル)アドレスを特定するドメイン
ネームとリソースへの経路とを有する。これらはワードの形態でユーザにより入
力され、それから数字のアドレスへ変換される。通常URLはラテンのアルファ
ベット文字と数字からなる標準的な文字セットから構成され、各国の“ブランチ
”国際登録と共にICANNによって与えられる“ルート”登録設備を使用して
レゾルブされる。
【0003】 このようなURLアドレスによる問題は、それらがもっぱらラテン文字を使用
し、したがって、中国文字またはタイ語のような非ラテン文字を使用するような
他の言語表示を使用する非ラテン文字URLアドレスを使用することができない
ことである。それはこれらはレゾルブできないからである。以後i18n(国際
化のため短縮)アドレスと呼ばれる非ラテン文字URLアドレスを表す提案が為
され、2つの構成が現在iDNS(国際化されたドメインネームシステム)およ
びCNNIC(中国インターネットネットワーク情報センター)によりi18n
ドメインの構成に対して提案された。各構成は異なったネームサーバを有してい
る。標準的な構成が同意されておらず、異なった構成を使用するi18nURL
ドメインのアクセスを困難にしている問題があり、異なった構成を使用するi1
8nURLドメインはユニークではなく、混乱に導き、特に、非ラテン文字ドメ
インネームに対する構成およびレジスタの数が非ラテン文字セットを使用する国
々で予期される要求にしたがって増大する場合にはそれが著しくなる。
【0004】 非ラテン文字を入力することもまたユーザにとって問題である。世界中の大抵
のコンピュータはラテン文字セットに対してしか入力能力を有していないオペレ
ーティングシステムを使用する。そのようなコンピュータのユーザに対してi1
8nドメインの非ラテン文字URLでタイプ入力する設備はなく、これらのUR
Lにアクセスすることはできない。幾つかのオペレーティングシステムは1つ(
または少数の)非ラテン文字文字セット(例えば中国のウインドウズ95、日本
のウインドウズ98)に対する入力能力を有している。オペレーティングシステ
ムに統合されて非ラテン文字の入力を可能にする言語入力プログラム(例えば中
国語入力のためのハンスビジョン)もまた存在している。このようなシステムの
問題は、ユーザがi18nドメインのURLをタイプすることができず、異なっ
た文字セットのi18nサイト(例えばタミルURLサイトへ行こうとする中国
語オペレーティングシステム)のURLにアクセスすることができないことであ
る。
【0005】
【発明が解決しようとする課題】
本発明の目的は、従来技術の問題点の少なくとも1つを解決し、またはユーザ
に有用な選択を与えるURLアドレス検索方法を提供することである。
【0006】
【課題を解決するための手段】
本発明によれば、第1の特徴において、ユーザによって入力されたドメインネ
ームを有する非ラテン文字URLをレゾルブする方法が提供され、その方法は、
URLが書かれている文字セットを選択し、その文字セットからの文字中のUR
Lを入力し、入力URLの文字セットを使用して選択され文字セット中のドメイ
ンネームをサポートする1以上のネームサーバを決定し、ドメインネームを前記
1以上のネームサーバを問合せ、その問合せが満足された場合にはURLから内
容を取出すステップを含んでいる。
【0007】 本発明によれば、第2の特徴において、インターネットブラウザを使用してユ
ーザによって入力されたドメインネームを有する非ラテン文字URLをレゾルブ
する方法が提供され、その方法は、非ラテン文字URL解析をサポートするウエ
ブサイトとコンタクトし、ウエブサイトから非ラテン文字URL入力プログラム
をダウンロードし、そのプログラムを使用してURLを入力してそのウエブサイ
トにそのURLを送信し、URLの文字セットを使用して選択され文字セット中
のドメインネームをサポートする1以上のネームサーバを決定し、ウエブサイト
からドメインネームにより前記1以上のネームサーバを質問し、質問が満足され
た場合にはURLから内容を取出してユーザに内容を転送するステップを含んで
いる。
【0008】 上述した本発明の特徴とする方法を行う装置もまた、本発明の一部を形成する
ものとして開発された。本発明のさらに別の特徴は特許請求の範囲の請求項中に
記載されている。
【0009】 記載された本発明の方法において、ユーザは非ラテン文字URL(ユニホーム
リソース位置)を入力し、付加的なソフトウエアをインストールすることなく、
またクライアント側のセッティングを変更することなく非ラテン文字コンテンツ
を検索し、観察することを可能にするためのJavaScriptおよび、またはJavaサポ
ートを有するインターネットブラウザをユーザが使用することを可能にする。こ
の実施形態はi18n(国際化された)ドメインの異なった方法(ソリューショ
ン)が適応されることを可能にする。非ラテン文字編集装置は非ラテン文字UR
Lを入力して非ラテン文字ウエブページに変換し、付加的なソフトウエアなしで
観察するためにダイナミックにグラフ化するために設けられている。ユーザは言
語のコード化により入力方法を選択する。各入力方法により、文字の選択のリス
トは、ユーザがユーザタイプ入力としてその文字を選択することを可能にするた
めにウエブサーバから取出されたグラフィックにより表示される。各文字は特有
のユニコード(ユニバーサル文字セットISO/IEC10646 構成)表示を有し
、これはユニコードのトラックを維持してそのファイルネームとしてユニコード
を有するクラフィックを使用して文字を表示することを可能にする。
【0010】 ユニコードは本発明が使用することのできる可能な文字コード化の1例に過ぎ
ない。好ましい構成では、文字グラフィックウエブサーバは異なった言語および
文字コードの多重文字グラフィックセットを含んでいてもよく、それらはそれぞ
れ異なったホルダー中にあり、文字コードをURLネームにマップするネーミン
グ標準を有している。URLの取出されたコンテンツはダイナミックにグラフィ
ック表示に変換され、それはユーザが付加的なソフトウエアなしで非ラテン文字
コンテンツを観察することを可能にする。
【0011】 上記の方法は、i18nドメインの任意の構成を含むことができるi18nド
メインURLをレゾルブすることができる。(現在2つの構成が知られており、
それらはiDNSおよびCNNICにより与えられている。)ドメインネーム問
合わせはネームサーバに送られ、それはi18nドメインの特定の構成をサポー
トする。クライアント側では、ユーザがi18n構成の1つを選択することを可
能にする機能が設けられることが好ましい。i18n方法のデフォルトオーダリ
ングはレゾルブのために行われることが好ましく、それ故、IPアドレスが戻る
第1のi18nドメイン方法のドメインホストのIPアドレスが成功的に使用さ
れる。コンテンツが取出された後、これらはフィルタ処理され、それによりコン
テンツ中のURLがi18nドメインを含んでいる場合には、このURLはJava
Scriptコードにより置換されてi18nドメインをレゾルブすることができる。
【0012】 本発明のその他の特徴および利点は、本発明の原理を例示として示している添
付図面を参照にした以下の詳細な実施形態の説明により明らかになるであろう。
しかしながら、本発明の技術的範囲はこの好ましい実施形態によって限定される
ものではない。
【0013】
【発明の実施の形態】
以下、添付図面を参照にして、例示として本発明の1実施形態について説明す
る。本願明の方法の原理を示すために、図1は使用される種々のコンポーネント
の高度に概略化して示している。ユーザによってオープンされたインターネット
ブラウザ110 が設けられ、それはインターネット100 に接続されている。ユーザ
はウエブサーバ140 に接続され、このウエブサーバ140 はダウンロード可能なプ
ログラム、すなわち非ラテン文字編集者ツールバー120 と、本発明の方法をサポ
ートするJavaScriptおよびJavaアプレット(applet)125 を含んでいる。ネームレ
ゾルバプログラム145 もまたサーバ140 に配置され、これはサーバサイドでドメ
インネームをレゾルブするために必要とされる。3つの異なったタイプのサーバ
がインターネットに接続されてもよい。すなわち、正常のネームサーバ10(例え
ばBind)、IDNSにより与えられるi18nドメインソリューションを使用す
るネームサーバ11、およびCNNICにより与えられたドメインソリューション
を使用するネームサーバ12である。
【0014】 本発明の方法の概観について最初に説明する。ユーザはインターネットブラウ
ザ110 をオープンし、ウエブサーバサイト140 へブラウズする。ブラウザ110 は
関係するJavaScriptおよびJavaアプレット125 によって非ラテン文字編集者ツー
ルバーウエブページ120 を検索する。非ラテン文字編集者ツールバー120 は国際
文字の本質的なレゾリューションに対してはユニコードで動作するが、ユーザが
任意の他のコード化方式を使用して、あるいは使用されるコード化方式を選択す
ることを可能でしている。ユーザはアドレスを形成する文字に対する入力方法を
選択し、任意の非ラテン文字ドメインURLがその後クライアントブラウザ110
中のJavaScriptプログラム125 を動作させることにより入力され、そのクライア
ントブラウザ110 は文字エントリをツールバーに表示させる。JavaScriptプログ
ラムはユーザが入力したアドレスを捕捉し、ユーザが選択した入力方法に基づい
てユーザが選択したユニコード文字を決定する。JavaScriptはその後ウエブサー
バ140 からグラフィックファイル(ユニコードと等価なファイルネームを有する
)を取出すことによりユニコード文字を表示し、ユーザがそのコンピュータに非
ラテン文字ソフトウエアをインストールする必要なしにユニコード文字をそのグ
ラフィック表示にダイナミックに変換することを可能にする。
【0015】 ユーザはその後今入力した非ラテン文字ドメインURLにブラウズするために
<入力>キーを押す。本発明のソフトウエアがURLを入力するために使用され
ることが重要である。例えば、もしもユーザが代わりにこのURLを他のソフト
ウエアを使用してブラウザ110 のアドレスバー中に入力し、<入力>を押すなら
ば、ブラウザ110 はオペレーティングシステム(通常)またはブラウザ中に構成
されたデフォルトネームサーバを使用して直接URLを捕捉するように動作を進
める。もしもそのネームサーバがi18nアドレスをレゾルブすることができな
い場合には、ホストネーム検索の故障が生じる。デフォルトネームサーバがi1
8nをできたとしても、ドメインネーム標準(例えばiDNSまたはCNNIC
のいずれか、両方ではない)の中の1つだけにしか応答せず、ホストネーム検索
の故障が生じる可能性がある(もしも、ユーザがiDNS標準方式中のi18n
ドメインを希望するが、デフォルトネームサーバの設定は例えばCNNICに設
定されている場合)。
【0016】 次のステップは非ラテン文字ドメインをIPアドレスにレゾルブすることであ
る。コンピュータ上のネームサーバ設定は通常はこの現在の時点で正規のネーム
サーバ11に指向している。ドメインネーム問合わせがこのようなネームサーバ11
に送られる場合には、このネームサーバ11は有効な標準ネームサーバ(それはラ
テン文字アルファベット、数字、ファイフンからなるもののみ許容される)では
ない。本発明の方法ではドメインネーム問合わせはJavaアプレット125 またはネ
ームレゾルバ145 のいずれかにより行われ、それはユニコード表示からURLが
ラテン文字形態か否かが決定される。ネームレゾルバはよく知られたIPサーバ
のリストを維持し、それはi18nドメイン構成のそれぞれのタイプに対してド
メインネームサービスを提供する。したがって、ドメインネーム問合わせは非ラ
テン文字ドメインネームをどのようにレゾルブするかを知っている正しいネーム
サーバへ送られる。例えば、非ラテン文字ドメインネーム問合わせはiDNSネ
ームサーバ11またはCNNICネームサーバ12のいずれかまたはの両者に送られ
ることができる。
【0017】 サーバ11, 12は相互に排他的ではないから同じ非ラテン文字ドメインが異なっ
たパーティにより登録され、結果的に衝突してもよい。これはi18nドメイン
ソリューションプロバイダをユーザが選択することを許容することによって本発
明の方法によって解決される。
【0018】 クライアントサイドドメインネーム問合わせはJavaアプレット125 を使用して
解析を実行し、一方、サーバサイドのドメインネーム問合わせはネームレゾルバ
を使用して解析を実行する。両方の解析はサーバサイドの解析のほうがフレキシ
ブルでありより良好な特徴を有することを除いて基本的に類似している。例えば
、ネームレゾルバ145 におけるネームサーバリスト情報を更新することはより容
易であり、進歩したキャッシュをサポートできる。クライアントサイドの解析に
ついては、Javaアプレット125 が容易にレゾルブされるIPアドレスに基づいた
URLのコンテンツを捕捉動作を進める。
【0019】 コンテンツが捕捉された後、Javaアプレットはそのコンテンツを濾波してその
結果コンテンツ内のURLがi18nドメインを含んでいれば、このURLはJa
vaScriptコードで置換され、それはJavaアプレット125 にリクエストを送り、ユ
ーザがそこをクリックしたときi18nドメインURLをレゾルブする。Javaア
プレット125 はそれからブラウザ110 中の他のフレーム中のコンテンツを表示す
る。サーバサイドの解析に対して、コンテンツが捕捉され、ウエブブラウザ140
がそのコンテンツをクライアントブラウザ110 に戻す前に濾波される。したがっ
て、本発明の方法は、ネームサーバソリューションが標準的なネームサーバソリ
ューションをサポートするかぎり、異なったi18nドメイン構成からの任意の
i18nドメインネームをレゾルブすることができる。すなわち、ネームサーバ
の概念および設計はRFC1034およびRFC1035で記載されたものにしたがう。
特に、DNS問合わせおよび応答はRFC1034およびRFC1035で記載されてい
るような標準メッセージフォーマットで行われなければならず、それ故、同じレ
ゾルバはi18nドメイン構成と無関係に各ネームサーバに問合わせるために使
用されることができる。
【0020】 図2は、完全な方法のフローチャートを示している。第1のステップで、ユー
ザは非ラテン文字URLを入力するために非ラテン文字編集装置を使用する(ブ
ロック20参照)。次に、ブロック21に示されているように、URLのドメイン部
分がレゾルブされてIPアドレスが得られる。URLのコンテンツはIPアドレ
スに基づいて取出され、そのコンテンツはフィルタ処理されてJavaScriptコード
を有するi18nドメインを含むURLを置換する(ブロック22参照)。コンテ
ンツは、ブラウザが非ラテン文字サポートを有しない場合であってもユーザのブ
ラウザ上に表示される(ブロック23参照)。
【0021】 ユーザにより開始されるブロック20により示されるプロセスは図3にさらに詳
細に示されている。ブロック201 において、サーバ140 のウエブページからダウ
ンロードされた非ラテン文字URL編集者ツールバーはブラウザフレームに表示
される。ユーザはインターネットブックマークを使用することによりこのウエブ
ページに都合よく接続されることができ、あるいはユーザはブラウザのインター
ネットアドレスバー中に直接URLを入力することができる。現在のインターネ
ットエクスプローラブラウザはブラウザの左側または底側に位置されることので
きるもののようなカスタムツールバーをサポートし、それはアクセスを容易にす
るためにリンクツールバーから呼出されることができる。非ラテン文字編集者は
ユーザのコンピュータにおける任意のクライアントサイドインストーレーション
または構成設定を必要とせず、任意の種類の言語および入力方法をサポートする
ように拡張されることができ、この全てはユーザがそれに気付かずにサーバ中で
更新されることができる。ユーザのコンピュータは何等言語フォントをインスト
ールする必要はなく、ブラウザは非ラテン文字言語をサポートする必要はない。
各非ラテン文字の文字はウエブサーバ中に記憶されているグラフィックファイル
を使用して表示される。言語コード化を使用し、文字のユニコード表示を知るこ
とにより、表示されているグラフィックファイルはユニコードを使用して名前を
付けられ、したがって、任意の非ラテン文字ウエブページが表示されることが可
能になる。
【0022】 ブロック202 において、ユーザは言語および入力方法を選択する。そのように
することにより、ウエブページ中のJavaScriptコードは選択された入力方法に対
応する適切な辞書をダウンロードし、それによりユーザが文字コードに対してキ
ー操作するようにマップすることが可能になる。JavaScriptは、インターネット
エクスプローラおよびネットスケープブラウザを含むポピュラーなブラウザの大
部分のものによりサポートされるために使用される。ブロック203 において、動
作しているJavaScriptコードはユーザにより入力されたキーを捕捉し、辞書が文
字の可能な選択に対応しているかチェックされる。単一の選択だけであれば、文
字コードが決定され、そうでなければブロック204 で示されるように選択リスト
がユーザに対して選択のため表示される。全ての文字はウエブサーバからそれら
の表示グラフィックファイルを取出すことによって表示される。ブロック205 で
ユーザは表示された選択リストからグラフィック文字を選択し、したがって文字
コードが決定される。ブロック206 で、JavaScriptコードは内部URLストリン
グに対してユニコード文字コードを添付し、URL編集装置でグラフィック文字
を表示する。このプロセスはその後反復され、ユーザが<入力>キーを押して彼
が終了してURLにより示されたウエブページをブラウズすることを望んでいる
ことを信号する前にユーザが全URLをキーする。ブロック207 はこの反復プロ
セスを示している。ユーザは別の言語および入力方法に切換えることが可能であ
り、したがって、ブロック202 で多数の文字セット中のURLを入力し、各文字
はユニコード等価物を有する。ただし、既存の言語および方法はブロック202 で
ユーザにより変化されなければデフォルトとして残る。ユーザが別の言語および
/または入力方法に切換えたとき、異なる辞書がJavaScriptコードにより自動的
にダウンロードされる。JavaScriptコードは、ユーザがブロック20のプロセスの
終わりにキーを押したユニコードストリングURLを記憶する。
【0023】 ブロック21で、URLのドメイン部分はレゾルブされてホストIPアドレスが
得られる。このプロセスは図4にさらに詳細に示されている。現在、i18nド
メインソリューションに対して少くとも2つの提案が存在する。その1つはID
NSによって提案され、他の1つはCNNICによって提案されている。非ラテ
ン文字ドメインネームに対しては巨大なビジネス値があるので、さらに多くのi
18nドメイン提案が現れることが予想される。このように、ドメインネームは
任意のi18nドメインソリューションに対して正確にレゾルブされることがで
きる。i18nドメインソリューションの提供は現在の標準的なドメインネーム
サーバに適合するので、本発明の方法はこれに適合することができ、もしもi1
8nドメインネームサーバが同じ種類の標準的なドメインネーム問合わせを受取
り、IPアドレスをその問合わせを送ったクライアントに戻すならば両立させる
ことができる。このようにIDNSおよびCNNICソリューションの両者はコ
ンパチブルである。本発明の方法は, 選択されたi18nドメインソリューショ
ンをサポートする正しいドメインネームサーバを問合わせ、または単にIDNS
またはCNNICにより与えられたi18nドメインソリューションをサポート
する全てのドメインネームサーバを問合わせるために必要である。
【0024】 どちらのi18nドメインソリューション(ドメインレジスタ)にドメインが
登録されているか区別することはできないから、ユーザは一般的に非ラテン文字
編集者ツールバー中のi18nドメインソリューションを選択する。i18nド
メインソリューションのデフォルトオーダリングもまた行われ、それ故、ソフト
ウエアがドメインネームを問合せるとき別のソリューションのネームサーバの前
に1つのドメインソリューションのネームサーバに対してこれが行われる。実際
には構成はスピードアップのために並列に異なったi18nドメインソリューシ
ョンのネームサーバを質問し、デフォルトオーダリングを有するIPアドレスを
戻す。異なるドメインソリューション中に登録されたドメインネームの衝突が存
在する場合には、ユーザはそのデフォルトが彼の希望したものではない場合には
他のホスト(IPアドレス)をトライするオプションを与えられる。図4では、
ドメインネーム問合せのプロセスが直列に行われるように示されているが、これ
もまた並列に行われることができる。
【0025】 ブロック211 で、プロセスはドメインが標準的なURL文字中にあるか否かが
検査され、イエスであれば通常のようにURLのコンテンツが検索される。ドメ
インがi18nドメインにあれば、この方法は進行してブロック212 に示される
i18nドメインソリューションの全リストを最初に検索することによりドメイ
ンをレゾルブする(IDNSまたはCNNIC)。ブロック213 で、ドメインソ
リューションが選択され、選択されたドメインネームソリューションをサポート
するドメインネームサーバのリストが検索される。現在そのようなサーバIPア
ドレスのリストは手作業で編集され、そのプロセスに対して構成され、使用され
ている。リスト中の各ドメインネームサーバを選択し(ブロック214 )、プロセ
スはブロック215 に示されるようにそれに対してドメインネーム問合せを送る。
ドメインネームサーバがIPアドレスを戻す場合には、プロセスは完了する(ブ
ロック216 )。実際には、前に説明したようにドメインネーム衝突を解決するた
めに、異なるi18nドメインソリューションからの2以上IPアドレスが戻さ
れる。ドメインネームサーバがエラーを戻した場合には、ブロック217 ではリス
ト中の別のネームサーバに対してドメインネーム問合せを反復して行う。ブロッ
ク218 でプロセスはソリューションをサポートするネームサーバの別のリストに
対して同じドメインネーム問合せを送ることによって別のドメインネームソリュ
ーションに対して反復される(実際にはこれは並列に行われる)。
【0026】 ドメインネームレゾルブプロセスはクライアントサイドまたはサーバサイドの
いずれかで行われる。クライアントサイドソリューションはJavaアプレットを使
用して行われる。サーバサイドソリューションはもっとフレキシブルでありより
良好な特徴を有している。例えば、ネームレゾルバ145 におけるネームサーバリ
スト情報を更新することがさらに容易であり、迅速なネームソリューションのた
めの進歩したキャッシュのサポートが可能である。もしも、クライアントサイド
ソリューションが使用されるならば、ブロック22に示されたURLのコンテンツ
の捕捉および濾波プロセスもまた同じJavaアプレット内で行われることができる
。その代わりに、サーバサイドのネームレゾルバ145 が使用される場合には、ク
ライアントサイドまたはサーバサイドのいずれかの捕捉および濾波を使用する選
択が存在する。クライアントサイドの捕捉および濾波はサーバをオフロードする
利点を有するが、クライアントサイドのコードをより複雑なものにする。サーバ
サイドの捕捉および濾波は良好なキャッシュで一時に全てのURLのコンテンツ
中の全i18nドメインをレゾルブする込みとを可能にする。
【0027】 ブロック22で、URLのコンテンツはIPアドレスに基づいて捕捉され、その
コンテンツは濾波されてURLを置換し、それはJavaScriptコードを有するi1
8nドメインを含み、そのJavaScriptコードは、ユーザがそれをクリックしたと
きi18nドメインURLをレゾルブするためにJavaアプレットにリクエストを
送る。もしもi18nドメインURLを含む元のURLがクリックされるならば
、ブラウザは標準的なネームサーバに対して失敗したデフォルトドメインネーム
を使用する。したがって、そのコンテンツはこの問題を解決するために濾波され
る。そのような全てのi18nドメインがIPアドレスを有するドメインを置換
することによりコンテンツを表示する前にレゾルブされる場合には、全ての場合
に正確に動作することは十分確実ではない。IPアドレスにおけるウエブサーバ
がホスト多重ドメインに対して選択するとき、URL中のもとのドメイン部分の
損失はURLコンテンツをウエブサーバが検索することを阻止する。この方法を
使用する解決方法はJavaScript機能によりURLを置換し、元のURLのパラメ
ータを呼出してそれに送る(もしもレゾルブされていればホストIPアドレスに
対する付加的なパラメータが送られる)。ユーザが置換されたURLをクリック
すれば、JavaScript機能が開始されてコンテンツを捕捉し、この機能性はユーザ
が非ラテン文字編集によりキー入力するURLのコンテンツを捕捉するのと類似
している。この捕捉および濾波プロセスは図5に詳細に示されている。
【0028】 ブロック221 において、URLのコンテンツが捕捉される。プロセスはレゾル
ブされたホストIPアドレスを使用してウエブサーバに接続し、それからもとの
URLのコンテンツを捕捉する。捕捉されたコンテンツはそれからブロック222
にパースされる。ブロック223 で、コンテンツ中の各URLが抽出される。ブロ
ック224 で、URLは検査されてi18nドメインネームが含まれているか否か
が観察される。含まれていれば、ブロック225 に示されているようにJavaScript
機能を呼出すことにより置換される。ブロック226 はコンテンツ中の各抽出され
たURLに対してプロセスが反復されることを示している。更新されたコンテン
ツはその後戻され、プロセスは完了する。次にコンテンツはブロック23に示され
るようにブラウザフレームに戻されて書込まれる。
【0029】 記載された本発明の実施形態は発明を限定するために記載したものではない。
例えば記載された実施形態ではユニコードの文字コード、スクリプト言語として
JavaScriptおよびプログラム言語としてJavaを使用しているが、ユニコードの代
わりに、またはそれとともに他の適当なコード方式の使用、PeriscriptまたはVb
scriptのような他のスクリプト言語、およびプログラム言語として変換された他
のバイトコードの使用も考えられる。
【0030】 例えば、文字グラフィックウエブサーバは異なった言語および文字コード化の
多数の文字グラフィックを含んでいてもよく、それらはそれぞれ異なったホルダ
で、URLネームに文字コードをマップするネーミング基準であり、例えばワー
ド六(中国文字の6)はGB2312コード中の0 ×C1F9であり、そのグラフィック
はホルダgb下でウエブサーバ中に記憶されることができ、したがってURL
http://[グラフィック ウエブ サーバ ドメイン]/gb2312/C1F9.gifを有して
いる。同じワード六はまたユニコードバージョン3.0ではコード 0×516Dであ
り、そのグラフィックはホルダユニコード3下で同じウエブサーバに記憶される
ことができ、URLhttp://[グラフィック ウエブ サーバ ドメイン]/ユニ
コード3/516D.gifを有する。ホルダのネーミングおよび各文字に対するファイル
名はロードされた辞書からの規定によるJavaScript/Javaコードにより決定され
る。GB2312コード化に対して構築された“Hanyupinyin 入力方法”は、中国語
のワード6に対して入力“liu4”に対するグラフィックをhttp://[グラフィック ウエブ サーバ ドメイン]/gb2312/C1F9.gifに指定し、一方、別のユニコー
ドに対して構築された““Hanyupinyin 入力方法”辞書は同じ中国語のワード6
に対する入力“liu4”に対してグラフィックをhttp://[グラフィック ウエブ サーバ ドメイン]/ユニコード3/516D.gifに指定する。
【0031】 実際の使用においては、好ましい形態では、全ての文字グラフィックファイル
はユニコードで配置され、全ての辞書は可能な限りユニコードにカスタム化され
(ユニコードは多数の言語の文字を含んでいるため)、それにより多数の異なっ
たグラフィックセットおよび辞書の保守を最小にする。
【0032】 非ラテン文字URLに対する参考文献には非ラテン文字ドメインネームおよび
ラテン文字または非ラテン文字パス部分を有するURLに対する参考文献が含ま
れている。
【0033】 [参考文献] UTF−5,ユニコードおよびISO10646 の変換フォーマット http/www.idns.org/technical/draft-jseng-utf5-00.txt iDNS,ユニコードサポートを有する実験的DNSシステム http/www.idns.org/technical/iuc14-paper.doc PVMockapetris,ドメインネーム−構成および明細, RFC1035,1987年11月 PVMockapetris,ドメインネーム概念および設備, RFC1034,1987年11月 Martin Duerst,ドメインネームの国際化 インターネットドラフト.1997年7月,1998年に延長 ユニコード標準,URL http/www.unicode.org
【図面の簡単な説明】
【図1】 本発明の1実施形態で使用する主要コンポーネントを示す概略図。
【図2】 本発明の方法の1実施形態を示すフロー図。
【図3】 図2のマルチ言語URLを得るためのステップを説明するフロー図。
【図4】 図2のi18nドメインをレゾルブするステップを説明するフロー図。
【図5】 図2のコンテンツの取出しおよび濾波ステップを説明するフロー図。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,MZ,SD,SL,SZ,TZ,UG ,ZW),EA(AM,AZ,BY,KG,KZ,MD, RU,TJ,TM),AE,AL,AM,AT,AU, AZ,BA,BB,BG,BR,BY,CA,CH,C N,CR,CU,CZ,DE,DK,DM,EE,ES ,FI,GB,GD,GE,GH,GM,HR,HU, ID,IL,IN,IS,JP,KE,KG,KP,K R,KZ,LC,LK,LR,LS,LT,LU,LV ,MA,MD,MG,MK,MN,MW,MX,MZ, NO,NZ,PL,PT,RO,RU,SD,SE,S G,SI,SK,SL,TJ,TM,TR,TT,TZ ,UA,UG,US,UZ,VN,YU,ZA,ZW (72)発明者 オング、チン・キアット シンガポール国、486356 シンガポール、 ナンバー02−07、イーストウッド・ロード 46 (72)発明者 リー、チー・メン シンガポール国、598976 シンガポール、 エン・コン・テラス 4ビー

Claims (22)

    【特許請求の範囲】
  1. 【請求項1】 ユーザによって入力されたドメインネームを有する非ラテン
    文字URLをレゾルブする方法において、 URLが書かれた文字セットを選択し、 その文字セットからの文字中のURLを入力し、 入力URLの文字セットを使用して選択され文字セット中のドメインネームを
    サポートする1以上のネームサーバを決定し、 ドメインネームを前記1以上のネームサーバを問合せ、 問合せが満足された場合にURLから内容を取出すステップを含んでいるレゾ
    ルブ方法。
  2. 【請求項2】 さらに、入力URLの各文字を対応する数字値に変換するス
    テップを含んでいる請求項1記載の方法。
  3. 【請求項3】 値はユニコード数字コードである請求項2記載の方法。
  4. 【請求項4】 URLを入力するステップは文字入力プログラムを使用する
    請求項1乃至3のいずれか1項記載の方法。
  5. 【請求項5】 プログラムは、決定、問合せ、および取出しステップが行わ
    れる遠隔位置からダウンロードされる請求項4記載の方法。
  6. 【請求項6】 遠隔位置にはウエブサイトが含まれている請求項5記載の方
    法。
  7. 【請求項7】 プログラムはユーザのインターネットブラウザ上にURLエ
    ントリツールバーを表示する請求項4乃至6のいずれか1項記載の方法。
  8. 【請求項8】 前記入力するステップは、ユーザにより選択された各文字の
    入力方法を使用する請求項1乃至7のいずれか1項記載の方法。
  9. 【請求項9】 各文字は遠隔位置におけるデータベースを調査することによ
    り識別される請求項1乃至8のいずれか1項記載の方法。
  10. 【請求項10】 前記データベースは各文字のグラフィック表示を含んでお
    り、識別された文字のグラフィック表示は表示するためにユーザに送られる請求
    項9記載の方法。
  11. 【請求項11】 識別された文字は、決定ステップで使用するURLの識別
    されたバージョンを形成するために共に記憶される請求項4乃至6のいずれか1
    項記載の方法。
  12. 【請求項12】 決定するステップにおいて、選択された言語中のドメイン
    ネームをサポートする1以上のサーバが決定される請求項1乃至11のいずれか
    1項記載の方法。
  13. 【請求項13】 各ネームサーバはドメインにより質問される請求項8記載
    の方法。
  14. 【請求項14】 ユーザにより選択された1以上のネームサーバだけが質問
    される請求項8記載の方法。
  15. 【請求項15】 ネームサーバはユーザによって選択された順序で質問され
    る請求項7乃至10のいずれか1項記載の方法。
  16. 【請求項16】 決定ステップにおいて、ネームサーバのリストが質問され
    る請求項7乃至11のいずれか1項記載の方法。
  17. 【請求項17】 リストはユーザによって保持されている請求項12記載の
    方法。
  18. 【請求項18】 リストは遠隔サーバによって保持されている請求項12記
    載の方法。
  19. 【請求項19】 さらに、URLの取出されたコンテンツをサーチし、発見
    されたURLをレゾルブする手段でそこで発見された非ラテン文字URLを置換
    するステップを含んでいる請求項1乃至18のいずれか1項記載の方法。
  20. 【請求項20】 前記手段は発見されたURLをJavaScript機能
    呼びによって置換し、発見されたURLのパラメータをその機能呼びに転送する
    請求項19記載の方法。
  21. 【請求項21】 インターネットブラウザを使用してユーザにより入力され
    たドメインネームを有する非ラテン文字URLをレゾルブする方法において、 非ラテン文字URLレゾルブをサポートするウエブサイトとコンタクトし、 ウエブサイトから非ラテン文字URL入力プログラムをダウンロードし、 プログラムを使用してURLを入力し、ウエブサイトにURLを送信し、 URLの文字セットを使用して選択され文字セット中のドメインネームをサポ
    ートする1以上のネームサーバを決定し、 ウエブサイトから前記1以上のネームサーバにドメインネームを有するか問合
    せ、 その問合せが満足された場合にはURLからコンテンツを取出してユーザにそ
    のコンテンツを転送するステップを含んでいるレゾルブ方法。
  22. 【請求項22】 請求項1乃至21のいずれか1項記載の方法を実行するた
    めの装置。
JP2002502628A 2000-06-07 2000-06-07 非ラテン文字urlをレゾルブする方法 Pending JP2003536139A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/SG2000/000082 WO2001095144A1 (en) 2000-06-07 2000-06-07 A method of resolving a non-latin character url

Publications (1)

Publication Number Publication Date
JP2003536139A true JP2003536139A (ja) 2003-12-02

Family

ID=20428824

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002502628A Pending JP2003536139A (ja) 2000-06-07 2000-06-07 非ラテン文字urlをレゾルブする方法

Country Status (4)

Country Link
JP (1) JP2003536139A (ja)
CN (1) CN1210665C (ja)
AU (1) AU2000251209A1 (ja)
WO (1) WO2001095144A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4657295B2 (ja) * 2004-06-04 2011-03-23 ネットピア ドットコム インコーポレイティッド 自国語インターネットアドレスシステム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100346324C (zh) * 2003-08-14 2007-10-31 华为技术有限公司 一种对用户请求的解析方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL123129A (en) * 1998-01-30 2010-12-30 Aviv Refuah Www addressing
CA2345970A1 (en) * 1998-09-29 2000-04-06 Eli Abir Method and system for alternate internet resource identifiers and addresses

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4657295B2 (ja) * 2004-06-04 2011-03-23 ネットピア ドットコム インコーポレイティッド 自国語インターネットアドレスシステム

Also Published As

Publication number Publication date
WO2001095144A1 (en) 2001-12-13
AU2000251209A1 (en) 2001-12-17
CN1210665C (zh) 2005-07-13
CN1454356A (zh) 2003-11-05

Similar Documents

Publication Publication Date Title
US7596609B1 (en) WWW addressing
US6314469B1 (en) Multi-language domain name service
US7058626B1 (en) Method and system for providing native language query service
USRE44898E1 (en) Search engine request method, product, and apparatus
KR20010103670A (ko) 쉐도우 콜백 기능을 갖는 메시지 에일리어싱 기능을이용한 네트워크상의 정보 엑세스 방법 및 시스템
JP4657295B2 (ja) 自国語インターネットアドレスシステム
WO1999035777A2 (en) System for processing and storing internet bookmark address links
US8396990B2 (en) Transcoding web resources
US20020087529A1 (en) System and method for a digital business card
JP2003536139A (ja) 非ラテン文字urlをレゾルブする方法
US7047483B1 (en) Computer implemented method and apparatus for providing a logical point of access to one or more files
KR100363183B1 (ko) 직접 포워딩 서비스를 위한 컴퓨터 프로그램을 저장한 기록매체
KR100321926B1 (ko) 직접 접근 방식을 이용한 정보 및/또는 서비스를 제공하기 위한 컴퓨터 프로그램을 저장한 기록매체 및 시스템
JP2002526834A (ja) 代替的なインターネット・リソース識別子およびアドレスに対する方法およびシステム
KR20030015272A (ko) 비-라틴어 문자 url 변환 방법
US20030009462A1 (en) Computer-readable designators and methods and systems of using the same
JPH10301954A (ja) 画像検索方法及び画像検索システム
IL207660A (en) Www addressing
AU4003700A (en) Multi-language domain name service
KR20010085195A (ko) 직접 접근 방식을 이용한 정보 및/또는 서비스 제공하기위한 컴퓨터 프로그램을 저장한 기록매체 및 그 방법