JP5497022B2 - 入力文字列からのリソースロケータの提案 - Google Patents

入力文字列からのリソースロケータの提案 Download PDF

Info

Publication number
JP5497022B2
JP5497022B2 JP2011515077A JP2011515077A JP5497022B2 JP 5497022 B2 JP5497022 B2 JP 5497022B2 JP 2011515077 A JP2011515077 A JP 2011515077A JP 2011515077 A JP2011515077 A JP 2011515077A JP 5497022 B2 JP5497022 B2 JP 5497022B2
Authority
JP
Japan
Prior art keywords
candidate set
roman
keyword
resource
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011515077A
Other languages
English (en)
Other versions
JP2011526383A (ja
Inventor
ヨンガン・ワン
フェン・ホン
ウェイ・シュー
シリウ・タン
ヘンリー・オウ
ボー・ヤン
レイ・ジャン
ルンフア・ヤン
ジュン・ウ
バオガン・ヤオ
Original Assignee
グーグル・インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by グーグル・インコーポレーテッド filed Critical グーグル・インコーポレーテッド
Publication of JP2011526383A publication Critical patent/JP2011526383A/ja
Application granted granted Critical
Publication of JP5497022B2 publication Critical patent/JP5497022B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Description

この開示は、入力方式に関連する。
この出願は、その内容が参照によってここに組み込まれる、2008年7月3日に出願された米国仮特許出願シリアル番号第61/078,157号、及び2008年9月16日に出願されると共に“Resource Locator Suggestions From Input Character Sequence”と題された米国通常特許出願第12/211,712号に対する優先権を主張する。
1つまたは2つの文字がおおよそ1つの単語または意味に対応する表意文字のスクリプト(logographic script)を使用する言語は、コンピュータキーボードまたはモバイル機器のキーパッドのような標準入力装置上のキーより、更に多くの文字を有している。例えば、中国語は、基本ピンイン要素及び5つの音程によって定義された発音を有する数万の文字を含む。これらの潜在的な多対1の結合のマッピングは、入力装置上で発見されなかった文字及び記号の入力を容易にする入力方式によって実現され得る。従って、ローマ字スタイルキーボードが、漢字を入力するために使用され得る。同様に、入力方式は、日本語、韓国語、及び他の言語のような表意文字を含む多くの他の言語を入力するためにローマ字スタイルキーボードまたは他の入力装置を使用するのに使用され得る。
インプットメソッドエディタ(入力方式エディタ:input method editor)の有用性にもかかわらず、インターネットサイトのアドレス、例えばユニフォームリソースロケータ(uniform resource locator:URL)は、多くの場合、ASCII文字の形式である。それ故に、母国語が表意文字のスクリプトに基づいているユーザ、例えば主として中国語の方言を話すユーザは、彼らが、彼らの言語におけるウェブサイトの文字通りの名前を知っているにもかかわらず、ウェブサイトのURLを覚えるのに苦労する。従って、これらのユーザは、彼らが見ることを望むウェブサイトのURLを入力するいくらかの個別の措置をとらなければならない。URLと関連付けられた文字通りの名前は、ユーザの言語では、彼らの言語の表意文字を使用してつづられ得る。表意文字が西洋スタイルのキーボードの使用によって直接入力されないので、インプットメソッドエディタが、ローマ字の音声記号で表した入力(例えば、ピンイン)から候補表意文字(例えば、Hanzi)への変換を遂行するために使用される。従って、表意文字が、ユーザによって望まれている潜在的なウェブサイトを発見するために、検索エンジンによって使用されると共に、もしウェブサイトが結果として生じる検索結果に現れるならば、それらのユーザは、ウェブサイトを選択する。
この明細書は、インプットメソッドエディタに関連する技術を説明する。いくらかの実施において、リソースロケーション、例えばURLは、ウェブブラウザのアドレスバーに入力された音声記号で表した入力、例えばピンイン入力から直接発見され得る。ローマ字におけるユーザ入力は、ウェブブラウザにおけるアドレスバーで受け取られると共に、非ローマ字の候補セット、例えばHanzi文字の候補セットに変換される。非ローマ字の各セットは、キーワードを識別するためのキーワードプレフィックス(キーワード接頭語)として使用される。それらのキーワードはURLに関連付けられると共に、URL及び関連するキーワードは、非ローマ字の各関連する候補セットに関して、その候補セットが選択される場合に表示される。
概して、この明細書で説明された主題の1つの特徴は、ローマ字入力を受け取る動作と、前記ローマ字入力を使用して非ローマ字の候補セットを識別する動作と、それぞれが対応する非ローマ字の候補セットと関連付けられている、リソースロケーションの候補セットを識別する動作と、前記リソースロケーションの候補セット及び前記非ローマ字の候補セットを表示用のユーザインタフェースに提供する動作とを含む方法において具体化され得る。この特徴の他の実施例は、対応するシステム、装置、及びコンピュータプログラム製品を含む。
この明細書で説明された主題の別の特徴は、クエリログ(query log)におけるクエリ(query)からキーワードを識別する動作と、記憶場所がマッピングされたキーワードを含んだ検索に応答してそれぞれがユーザによって選択された記憶場所であるリソースロケーションに対する前記キーワードのマッピングを生成する動作と、キーワードに対するプレフィックス(接頭語)のマッピングを生成する動作と、クライアント装置に対して、前記クライアント装置においてリソースロケーションアドレスを決定する際に使用するために、前記キーワードに対するプレフィックスのマッピング及び前記リソースロケーションに対するキーワードのマッピングを提供する動作とを含む方法において具体化され得る。この特徴の他の実施例は、対応するシステム、装置、及びコンピュータプログラム製品を含む。
この明細書で説明された主題の1つ以上の実施例の詳細は、以下の添付図面及び記述において説明される。主題の他の特徴、側面、及び利点は、以下の記述、図面、及び特許請求の範囲から明白になるであろう。
インプットメソッドエディタの入力からリソースロケーションが識別される、一例のウェブブラウザ環境を例証するスクリーンショットである。 一例のキーワードプレフィックステーブルを例証する図である。 一例のキーワードリソーステーブルを例証する図である。 選択可能なリソースロケーションを提供するための一例の工程のフローチャートである。 リソースロケーションアドレスを決定するための一例の工程のフローチャートである。 ここで説明された方法を実施し得る一例のシステムの構成図である。
様々な図面における同様の参照符号及び呼称は、同様の要素を示す。
図1は、インプットメソッドエディタの入力からリソースロケーションが識別される、一例のウェブブラウザ環境104を例証するスクリーンショット100である。アドレスバー103は、IMEアドレス環境101に統合される。いくらかの実施において、アドレスバー103は、ユーザが、ウェブアドレス、例えば“www.example.com”を入れ得る標準のURL入力バーとして機能し得る。いくらかの実施において、インプットメソッドエディタの入力は、IMEアドレスバー102に入力されたローマ字(例えば、ピンイン入力のためのASCII文字)が非ローマ字(例えば、Hanzi文字)に変換されるIMEアドレス環境101に提供される。いくらかの実施において、ローマ字入力は、例えばHanzi文字のピンイン表現のような、表意文字のテキストの1つ以上の候補セットの発音表記を表す。IMEアドレス環境101は、ユニフォームリソースロケータ(URL)を自動的に検出するために入力されたテキストを使用することができると共に、ローマ字入力と関係がある1つ以上のユーザが選択可能なURLの結果を示唆し得る。
アドレスバー103、及びIMEアドレスバー102が個別のアドレスバーとして示されるが、IMEアドレスバーは、アドレスバー103に統合され得る。更に、IMEアドレス環境101は、自動または手動のいずれかで例示され得る。ユーザが、音声記号で表した入力、例えば“Xin”に対応すると共に、更に標準のリソースロケーションアドレス、例えば“www.example.com”に対応しないローマ字を入力する場合に、自動の例示化(instantiation)が発生し得る。手動の例示化は、ユーザによって入力された特定の命令、例えばキーボード命令またはメニュー命令に応答して発生し得る。
ローマ字から非ローマ字への変換、及びURLの識別は、一般的にHanzi、または表意文字を使用する他の言語を使用して読み書きを行うユーザに対して、URLを記憶している必要なく、URLの便利な識別を提供する。IMEアドレス環境101は、ローマ字入力を受け取り得ると共に、ローマ字入力を非ローマ字に変換するIME処理能力を提供する。いくらかの実施において、これらの非ローマ字は、URLにマッピングされたキーワードに対応する。
例えば、ユーザは、ピンイン入力“xin lang”を、IMEアドレス環境101のIMEアドレスバー102に入力し得ると共に、ピンイン入力は、非ローマ字106の候補セットに変換され得る。非ローマ字106のこれらの候補セットは、いくらかの実施において、非ローマ字のキーワード112のキーワードプレフィックスである。キーワード112は、キーワードプレフィックス106によって識別されると共に、従って、キーワードプレフィックス106は、対応するURL108を識別するために使用され得る。
図1において例証されたように、非ローマ字106の各候補セットの選択によって、従って、対応するキーワード112、及びURL108が表示され得ると共に、それは、第1の候補文字セット“新浪”の選択、そして対応する候補URL108及びキーワード112を示す。別の候補文字セット106の選択によって、同じく、URL108及びキーワード112の別の候補セットが表示されるであろう。ユーザは、第2のURL108(“news.sina.com.cn”)及びその対応するキーワード112を囲む選択ボックス114で例証されたように、URLの内の1つを選択するために、入力装置、例えばキーボードまたはマウスを利用し得る。
非ローマ字106の9つの候補セットが示されるが、より多いか、またはより少ない非ローマ字のセットが表示され得る。同様に、より多いか、またはより少ないリソースロケーション108及びキーワード112の候補セットが、非ローマ字の候補セットの選択に応答して同じく示され得る。
いくらかの実施において、各候補セット108におけるリソースロケーションは、例えば特定のリソースロケーションまたはキーワードの人気に従って順位付けされ得る。リソースロケーション108及び関連するキーワード112は、例えば、選択頻度ベースのクリックログ(click log)及びクエリログに従って、及び/または、クエリログにおけるキーワードの順位に基づいて事前に順位付けされた順番で、提供され得る。いくらかの実施において、リソースロケーション108、キーワード112、及び対応する順位を定義するデータは、ユーザ装置に提供され得ると共に、それらの順位は、ユーザ装置の(複数の)ユーザの選択履歴に基づいて修正され得る。例えば、IMEアドレス環境101は、各リソースロケーションがユーザ装置の現在の(複数の)ユーザによって選択された回数を追跡すると共に、従って、リソースロケーションの順位を調整し得る。例えば、その順位は、ユーザ装置の(複数の)ユーザに対して、リソースロケーションの人気に基づいて、特定の好ましい順番でリソースロケーション108のリストを出力するために使用され得る。同様の方式で、候補文字106が表示される順番は、ユーザ装置の(複数の)ユーザによる選択に基づいて、調整され得る。
いくらかの実施において、候補文字セット106に対するキーワード112のマッピングが、例えばキーワードプレフィックステーブルのようなデータ構造において提供され得る。図2Aは、一例のキーワードプレフィックステーブル200を例証する。いくらかの実施において、テーブル200は、外部のサーバによって作成され得ると共に、クライアント装置上のウェブブラウザに提供され得る。キーワードプレフィックステーブル200は、キーワードプレフィックス列202、キーワード列204、及びネスト化された(nested)キーワード列206を含む。ローマ字は、キーワードプレフィックステーブルに含まれていないが、しかし、説明の容易さのために、説明図には含まれている。
第1の行208は、列202における語句“Sina”に関するHanzi文字を表すキーワードプレフィックス110を含む。一例において、キーワードプレフィックス110は、“Sina Homepage”210及び“Sina Sports”212を含む2つのキーワードに分岐され得る。いくらかの実施において、キーワードプレフィックスから更に多くのキーワードが分岐され得る。
第2の行214は、列202において、キーワードプレフィックス“United”を表すHanzi文字と共に、キーワードプレフィックス“United”216を含む。一例において、キーワードプレフィックス216は、“United Nations”218及び“United Airlines”220を含む2つのキーワードに分岐され得る。キーワード“United Nations”218は、その上、更なるキーワードに分岐され得る。例えば、キーワード218は、“United Nations Charter”222及び“Secretary of UN”224を含む更に2つのキーワードに分岐されて示される。
テーブル200の中のキーワードは、リソースロケーションにマッピングされ得る。図2Bは、一例のキーワードリソーステーブル250を例証する。キーワードリソーステーブル250は、キーワードと(例えばユニフォームリソースロケータのような)リソースロケーションとの間のマッピング、そして、ユーザ選択(user preference)、クリック率(click rate)、または他の測定基準に基づいたユニフォームリソースロケータの順位である。テーブル200は、外部のサーバによって作成され得ると共に、クライアント装置上のウェブブラウザに提供され得る。いくらかの実施において、テーブル250は、各キーワードに対する各URLがキーワードを含むクエリに応えて選択される頻度を判定することによって作成され得る。これらの頻度は、検索エンジンと関連付けられたクエリログ及びクリックログを利用することによって獲得され得る。ユニフォームリソースロケータは、これらの頻度に基づいて、各々のキーワード候補セットに関して、他のユニフォームリソースロケータと比較して順位付けされる。
テーブル250は、文字の列252、URLの列254、及び順位の列256を含む。文字の列252は、Hanzi文字を含む。それらの文字は、ユーザによって入力されたキーワードを示す。URLの列254は、列252において示されたキーワードHanzi文字を含むクエリに応答して選択されたユニフォームリソースロケータの真部分集合を含む。順位の列256は、各ユニフォームリソースロケーション(uniform resource location)に関する順位付け点数を含む。その順位は、各ユニフォームリソースロケーションが対応するキーワードに関して選択される相対頻度を表しており、更に、キーワード及びユニフォームリソースロケータがユーザに対して表示される順番を決定する。
1つの例において、行258は、第1のキーワード260、関連するユニフォームリソースロケータ262、及びユニフォームリソースロケータの順位264を含む。最上位に順位付けされたユニフォームリソースロケータは、“www.sina.com”であると共に、それは“9.75”の得点が与えられ、一方、更に順位が低いユニフォームリソースロケータが、それぞれ“9.22”及び“2.21”の得点で順位付けされる。従って、文字260で表されたキーワードに関して、選択されるべきである最も有り得るユニフォームリソースロケータは、3つのユニフォームリソースロケータ262である。同様の方式で、行266は、第2のキーワード268、関連するユニフォームリソースロケータ270、及びユニフォームリソースロケータの順位272を表示する。
これらの順位は、クエリログ及びクリックログの利用に基づいて、初めに設定され得る。いくらかの実施において、クライアント装置上の特定のテーブル250における順位は、(複数の)ユーザの入力に基づいて調整され得る。
テーブル200及び250は、IMEアドレス環境101においてリソースロケーション108及び対応するキーワード112を選択して表示するためにウェブブラウザによって使用され得る。例えば、IMEアドレス環境101を例示するソフトウェアを実行しているクライアント装置は、候補文字セット106に基づいてキーワードを識別するために、プレフィックステーブル200にアクセスすることができる。その場合に、これらのキーワードは、選択された候補文字セットに関して最も人気がある(popular)リソースロケーションを識別するための、キーワードロケーションテーブル250におけるインデックスとして使用され得る。例えば、もしそのユーザが、キーワードプレフィックス“United”の識別に結び付いたピンインを入力したならば、IMEアドレス環境101は、示唆されたキーワード“United Nations”及び“United Airlines”、及びキーワードリソーステーブル250においてインデックスが付けられた対応するリソースロケーションを含むであろう。更に、IMEアドレス環境101は、同様に、“United Nations Charter”及び“Secretary of UN”、そして対応するリソースロケーションを示唆するであろう。
いくらかの実施において、テーブル200及び250は、検索エンジンサーバのようなサーバ装置上に常駐し得る。これらの実施において、サーバ装置は、IMEアドレス環境101における全ての操作、またはそれの一部分を実行することができる。例えば、クライアント装置上のブラウザは、ピンイン入力を候補文字セット106に変換することのような、基礎的なIME機能を遂行し得る。候補文字セット106は、同様に、IMEアドレス環境101における表示のために、リソースロケーションの候補セット108及びキーワード112をクライアント装置に返信として提供し得る、サーバ装置に提供され得る。
図3は、選択可能なリソースロケーションを提供するための一例の工程300のフローチャートである。例えば、工程300は、図5において示された装置502及び/または装置504において実行され得る。
工程300は、ASCII文字列のようなローマ字入力を受け取る(302)。例えば、IMEアドレス環境101は、ローマ字入力を受け取り得るIMEアドレスバー102を含む。1つの例において、ユーザは、装置504上で表示されるアドレスバー102において、中国語の言葉のピンイン表現を入力することができる。例えば、その利用者は、IMEアドレスバー102において語句“ping”を入力することができる。語句“ping”は、語句“apple(アップル)”のピンイン表現である。いくらかの実施において、ピンイン表現“ping”は、キーワードプレフィックスであり得る。例えば、“ping”は、語句“apple pie(アップルパイ)”に関するプレフィックスであり得る。概して、“apple(アップル)”を表すローマ字“ping”は、例えば、西洋のスタイルのキーボードのようなキーボード、または手書き文字認識エンジンと共に使用されるスタイラスから入力され得る。
工程300は、その入力がアドレスバーにおいて受け取られるかどうかを判定する(304)。例えば、装置504は、ローマ字入力(すなわち、キーワードプレフィックス)がURLバー、検索バー、テキストエディタ、または他のプログラムに提示されたかどうかを判定し得る。もしその入力がURLバー(例えば、IMEアドレスバー102)に入力されなかったならば、工程300は、終了すると共に、入力されたテキストは、意図したプログラムによって処理される。
もしキーワードプレフィックスがURLバーに入力されたならば、工程300は、非ローマ字の候補セットを識別するために、ローマ字入力を使用する(306)。例えば、工程300は、ピンインから中国語(例えば、Hanzi文字)にローマ字入力を変換するインプットメソッドエディタ工程を含み得る。IME工程は、サーバ装置502か、またはクライアント装置504のいずれかで実行され得る。
ローマ字を非ローマ字に変換すると、工程300は、非ローマ字の候補セットに対応するリソースロケーションの候補セットを識別する(308)。例えば、工程300は、同じ非ローマ字のキーワードプレフィックスを共有するキーワードプレフィックステーブル200におけるキーワードを識別することによって、非ローマ字の各セットに関するキーワードを識別する。キーワードの識別は、サーバ装置502か、またはクライアント装置504のいずれかで実行され得る。
工程300は、関連するリソースロケーション(例えば、URL)を識別すると共に、このリソースロケーションを非ローマ字の候補セットと照合する(310)。例えば、工程300は、関連するリソースロケーションを識別するためのキーワードリソーステーブル250に対するインデックスとして、キーワードプレフィックステーブル200から識別されたキーワードを使用する。関連するリソースロケーションの識別は、サーバ装置502か、またはクライアント装置504のいずれかで実行され得る。
もしリソースロケーションが発見されないならば、工程300は終了する。もしリソースロケーションが発見されるならば、その場合に、工程300は、リソースロケーションの候補セット及び非ローマ字の候補セットを表示用のユーザインタフェースに提供する(312)。例えば、もしリソースロケーションがサーバ装置502において識別されるならば、サーバ装置は、リソースロケーション及び関連するキーワードを、クライアント装置504に提供し得る。関連するキーワード及びリソースロケーションを受け取ると、もしくは、もしリソースロケーション及びキーワードがクライアント装置504において識別されるならば、キーワード及びリソースロケーションは、例えばウェブブラウザインタフェースのような表示インタフェースに提供され得る。その後、工程300は、候補文字セットの選択に応答して、リソースロケーション108、及び対応するキーワード112を表示する。
いくらかの実施において、リソースロケーションは、選択頻度に従って順位付けされ得る。いくらかの実施において、各キーワードに関する最も高く順位付けされたURLが選択され得ると共に、非ローマ字の候補セットと関連付けられ得る。
図4は、リソースロケーションアドレスを決定するための一例の工程400のフローチャートである。工程400は、例えば、図5において示される装置502において実行され得る。
工程400は、クエリログ401aにおけるクエリ、及びクリックログ401bにおいて識別された選択されたリソースロケーションから、キーワード及びリソースロケーションを識別する(402)。例えば、多くのユーザからのクエリを記録するクエリログ401a、及びリソースロケーションの選択と、それに関してリソースロケーションが識別された対応するクエリとを記録するクリックログ401bは、サーバ装置502上のデータマイニングエンジン(data-mining engine)によって利用され得る。
工程400は、リソースロケーションに対するキーワードのマッピングを生成し得る(404)。いくらかの実施において、各リソースロケーションは、キーワードを含んだ入力された検索クエリに応答してユーザによって選択された記憶場所を表す。そのマッピングは、データベース(例えば、キーワードリソーステーブル250)に格納され得る。いくらかの実施において、キーワードをマッピングすることは、各キーワードに関する各リソースロケーションを、そのキーワードに関する他のリソースロケーションと比較して順位付けすることを含み得る。いくらかの実施において、順位は、それぞれのリソースロケーションの各々が選択された回数に基づき得る。他の順位の測定基準が同様に使用され得る。その場合に、マッピングは、サーバ装置502の中のデータマイニングエンジンによって生成され得ると共に、キーワードリソーステーブル250に格納され得る。
工程400は、キーワードに対するプレフィックスのマッピングを生成し得る(406)。例えば、サーバ装置502の中のデータマイニングエンジンは、各キーワードまたはそれのプレフィックスを含むプレフィックスツリーを生成するために、クエリログ401を使用し得る。プレフィックスツリー内の各ノードは、キーワードに対応するか、または複数のキーワードに共通するプレフィックスに対応し得る。プレフィックステーブル200における例のノードは、列202及び列204によって定義されたノードを含む。この情報は、キーワードプレフィックステーブル200に格納され得る。いくらかの実施において、例えばある期間の間の回数を超えて使用されるキーワードのみのような、クエリログ401aが提供するキーワードの真部分集合は、キーワードプレフィックステーブル200に格納され得る。
工程400は、キーワードに対するプレフィックスのマッピング、及びリソースロケーションに対するキーワードのマッピングを、クライアント装置に提供し得る(408)。例えば、サーバ装置502は、キーワードプレフィックステーブル200、及びキーワードロケーションテーブル250を、クライアント装置502に提供し得る。
図5は、ここで説明された方法を実施し得る一例のシステム500の構成図である。システム500は、インターネット接続506を横断してクライアント処理装置504とデータ通信を行うサーバ処理装置502を備える。1つだけのクライアント及び1つだけのサーバが図5において例証されるが、あらゆる数のサーバ及び/またはクライアントが含まれ得る。
サーバ502は、クライアント装置504によって実行可能であるインプットメソッドエディタコード510を備えると共に、それはクライアント装置504に提供され得る。クライアント装置504によって実行されると、インプットメソッドエディタコード510は、クライアント装置504上でIMEアドレス環境101を例示する。インプットメソッドエディタコード510は、ローマ字入力、例えばピンイン入力を処理すると共に、ローマ字入力を非ローマ字入力に変換するための言語モデル(図示せず)を備えることができる。
サーバ502は、更に、上記図2A及び図2Bで示されたキーワードプレフィックステーブル200、及びキーワードリソーステーブル250を備える。他の記憶構成(storage architecture)が同様に使用され得る。これらのテーブル200及び250は、クライアント装置に提供され得る。
サーバ502は、更に、キーワードプレフィックステーブル200及びキーワードリソーステーブル250を生成するために、クエリログ401a及びクリックログ401bを利用し得る、マイニングエンジン514を備える。いくらかの実施において、マイニングエンジン514は、まれなことかめったに使用されなかったキーワードを除外するために、頻度のしきい値を超えるキーワード、例えばある期間の間の最小の回数を超過して使用されるキーワードを識別するように構成され得る。この選択工程は、入力されそうにないキーワード、もしくはユーザによって選択されたキーワードを省略することによって、キーワードプレフィックステーブル200の大きさを減少させる。他の選択基準が同様に使用され得る。
いくらかの実施において、マイニングエンジン514は、リソース、例えば頻度のしきい値を超えて選択されるウェブサイト、例えばキーワードがクエリにおいて使用される場合に少なくとも最小の回数選択されるリソースロケーション、を識別するように更に構成され得る。この選択工程は、ユーザによって選択されそうにないリソースロケーションを省略することによって、キーワードリソーステーブル250の大きさを減少させる。他の選択基準が同様に使用され得る。
キーワードリソーステーブル250は、クライアント装置504に提供される場合には、最初の順位を含み得る。これらの最初の順位は、クエリログ401a及びクリックログ401bに起因する選択可能性を反映する。いくらかの実施において、IMEコード510は、クライアント装置504におけるユーザ選択を追跡し得ると共に、クライアント装置504に格納されるキーワードリソーステーブル250内の順位を調整し得る。従って、キーワード及びリソースロケーションの識別は、ユーザの走査検索(browsing)の履歴に基づいて、各ユーザに関してカスタマイズされ得る。
特定の言語及び入力方式例との関連で説明されたが、ここで説明されたシステム及び方法は、表意文字を利用するあらゆる言語のために使用され得る。例えば、ここで説明されたシステム及び方法は、例えば日本語のような表意文字を含む、多くの他の言語のために使用され得る。
この明細書で説明された主題、及び機能的動作の実施例は、デジタル電子回路構成か、もしくは、この明細書おいて開示された構成及びそれらの構成上の等価物を含むコンピュータソフトウェア、ファームウェア、またはハードウェアか、もしくは、それらの内の1つ以上の組み合わせにおいて実施され得る。この明細書で説明された主題の実施例は、1つ以上のコンピュータプログラム製品、すなわち、データ処理装置による実行のための、もしくはデータ処理装置の動作を制御するための、実際のプログラム担体上に符号化して記録されたコンピュータプログラム命令の1つ以上のモジュールとして実施され得る。実際のプログラム担体は、伝搬信号(propagated signal)またはコンピュータ読み取り可能な媒体であり得る。伝搬信号は、人工的に生成された信号、例えば機械で生成された電気信号、光学信号、もしくは電磁気信号であると共に、それは、情報を、コンピュータによる実行のための適当な受信機装置に対する伝送用に符号化するように生成される。コンピュータ読み取り可能な媒体は、機械可読記憶装置、機械可読記憶回路基板、メモリ装置、機械可読伝搬信号を生じさせる組成物(composition of matter)、または、それらの内の1つ以上の組み合わせであり得る。
用語“処理装置”は、プログラム可能なプロセッサ、コンピュータ、もしくはマルチプロセッサまたはマルチコンピュータを一例として含む、データを処理するための全ての装置、機器、及び機械を包含する。装置は、ハードウェアに加えて、問題のコンピュータプログラムのための実行環境を作成するコード、例えばプロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、またはそれらの内の1つ以上の組み合わせを構成するコードを備えることができる。
コンピュータプログラム(同様にプログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、またはコードとして知られている)は、コンパイルされた言語または解釈された言語(interpreted language)、もしくは、宣言型言語または手続き型言語を含むあらゆる形式のプログラミング言語で書かれ得ると共に、それは、独立型プログラム、もしくは、モジュール、コンポーネント、サブルーチン、またはコンピュータ環境における使用に適当な他のユニットを含むあらゆる形式で配置され得る。コンピュータプログラムは、ファイルシステムにおけるファイルに必ずしも対応するとは限らない。プログラムは、他のプログラムまたはデータを保持するファイル(例えば、マークアップ言語文書に格納される1つ以上のスクリプト)の一部分に格納され得るか、問題のプログラム専用の単一のファイルに格納され得るか、または複数の組織的なファイル(例えば、1つ以上のモジュール、サブプログラム、またはコードの一部分を格納するファイル)に格納され得る。コンピュータプログラムは、1つのサイトに設置されるか、もしくは複数のサイトに横断して分散される、1つのコンピュータまたは複数のコンピュータ上で実行されるように配置され得ると共に、通信ネットワークによって相互に接続され得る。
コンピュータプログラムの実行に適当なプロセッサは、一例として、一般的なマイクロプロセッサと特殊用途のマイクロプロセッサの両方、及びあらゆる種類のデジタルコンピュータのあらゆる1つ以上のプロセッサを含む。一般的に、プロセッサは、読み取り専用メモリ、またはランダムアクセスメモリ、またはその両方から、命令及びデータを受け取ることになる。コンピュータの必須要素は、命令を遂行するためのプロセッサと、命令及びデータを格納するための1つ以上のメモリ装置である。一般的に、コンピュータは、更に、データを格納するための、例えば光磁気ディスク(magnetic optical diskまたはmagneto optical disk)、もしくは光ディスクのような1つ以上の大容量記憶装置からデータを受信するか、またはそのような1つ以上の大容量記憶装置にデータを送信するか、またはその両方であるように、そのような1つ以上の大容量記憶装置を含むことになるか、もしくはそのような1つ以上の大容量記憶装置に対して動作可能に連結されることになる。しかしながら、コンピュータは、そのような装置を有している必要がない。更に、コンピュータは、別の装置、例えば2〜3例を挙げると、携帯電話、携帯情報機器(PDA)、携帯型オーディオまたはビデオプレーヤ、ゲームコンソールに埋め込まれ得る。
コンピュータプログラム命令及びデータを格納することに適当なコンピュータ読み取り可能な媒体は、全ての形式の不揮発性のメモリ、媒体、及びメモリ装置を含み、それらは、一例として、例えばEPROM、EEPROM、及びフラッシュメモリ装置のような半導体メモリ装置、例えば内部ハードディスクまたは交換可能ディスクのような磁気ディスク、光磁気ディスク、そしてCD−ROMディスク及びDVD−ROMディスクを含んでいる。プロセッサ及びメモリは、専用論理回路構成によって補完され得るか、専用論理回路構成に併合され得る。
ユーザとの意志の疎通を提供するために、この明細書で説明された主題の実施例は、ユーザに対して情報を表示するための表示装置、例えばCRT(ブラウン管)モニタまたはLCD(液晶表示装置)モニタと、それによってユーザが入力をコンピュータに提供できるキーボード及びポインティングデバイス、例えばマウスまたはトラックボールを有するコンピュータ上で実施され得る。他の種類の装置が、同様に、ユーザとの意志の疎通を提供するために使用され得ると共に、また例えば、ユーザに提供されるフィードバックは、あらゆる形式の感覚フィードバック、例えば視覚フィードバック、聴覚フィードバック、または触覚フィードバックであることができ、そして、ユーザからの入力は、音響入力、音声入力、または触覚入力を含むあらゆる形式で受信され得る。
この明細書で説明された主題の実施例は、計算システムにおいて実施され得ると共に、例えば、計算システムは、例えばデータサーバのようなバックエンドコンポーネントを備えるか、もしくは、計算システムは、例えばアプリケーションサーバのようなミドルウェアコンポーネントを備えるか、もしくは、計算システムは、それを通してユーザがこの明細書で説明された主題の具体化と情報のやり取りをすることができる、例えばグラフィカルユーザインタフェースまたはウェブブラウザを有するクライアントコンピュータのようなフロントエンドコンポーネントを備えるか、もしくは、計算システムは、1つ以上のそのようなバックエンドコンポーネント、ミドルウェアコンポーネント、またはフロントエンドコンポーネントのあらゆる組み合わせを備える。
この明細書は、多数の実装時固有事項を含む一方、これらは、全ての発明の範囲及び特許請求の範囲における制限と解釈されるべきでなく、むしろ特定の発明の特定の実施例に特有であり得る特徴の説明であると解釈されるべきである。この明細書で説明される個別の実施例の文脈におけるいくつかの特徴は、同様に、単一の実施例の組み合わせにおいて実施され得る。逆に、単一の実施例の文脈で説明される様々な特徴は、同様に、複数の実施例において別々に実施され得るか、またはあらゆる適当な副次的な組み合わせにおいて実施され得る。更に、特徴が、いくつかの組み合わせにおける動作として上記において説明され得ると共に、そういうものとして初めに主張されるが、場合によっては、主張された組み合わせが提供する1つ以上の特徴を、組み合わせから削除することができると共に、主張された組み合わせは、副次的な組み合わせまたは副次的な組み合わせの変化したものを対象にし得る。
同様に、動作が図面において特定の順序で描写される一方、これは、望ましい結果を達成するために、そのような動作が示された特定の順序、または順次的な順序で実行されること、あるいは、全ての例証された動作が実行されること、を必要とするとして理解されるべきでない。いくつかの状況において、マルチタスク処理及び並列処理が有利であり得る。更に、上述の実施例における様々なシステムコンポーネントの分離は、全ての実施例においてそのような分離を必要とするとして理解されるべきでないと共に、それは、説明されたプログラムコンポーネント及びシステムは、一般的に、1つのソフトウェア製品に一緒に統合されるか、もしくは複数のソフトウェア製品に実装され得ると理解されるべきである。
この明細書で説明された主題の特別な実施例が説明された。他の実施例は、特許請求の範囲の中にある。例えば、請求項において列挙された動作は、異なる順序で行われ得ると共に、それでも望ましい結果が達成され得る。望ましい結果を達成するために、1つの例として、添付の図面において描写された処理は、説明された特定の順序、及び順次的な順序を必ずしも必要とするとは限らない。いくつかの実施において、マルチタスク処理及び並列処理が有利であり得る。
100 スクリーンショット
101 IMEアドレス環境
102 IMEアドレスバー
103 アドレスバー
104 ウェブブラウザ環境
106 キーワードプレフィックス(非ローマ字)
108 リソースロケーション(URL)
110 キーワードプレフィックス
112 キーワード
114 選択ボックス
200 キーワードプレフィックステーブル
202 キーワードプレフィックス列
204 キーワード列
206 ネスト化されたキーワード列
208 第1の行
210 キーワード“Sina Homepage”
212 キーワード“Sina Sports”
214 第2の行
216 キーワードプレフィックス
218 キーワード“United Nations”
220 キーワード“United Airlines”
222 キーワード“United Nations Charter”
224 キーワード“Secretary of UN”
250 キーワードリソーステーブル
252 文字の列
254 URLの列
256 順位の列
258 行
260 第1のキーワード
262 関連するユニフォームリソースロケータ
264 ユニフォームリソースロケータの順位
266 行
268 第2のキーワード
270 関連するユニフォームリソースロケータ
272 ユニフォームリソースロケータの順位
300 選択可能なリソースロケーションを提供するための一例の工程
400 リソースロケーションアドレスを決定するための一例の工程
401a クエリログ
401b クリックログ
500 システム
502 サーバ装置
504 クライアント装置
506 インターネット接続
510 インプットメソッドエディタコード
514 マイニングエンジン

Claims (21)

  1. コンピュータによって実施される方法であって、
    ローマ字入力を受け取る段階と、
    前記ローマ字入力を使用して非ローマ字の候補セットを識別する段階と、
    それぞれが対応する非ローマ字の候補セットと関連付けられている、リソースロケーションの候補セットを識別する段階と、
    前記リソースロケーションの候補セット及び前記非ローマ字の候補セットを表示用のユーザインタフェースに提供する段階と
    を含み、
    前記リソースロケーションの候補セットを識別する段階が、
    各非ローマ字の候補セットに関して、非ローマ字の候補セットに対するキーワードを識別する段階と、
    各識別されたキーワードに関して、関連するリソースロケーションを識別する段階と、
    非ローマ字の候補セットに前記リソースロケーションを関連付ける段階とを含む
    ことを特徴する方法。
  2. 前記非ローマ字の候補セットに対するキーワードを識別する段階が、非ローマ字の候補セットをプレフィックスとして使用し、キーワードをプレフィックス検索する段階を含む
    ことを特徴する請求項1に記載の方法。
  3. 非ローマ字の候補セットの内の1つの選択物を受け取る段階と、
    前記選択物の受け取りに応答して、前記非ローマ字の候補セットと関連付けられている前記リソースロケーションの候補セットを表示する段階と
    を更に含むことを特徴する請求項1に記載の方法。
  4. 前記非ローマ字が、“Hanzi”文字である
    ことを特徴する請求項1に記載の方法。
  5. 前記ローマ字入力を使用して非ローマ字の候補セットを識別する段階が、前記非ローマ字の候補セットのそれぞれに関して、
    キーワードを非ローマ字におけるプレフィックスにマッピングするプレフィックステーブルを、前記非ローマ字の候補セットによって検索し、キーワードを識別する段階と、
    キーワードをリソースロケーションにマッピングするキーワードテーブルを、前記識別されたキーワードによって検索し、リソースロケーションを識別する段階と、
    前記非ローマ字の候補セットに前記識別されたリソースロケーションを関連付ける段階と
    を更に含むことを特徴する請求項1に記載の方法。
  6. キーワードテーブルを、前記識別されたキーワードによって検索し、リソースロケーションを識別する段階が
    各識別されたキーワードに関して、前記識別されたキーワードにマッピングされたリソースロケーションを識別する段階と、
    前記識別されたキーワードにマッピングされた各リソースロケーションの順位を識別する段階と、
    最高順位を有する前記リソースロケーションを選択する段階とを含み、
    前記非ローマ字の候補セットに前記識別されたリソースロケーションを関連付ける段階が、前記非ローマ字の候補セットに各キーワードに関して前記最高順位を付けられたリソースロケーションだけを関連付ける段階を含む
    ことを特徴する請求項5に記載の方法。
  7. 前記リソースロケーションの候補セットのそれぞれの中の前記リソースロケーションのそれぞれが選択される回数を記録する段階と、
    前記リソースロケーションのそれぞれが選択される回数に基づいて、各リソースロケーションの順位を調整する段階と
    を更に含むことを特徴する請求項6に記載の方法。
  8. 各リソースロケーションの候補セットに関して、
    前記リソースロケーションの候補セットのそれぞれの中の前記リソースロケーションのそれぞれが選択される回数を記録する段階と、
    前記リソースロケーションのそれぞれが選択された回数に基づいて、前記リソースロケーションの候補セットのそれぞれの中の前記リソースロケーションを、前記リソースロケーションの候補セットの中の他のリソースロケーションと比較して順位付けする段階と
    を更に含むことを特徴する請求項1に記載の方法。
  9. 前記非ローマ字の候補セットのそれぞれを前記ユーザインタフェース上に表示する段階と、
    非ローマ字の候補セットの内の1つの選択物を受け取る段階と、
    前記非ローマ字の候補セットの内の選択された1つと関連付けられている前記リソースロケーションの候補セット及びキーワードだけを表示する段階と
    を更に含むことを特徴する請求項1に記載の方法。
  10. 前記リソースロケーションの候補セット及び前記非ローマ字の候補セットを表示用のユーザインタフェースに提供する段階が、前記リソースロケーションの候補セット及び前記非ローマ字の候補セットを、前記ユーザインタフェースを備えるユーザ装置に送信する段階を含む
    ことを特徴する請求項1に記載の方法。
  11. クエリログにおけるクエリからキーワードを識別する段階と、
    記憶場所がマッピングされたキーワードを含んだ検索に応答してそれぞれがユーザによって選択された記憶場所であるリソースロケーションに対する前記キーワードのマッピングを生成する段階と、
    キーワードに対するプレフィックスのマッピングを生成する段階と、
    クライアント装置に対して、リソースロケーションアドレスを決定する際に使用するために、前記キーワードに対するプレフィックスのマッピング及び前記リソースロケーションに対するキーワードのマッピングを提供する段階と
    を更に含むことを特徴する請求項1に記載の方法。
  12. キーワードに対するプレフィックスのマッピングを生成する段階が、前記キーワードに関するプレフィックスツリーを生成する段階を含み、
    前記プレフィックスツリー内の各ノードが、キーワードに対応するか、または複数のキーワードに共通するプレフィックスに対応する
    ことを特徴する請求項11に記載の方法。
  13. 各キーワードが、1つ以上の“Hanzi”文字を含む
    ことを特徴する請求項12に記載の方法。
  14. リソースロケーションに対する前記キーワードのマッピングを生成する段階が、前記リソースロケーションのそれぞれが選択された回数に基づいて、各キーワードに関する各リソースロケーションを、前記キーワードに関する他のリソースロケーションと比較して順位付けする段階を含む
    ことを特徴する請求項13に記載の方法。
  15. 機械可読媒体に実体的に内蔵されたコンピュータプログラムであって、
    前記コンピュータプログラムが、機械によって読み込まれたときに、データ処理装置に、
    ローマ字入力を受け取る段階と、
    前記ローマ字入力を使用して非ローマ字の候補セットを識別する段階と、
    それぞれが対応する非ローマ字の候補セットと関連付けられている、リソースロケーションの候補セットを識別する段階と、
    前記リソースロケーションの候補セット及び前記非ローマ字の候補セットを出力する段階と
    を含む工程を実行させる命令を有し、
    前記リソースロケーションの候補セットを識別する段階が、
    各非ローマ字の候補セットに関して、非ローマ字の候補セットに対するキーワードを識別する段階と、
    各識別されたキーワードに関して、関連するリソースロケーションを識別する段階と、
    非ローマ字の候補セットに前記リソースロケーションを関連付ける段階とを含む
    ことを特徴するコンピュータプログラム。
  16. 前記非ローマ字の候補セットに対するキーワードを識別する段階が、非ローマ字の候補セットをプレフィックスとして使用し、キーワードをプレフィックス検索する段階を含む
    ことを特徴する請求項15に記載のコンピュータプログラム。
  17. 非ローマ字の候補セットの内の1つの選択物を受け取る段階と、
    前記選択物の受け取りに応答して、前記非ローマ字の候補セットと関連付けられている前記リソースロケーションの候補セットを表示する段階と
    を更に含むことを特徴する請求項15に記載のコンピュータプログラム。
  18. 前記非ローマ字が、“Hanzi”文字である
    ことを特徴する請求項15に記載のコンピュータプログラム。
  19. 前記ローマ字入力を使用して非ローマ字の候補セットを識別する段階が、前記非ローマ字の候補セットのそれぞれに関して、
    キーワードを非ローマ字におけるプレフィックスにマッピングするプレフィックステーブルを、前記非ローマ字の候補セットによって検索し、キーワードを識別する段階と、
    キーワードをリソースロケーションにマッピングするキーワードテーブルを、前記識別されたキーワードによって検索し、リソースロケーションを識別する段階と、
    前記非ローマ字の候補セットに前記識別されたリソースロケーションを関連付ける段階と
    を更に含むことを特徴する請求項15に記載のコンピュータプログラム。
  20. キーワードテーブルを、前記識別されたキーワードによって検索し、リソースロケーションを識別する段階が、
    各識別されたキーワードに関して、前記識別されたキーワードにマッピングされたリソースロケーションを識別する段階と、
    前記識別されたキーワードにマッピングされた各リソースロケーションの順位を識別する段階と、
    最高順位を有する前記リソースロケーションを選択する段階とを含み、
    前記非ローマ字の候補セットに前記識別されたリソースロケーションを関連付ける段階が、前記非ローマ字の候補セットに各キーワードに関して前記最高順位を付けられたリソースロケーションだけを関連付ける段階を含む
    ことを特徴する請求項19に記載のコンピュータプログラム。
  21. 前記リソースロケーションの候補セットのそれぞれの中の前記リソースロケーションのそれぞれが選択される回数を記録する段階と、
    前記各リソースロケーションが選択される回数に基づいて、各リソースロケーションの順位を調整する段階と
    を更に含むことを特徴する請求項20に記載のコンピュータプログラム。
JP2011515077A 2008-07-03 2009-07-03 入力文字列からのリソースロケータの提案 Active JP5497022B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US7815708P 2008-07-03 2008-07-03
US61/078,157 2008-07-03
US12/211,712 2008-09-16
US12/211,712 US8745051B2 (en) 2008-07-03 2008-09-16 Resource locator suggestions from input character sequence
PCT/CN2009/072610 WO2010000208A1 (en) 2008-07-03 2009-07-03 Resource locator suggestions from input character sequence

Publications (2)

Publication Number Publication Date
JP2011526383A JP2011526383A (ja) 2011-10-06
JP5497022B2 true JP5497022B2 (ja) 2014-05-21

Family

ID=41465158

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011515077A Active JP5497022B2 (ja) 2008-07-03 2009-07-03 入力文字列からのリソースロケータの提案

Country Status (5)

Country Link
US (2) US8745051B2 (ja)
JP (1) JP5497022B2 (ja)
KR (1) KR20110039233A (ja)
CN (1) CN102144228B (ja)
WO (1) WO2010000208A1 (ja)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10319252B2 (en) * 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US9122674B1 (en) 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
US8831928B2 (en) * 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US8677018B2 (en) 2008-08-25 2014-03-18 Google Inc. Parallel, side-effect based DNS pre-caching
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
JP5165719B2 (ja) * 2010-03-30 2013-03-21 ヤフー株式会社 情報処理装置、データ抽出方法及びプログラム
US8930360B2 (en) * 2010-05-28 2015-01-06 Yahoo! Inc. System and method for online handwriting recognition in web queries
WO2012024585A1 (en) 2010-08-19 2012-02-23 Othar Hansson Predictive query completion and predictive search results
US9104306B2 (en) * 2010-10-29 2015-08-11 Avago Technologies General Ip (Singapore) Pte. Ltd. Translation of directional input to gesture
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
US9348479B2 (en) 2011-12-08 2016-05-24 Microsoft Technology Licensing, Llc Sentiment aware user interface customization
US9378290B2 (en) * 2011-12-20 2016-06-28 Microsoft Technology Licensing, Llc Scenario-adaptive input method editor
US8942973B2 (en) * 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
USD712421S1 (en) * 2012-06-06 2014-09-02 Apple Inc. Display screen or portion thereof with graphical user interface
US9594831B2 (en) 2012-06-22 2017-03-14 Microsoft Technology Licensing, Llc Targeted disambiguation of named entities
CN110488991A (zh) 2012-06-25 2019-11-22 微软技术许可有限责任公司 输入法编辑器应用平台
CN104412212A (zh) * 2012-06-29 2015-03-11 微软公司 输入法编辑器
US9959340B2 (en) * 2012-06-29 2018-05-01 Microsoft Technology Licensing, Llc Semantic lexicon-based input method editor
US20150199332A1 (en) * 2012-07-20 2015-07-16 Mu Li Browsing history language model for input method editor
US9767156B2 (en) 2012-08-30 2017-09-19 Microsoft Technology Licensing, Llc Feature-based candidate selection
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
CN104077077A (zh) * 2013-03-29 2014-10-01 国际商业机器公司 调整输入法中的信息提示的方法和装置
CN104182402A (zh) * 2013-05-22 2014-12-03 腾讯科技(深圳)有限公司 浏览器界面地址栏输入控制方法及系统
US20140359426A1 (en) * 2013-05-31 2014-12-04 Tencent Technology (Shenzhen) Company Limited Method and apparatus for providing suggestion for browser address bar input, browser and terminal thereof
EP3030982A4 (en) 2013-08-09 2016-08-03 Microsoft Technology Licensing Llc INPUT PROCESSORS EDITOR WITH LANGUAGE SUPPORT
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
CN103678708B (zh) * 2013-12-30 2017-01-18 小米科技有限责任公司 一种识别预设地址的方法及装置
US10146748B1 (en) * 2014-09-10 2018-12-04 Google Llc Embedding location information in a media collaboration using natural language processing
CN104484366B (zh) * 2014-12-04 2019-03-12 百度在线网络技术(北京)有限公司 基于输入法的网站信息提供方法和装置
TWI550420B (zh) * 2015-02-12 2016-09-21 國立雲林科技大學 資訊取得系統與方法、以及儲存裝置
CN104820695A (zh) * 2015-04-29 2015-08-05 百度在线网络技术(北京)有限公司 一种资源获取方法及装置
US9886433B2 (en) * 2015-10-13 2018-02-06 Lenovo (Singapore) Pte. Ltd. Detecting logograms using multiple inputs

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08161339A (ja) * 1994-12-02 1996-06-21 Nec Corp 文字列変換装置
US6407754B1 (en) * 1998-12-15 2002-06-18 International Business Machines Corporation Method, system and computer program product for controlling the graphical display of multi-field text string objects
US6848080B1 (en) * 1999-11-05 2005-01-25 Microsoft Corporation Language input architecture for converting one text form to another text form with tolerance to spelling, typographical, and conversion errors
AU2001291598A1 (en) 2000-06-28 2002-01-08 Inter China Network Software Company Limited Method and system of intelligent information processing in network
WO2002001312A2 (en) * 2000-06-28 2002-01-03 Inter China Network Software Company Limited Method and system of intelligent information processing in a network
JP2002082850A (ja) 2000-06-29 2002-03-22 Just Syst Corp ホームページ検索装置、ホームページ検索システム、ホームページ検索方法およびその方法をコンピュータに実行させるプログラム
JP2002024246A (ja) 2000-07-12 2002-01-25 Just Syst Corp ホームページ検索装置、ホームページ検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002032413A (ja) 2000-07-18 2002-01-31 Just Syst Corp ホームページ検索システム、ホームページ検索装置、ホームページ検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4405052B2 (ja) 2000-07-18 2010-01-27 株式会社ジャストシステム ホームページ検索装置、ホームページ検索システム、ホームページ検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US20020083029A1 (en) * 2000-10-23 2002-06-27 Chun Won Ho Virtual domain name system using the user's preferred language for the internet
US7376648B2 (en) 2004-10-20 2008-05-20 Oracle International Corporation Computer-implemented methods and systems for entering and searching for non-Roman-alphabet characters and related search systems
CN1770147A (zh) 2004-11-01 2006-05-10 英业达股份有限公司 关键词分段索引式资料查询方法及系统
US7506254B2 (en) * 2005-04-21 2009-03-17 Google Inc. Predictive conversion of user input
US20070106653A1 (en) * 2005-10-12 2007-05-10 Yu Sun Search engine
US20070255702A1 (en) * 2005-11-29 2007-11-01 Orme Gregory M Search Engine
US7689554B2 (en) * 2006-02-28 2010-03-30 Yahoo! Inc. System and method for identifying related queries for languages with multiple writing systems
US7720856B2 (en) * 2007-04-09 2010-05-18 Sap Ag Cross-language searching
US8051061B2 (en) * 2007-07-20 2011-11-01 Microsoft Corporation Cross-lingual query suggestion
WO2009049049A1 (en) * 2007-10-09 2009-04-16 Language Analytics Llc Method and system for adaptive transliteration
US8463597B2 (en) * 2008-05-11 2013-06-11 Research In Motion Limited Mobile electronic device and associated method enabling identification of previously entered data for transliteration of an input

Also Published As

Publication number Publication date
WO2010000208A1 (en) 2010-01-07
US8745051B2 (en) 2014-06-03
US20100005086A1 (en) 2010-01-07
US20140258892A1 (en) 2014-09-11
KR20110039233A (ko) 2011-04-15
CN102144228A (zh) 2011-08-03
JP2011526383A (ja) 2011-10-06
CN102144228B (zh) 2017-04-26

Similar Documents

Publication Publication Date Title
JP5497022B2 (ja) 入力文字列からのリソースロケータの提案
US11294970B1 (en) Associating an entity with a search query
US11514035B1 (en) Query refinements using search data
US9336277B2 (en) Query suggestions based on search data
US9430573B2 (en) Coherent question answering in search results
US9965569B2 (en) Truncated autosuggest on a touchscreen computing device
US20170024424A1 (en) Suggestive search engine
US20130173610A1 (en) Extracting Search-Focused Key N-Grams and/or Phrases for Relevance Rankings in Searches
US9342233B1 (en) Dynamic dictionary based on context
US20130006914A1 (en) Exposing search history by category
US20120124071A1 (en) Extensible search term suggestion engine
US20160224621A1 (en) Associating A Search Query With An Entity
US11250052B1 (en) Systems and methods for searching quotes of entities using a database
US20140372873A1 (en) Detecting Main Page Content
WO2009000103A1 (en) Word probability determination
JP6956119B2 (ja) 文脈情報を提供するためのシステムおよび方法
WO2011049727A2 (en) Leveraging collaborative cloud services to build and share apps
EP2519896A2 (en) Search suggestion clustering and presentation
EP2939099A1 (en) Touch to search
US10353974B2 (en) Methods and systems for refining search results
JP2019197381A (ja) 判決文データベースの作成方法、判決文データベースの検索方法、文作成方法、判決文データベースの作成装置、判決文データベースの検索装置、文作成装置、判決文データベースの作成プログラム、判決文データベースの検索プログラム、および文作成プログラム
US20230061394A1 (en) Systems and methods for dynamic hyperlinking
CN117828170A (zh) 一种信息获取方法、设备及系统
JP2012215966A (ja) カテゴリ別共通付加情報追加装置及びカテゴリ別共通付加情報追加方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120521

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130716

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130723

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131022

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140305

R150 Certificate of patent or registration of utility model

Ref document number: 5497022

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250