JP2013502631A - データ検索および言語翻訳のための方法および手段 - Google Patents

データ検索および言語翻訳のための方法および手段 Download PDF

Info

Publication number
JP2013502631A
JP2013502631A JP2012525129A JP2012525129A JP2013502631A JP 2013502631 A JP2013502631 A JP 2013502631A JP 2012525129 A JP2012525129 A JP 2012525129A JP 2012525129 A JP2012525129 A JP 2012525129A JP 2013502631 A JP2013502631 A JP 2013502631A
Authority
JP
Japan
Prior art keywords
search
context
synonym
translation
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012525129A
Other languages
English (en)
Inventor
ヴァーナネン,ミッコ
Original Assignee
ヴァーナネン,ミッコ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ヴァーナネン,ミッコ filed Critical ヴァーナネン,ミッコ
Publication of JP2013502631A publication Critical patent/JP2013502631A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24522Translation of natural language queries to structured queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本発明は、データ検索および翻訳に関する。特に、本発明は、インターネットまたはデータベースから文書を検索することに関する。さら、本発明は、文書、ウェブページ、画像または音声中の言葉をある言語から別の言語に翻訳することにも関する。本発明に係る少なくとも1つのコンピュータを含むコンピュータで実施される方法は、少なくとも1つの検索語を含む検索クエリを受信する工程と、少なくとも1つの検索語に対して少なくとも1つの同義語を引き出す工程と、前記受信した検索クエリを少なくとも1つの同義語で拡張する工程と、前記拡張した検索クエリを用いて少なくとも1つの文書を検索する工程と、前記拡張したクエリによって得られた検索結果を取り出す工程と、少なくとも1つの検索語が出現する文脈に基づいて、前記同義語拡張した検索結果をランク付けする工程とを特徴とする。本発明の最良の形態は、より優れた検索結果を提供するインターネット検索エンジンであるとみなされる。
【選択図】図1

Description

本発明は、データ検索および言語翻訳に関する。特に、本発明は、インターネットまたはデータベースから文書を検索することに関する。さらに、本発明は、文書、ウェブページ、画像または音声中の言葉をある言語から別の言語に翻訳することにも関する。
現代の会社員の大部分が、全世界に広がるインターネット検索を一般的に経験している。検索経験は苛立たしいものだが、探している文書を見つけることができなかったり、関連すると思われる文書が理解できない言語で書かれていたりすることが非常に多い。これによって、世界経済の生産性が大きく妨げられている。
インターネット検索エンジンならびに機械翻訳ソフトウェアが先行技術で知られる。先行技術の状況について記載している文献の1つは、国際公開第2009/002864A2号であり、その内容は参照として本明細書に引用されている。この先行技術では、例えば、「箱を船で送る方法(How to ship a box)」という形態の検索クエリをコンピュータに入力する。この先行技術では、クエリ中の用語を同義語拡張する。例えば、「船で送る(ship)」という単語は、例えば、「船で運ぶ(boat)」および「送る(send)」という同義語を有することができる。拡張された同義語群は、文脈上無関係である拡張された同義語を取り除くことによって制限される。すなわち、検索クエリ中の用語の同義語は、この先行技術によれば、受信した検索クエリ中の用語が出現する文脈に基づいて選択される。例えば、先行技術では、トロール漁船に関係する検索結果は、箱を船で送ることとはおそらく関連がないため、このような検索結果は破棄される。
研究中の本発明は、コンピュータ化されたデータ検索クエリならびにある言語から別の言語へのコンピュータ化された言語翻訳を効果的に向上させるためのシステムおよび方法に関する。
先行技術には深刻な欠点がある。そこで、本発明者は、序論で述べた人が1箱の魚を船で送ろうとしている場合はどうするのかと尋ねる。結局、トロール漁船に関する検索結果は全く無関係にはなり得ない。
先行技術のデータの検索および翻訳方法は、少なくとも、同義語拡張において誤った単独の決定を行い、それにより、検索を所望の検索結果に回復させることができないために検索の実行全体において間違った結果を生じさせるという点で、不完全である。
本発明のさらなる目的は、上記問題を解決し、品質が向上した検索結果および翻訳を生成することにある。
本出願では、単語Aの「同義語」を、単語Aと類似した意味を有するが異なる単語である単語Bとして解釈する。単語のスペルミスおよびタイプミスも、本出願ではその単語を同義語に変更することが考慮される。すなわち、本発明によれば、「aple」は「apple」の同義語になり得る。
本出願では、「文脈」とは、単語が提示されているか、あるいは理解され得る/理解されるべき総体的かつ全体的な論理的、物理的および/または哲学的な環境と解釈される。
「同義語拡張」とは、元の検索および/または翻訳クエリを類似した意味を有する単語群に拡張することと解釈される。例えば、「Big Aple」というクエリは、「大きなAple(Big Aple)」、「大型のリンゴ(large apple)」、「大きなリンゴ(Big Apple)」、「ニューヨーク市」、「NYC」にまで同義語拡張され得る。
「自然言語」とは、フランス語、ドイツ語、エスペラント語、英語または中国語などの、過去、現在または未来の話し言葉および/または書き言葉を意味する。
本発明の一態様では、検索クエリを検索語の同義語で拡張する。拡張したクエリに基づいて検索結果を取り出す。但し、有効な同義語は、単に無関係であるように見えるという理由だけで除外されることはない。例えば、「箱を船で送る方法」というクエリの場合、漁船であるトロール船は除外されない。ここでは、上記理由から、より大きな検索結果群がおそらく生じるであろう。トロール漁船に関する検索結果は、同義語拡張した検索結果群の中にその時点ではなお存在している。
次いで、本発明では、同義語拡張した検索結果をそれらの文脈上の関連性に基づいてランク付けする。同義語拡張した検索結果に対する文脈によるランク付けを行うために使用される文脈情報は、世界的に知られているパラメータ、ユーザのコンピュータから入手可能なデータ、ウェブページの最近の閲覧履歴、同義語拡張した検索クエリの中に挙げられているサイトに過去にユーザがアクセスした方法の統計学的分析、ユーザのコンピュータ上でアプリケーションにより開かれているデータ、およびクエリが起動される文脈を特徴づける任意の他の情報などの様々な情報源に由来するものであってもよい。例えば、ユーザが、どちらも一般に知られている魚である「タラ」および/または「サケ」という単語でブラウザウィンドウを開いた場合、「船で送る」という単語に最も近い同義語ではないが、「トロール漁船」の文脈上の関連性は非常に強い。従って、トロール漁船を含む検索結果は、検索結果に含まれるだけでなく、ユーザに示される最終的な検索結果リストでは上位にランク付けされる。
本発明の別の使用状況では、「箱を船で送る方法」という検索クエリが、アラビア砂漠(すなわちサウジアラビア)に存在することが知られているコンピュータから届く。同じ同義語拡張した検索結果群が取り出される。その時、ユーザがFedEx(商標)のウェブサイトを15秒間訪問したと仮定する。魚の箱の配達も行うトロール漁船を主題とする検索結果が取り出された結果の中にあったとしても、それは、その文脈上の関連性に基づいて上位にランク付けされることはない。サウジアラビアの郵便局ならびにそこに支店を有するあらゆる国際宅配便のウェブサイトは、それらの文脈上の関連性に基づいてかなり上位に上る。
さらに、ユーザがソービニヨンブラン(白身魚に合う白ワインのための有名なブドウ)に関する文書を自分のデスクトップ上で開いている場合、箱および配達を主題としたトロール漁船の検索結果を支持してランク付けが変更される。
本発明では、単独の検索語に対して間違った決定を行う不完全な文脈による決定によって検索結果が失われることはない。これは、本発明の顕著な利点である。
本発明の別の実施形態は、文書をある言語から別の言語に翻訳する際に本発明の上述した同じ技術を活用する。本発明のいくつかの実施形態では、別の言語に翻訳される単語は検索語に類似している。英語に翻訳される文が、例えばフィンランド語であると仮定する:「Matti paatti kayda kylassa. Saavuttuaan Liisa tarjosi kahvit tuvassa」。同義語拡張した翻訳は、以下のようなものになり得る:
1)「Mattiは訪問することに決めた。到着するとすぐに、Liisaは、居間でコーヒーを出した」
2)「Mattiは立ち寄ることに決めた。到着するとすぐに、Liisaは家の中でコーヒーを出した」
3)「Mattiは村を訪問することに決めた。到着するとすぐに、Liisaは、居間でコーヒーを出した」
4)「Mattiは村に立ち寄ることに決めた。到着するとすぐに、Liisaは家の中でコーヒーを出した」など。
ここでは、異なる方法で組み合わせられる異なる拡張した同義語の異なる置き換えおよび組み合わせによって、かなり大きな検索結果のリストになるため、検索結果のリストは非常に長くなる。本発明によれば、広範囲な有効に拡張した同義語を有する検索結果リストは望ましい。そこで、同義語拡張した検索結果のこの非常に長いリストに対して、文脈に基づくランク付けを行う。
文脈に基づくランク付けは、同じ言語の他の文書から観察される一般的な統計学的傾向、翻訳されるテキストを取り囲む言葉、ユーザのコンピュータから入手可能なデータ、ウェブページの最近の閲覧履歴および任意の他の情報に基づいて行うことができる。ここで、何らかの理由で、例えばその出来事がヘルシンキで行われることを文脈が示している場合、一般にフィンランド語を話す人は、その国で最も大きな都市であり首都であるヘルシンキを村とは呼ばないため、翻訳1〜2がより上位にランク付けされる。同様に、MattiがLiisaにとって見知らぬ人であることを文脈が示している場合、「kayda kylassa」が訪問に対する社会性を示し、また、MattiおよびLiisaが互いに知り合いでない場合、Liisaの居間にMattiが個人的な訪問をしているというよりは、彼らは村で出会い、(例えば、カフェである家の中で)単にLiisaが出したコーヒーを飲むと仮定する方が文脈上適切であるため、文脈から翻訳4がより上位にランク付けされる。
従って、検索に最も適合する文書を決定するだけでなく、本発明を使用して、最も適合する翻訳を生成することができる。同義語拡張において完全に間違った決定が回避され、入手可能な十分な文脈情報がある限り、その結果は、かなり向上した翻訳となる。
本発明の上記利点のいくつかまたは全ては、同義語拡張/文脈ランク付け技術を用いて外国語のページを翻訳し、かつ同様に同義語拡張/文脈ランク付け技術によって取り出される最も適切な検索結果を表示するブラウザおよび検索エンジンによって得られる。従って、本発明は最も広範囲な検索を保証し、最も論理的に適切な検索結果が最初に表示される。
本発明に係るコンピュータで実施される方法は、少なくとも1つのコンピュータを含み、
− 少なくとも1つの検索語を含む検索クエリを受信する工程と、
− 少なくとも1つの検索語に対して少なくとも1つの同義語を引き出す工程と、
− 受信した検索クエリを少なくとも1つの同義語で拡張する工程と、
− 前記拡張した検索クエリを用いて少なくとも1つの文書を検索する工程と、
− 前記拡張したクエリによって得られた検索結果を取り出す工程と、
− 少なくとも1つの検索語が出現する文脈に基づいて、前記同義語拡張した検索結果をランク付けする工程と、
を特徴とする。
本発明に係る構成は、少なくとも1つのコンピュータを含み、
− 少なくとも1つの検索語を含む検索クエリが受信されるように構成されていること、
− 少なくとも1つの検索語に対して少なくとも1つの同義語が引き出されるように構成されていること、
− 受信した検索クエリが少なくとも1つの同義語で拡張されるように構成されていること、
− 少なくとも1つの文書が前記拡張した検索クエリを用いて検索されるように構成されていること、
− 前記拡張したクエリによって得られた検索結果が取り出されるように構成されていること、
− 前記同義語拡張した検索結果が、少なくとも1つの検索語が出現する文脈に基づいてランク付けされるように構成されていること、
を特徴とする。
本発明に係る記憶装置は、コンピュータで実施される検索方法を実行しかつ/または上記検索構成を動作させることできるソフトウェアを含む。
少なくとも1つのコンピュータを含み、テキストをある言語から別の言語に翻訳するための本発明に係るコンピュータで実施される方法は、
− 少なくとも1つの翻訳される用語を含む翻訳クエリを受信する工程と、
− 少なくとも1つの翻訳される用語の少なくとも1つの同義語を引き出す工程と、
− 受信した翻訳クエリを少なくとも1つの同義語で拡張する工程と、
− 前記拡張した翻訳クエリによって得られた翻訳結果を取り出す工程と、
− 少なくとも1つの翻訳される用語が出現する文脈に基づいて、前記同義語拡張した翻訳結果をランク付けする工程と、
を特徴とする。
少なくとも1つのコンピュータを含み、テキストをある言語から別の言語に翻訳するための本発明に係るコンピュータで実施される構成は、
− 少なくとも1つの翻訳される用語を含む少なくとも1つの翻訳クエリが受信されるように構成されていること、
− 少なくとも1つの翻訳される用語の少なくとも1つの同義語が引き出されるように構成されていること、
− 受信された翻訳クエリが少なくとも1つの同義語で拡張されるように構成されていること、
− 前記拡張した翻訳クエリによって得られる翻訳結果が取り出されるように構成されていること、
− 前記同義語拡張した翻訳結果が、少なくとも1つの翻訳される用語が出現する文脈に基づいてランク付けされるように構成されていること、
を特徴とする。
本発明に係る記憶装置は、コンピュータで実施される翻訳方法を実行してかつ/または上記翻訳構成を動作させることができるソフトウェアを含む。
本発明に係る記憶装置は、ファイルシステムの専用部分からデータを読み込んで、検索および/または翻訳のための文脈データを抽出するように構成されていることを特徴とするソフトウェアを含む。
本発明に係る検索エンジンソフトウェアは、ユーザのインターネットブラウザ、オペレーティングシステム、ファイルシステム、データベースソフトウェアおよび/またはアプリケーションから引き出された文脈データに基づいて、同義語拡張した検索結果をランク付けするように構成されているということを特徴とする。
本発明に係るオペレーティングシステムソフトウェアは、ユーザのインターネットブラウザ、オペレーティングシステム、ファイルシステム、データベースソフトウェアおよび/またはアプリケーションから引き出された文脈データに基づいて、同義語拡張した検索結果をランク付けするように構成されているということを特徴とする。
本発明に係るソフトウェアアプリケーションは、ユーザのインターネットブラウザ、オペレーティングシステム、ファイルシステム、データベースソフトウェアおよび/またはアプリケーションから引き出された文脈データに基づいて、同義語拡張した検索結果をランク付けするように構成されているということを特徴とする。
本発明に係るデータベースソフトウェアは、ユーザのインターネットブラウザ、オペレーティングシステム、ファイルシステム、データベースソフトウェアおよび/またはアプリケーションから引き出された文脈データに基づいて、同義語拡張した検索結果をランク付けするように構成されているということを特徴とする。
さらに、上記利点が得られる実施形態を参照すると、本発明の最良の形態は、より良好な検索結果を提供するインターネット検索エンジンであるとみなされる。
以下、添付の図面に従って例示的な実施形態を参照しながら、本発明についてより詳細に説明する。
本発明の検索方法の一実施形態を示す。 本発明に係る検索および/または翻訳を行うために使用される構成の一実施形態20を示す。 本発明に係る翻訳方法の一実施形態30を示す。 本発明に係る視聴覚入力を用いた翻訳方法の一実施形態40を示す。
実施形態の一部は、従属請求項に記載されている。
図1は、フローチャートとして、本発明に係る最適なコンピュータ化された検索方法を示す。段階100では、ユーザは検索クエリを入力する。例えば、キーボードまたは他のコンピュータ周辺機器を用いてテキストを入力することによって、または、コンピュータで音声認識を行ってクエリ用語を抽出することが好ましい場合には音声によって、および/またはコンピュータによってパターン認識を行ってクエリ用語を抽出することが好ましい場合には画像によって、入力を行う。本発明によれば、例えば、ユーザは、キーボードで「箱を船で送る方法」と入力することができ、あるいは、「箱を船で送る方法」と言うことができ、音声認識は、言葉を認識し、それらを検索語として使用し、かつ/または、ユーザは、カメラまたは携帯電話で船上に箱を積んだ船の画像を撮ることができ、パターン認識ソフトウェアは、船および箱を認識し、これらを検索語として抽出し、かつ/または、ユーザは、「箱を船で送る方法」と書かれたサインの画像を撮り、コンピュータは、オブジェクト文字認識(OCR)などのパターンおよび/または文字認識を使用して、サイン中の文字および言葉を識別する。本発明によれば、これらの入力方法を組み合わせて使用することもできる。例えば、ユーザは、「方法(how to)」と書き、船上の箱の画像を撮り、書いた「方法」という言葉とパターン認識された「船で送る(ship)」および「箱(box)」という言葉を組み合わせて、本発明に係る検索クエリを形成する。同様に、音声とテキストおよび画像と音声、または、実際には3種類全ての入力形態を、本発明に従って組み合わせて使用することができる。コンピュータによって到着もしくは認識順に用語を配置するか、あるいはユーザが検索語の順序を指定することができ、かつ/または、コンピュータが、本発明に従って認識された検索語に基づいて全検索クエリをユーザに提案することができる。
段階110では、検索クエリを検索語の同義語で拡張する。「方法(how to)」を句として認識し、「どのようにして(in what way)」という同義語で拡張することができ、「船で送る(ship)」を、「船で運ぶ(boat)」および「送る(send)」などの同義語で拡張することができ、「箱」を、「四角い物(square)」および「小包」などの同義語で拡張することができる。同じ意味を有する言葉だけでなく、同義語拡張は、明らかに表記が異なる単語を拡張する。例えば、本発明によれば、「中心(centre)」(英国英語)を「中心(center)」(米国英語)に拡張する。本発明のコンピュータシステムは、同義語拡張における音声上の綴りの間違いによって、あるいは同義語拡張前に分離によって生じたと思われる「boks」「sip」「hou」などのスペルミスを修正することができる。さらに、本発明のコンピュータシステムは、タイプミスによるスペルミスを修正することができ、例えば、本発明によれば、QWERTYキーボードで起こり得る間違いは、「boz」、「shio」、「hoq」である。同様に、本コンピュータシステムは、異なる格変化(state)の名詞を拡張することができ、かつ/または、単語を異なる表記形式から標準形式に修正する。例えば、フィンランド語は、名詞に多くの格変化を有することで有名である。湾(bay)=lahtiは、「lahdella=湾で(on the bay)」または「lahdessa=湾で(in the bay)」と記載される。本発明のいくつかの実施形態では、同義語拡張によって、検索語を異なる言語格変化にまで拡張する。上記例では、「lahdella」という検索語を、本発明によれば、「lahdessa」、「lahti」および、場合によりその名詞の他の格変化も含むように拡張する。
本発明のいくつかの実施形態では、利用可能な計算能力などの実際的な限界によって検索語を制限するために、検索語が出現する文脈に基づいて検索クエリからいくつかの用語を省略することができる。
段階120では、拡張したクエリに基づいて検索結果を取り出す。クエリを拡張する程、検索結果の数は大きくなる。本発明のいくつかの実施形態では、拡張した検索クエリを、同一または異なるコンピュータで同時または連続的に実行されるいくつかの異なる検索クエリに分割し、別々の各クエリの検索結果を組み合わせて、拡張した検索クエリに対して全体的な検索結果を形成する。本発明のいくつかの実施形態では、組み合わせた検索結果のリストから冗語が取り除かれることが特に好ましい。
段階130では、検索結果を文脈によりランク付けする。本発明では、ランク付けは、同義語拡張した結果群に基づくことが重要である。同義語拡張により検索領域を増加させ、より多くの検索結果を提供するが、それらのうちの一部は、ユーザにとって望ましくないものであり、さらには望ましいものでない可能性が高い。本発明によれば、同義語拡張した検索結果群に課される文脈によるランク付けの複合的相乗効果は重要である。同義語拡張で使用される文脈規則によって省略された検索結果は、同様に拡張した検索クエリに一致する一般に数百万までは行かなくとも数百の検索結果(同義語拡張が拡張される程度による)の下に埋もれる可能性はあるが、本発明によれば、検索結果群の中になお存在している。ここで、これらの全ての結果を文脈によりランク付けする場合、文脈に最も適合している限り、同義語拡張した検索結果中の100万番目のシード番号にある検索結果は最初の場所に現れる。
文脈データ(すなわち同義語拡張した検索結果をランク付けする文脈を定義するためのデータ)は、ユーザの過去の閲覧行動、ユーザの位置、時間、日付、ユーザの国籍、ユーザのコンピュータ上のデータ、一般的な人の閲覧行動、言葉の一般的な統計および頻度分析、ならびにユーザのコンピュータ上のアプリケーションで開かれているデータから推測してもよい。
ユーザが一貫した閲覧行動を有する場合、ユーザの過去のウェブページを用いて文脈を定義することは好ましいが、多くの人々はそのような行動を有していない。企業イントラネットを確認した後、新聞をオンラインで読み、オークションサイトまたは広告を調べる人の場合、意味のある文脈データを決定するのに長い閲覧履歴が必要となるかもしれない。本発明の好ましい一実施形態は、コンピュータ上で開いているアプリケーションを使用してランク付けで使用される文脈データを定義する。例えば、ユーザが専門用語(例えば、天文用語の「NGC2547」)を用いてワープロを開いている場合、「スター(star)」という検索語は、ハリウッドまたはボリウッド(インド映画産業)の「スター」ではなく、実際に宇宙の「星」の物体を意味していることがすぐに示唆される。この特定の検索では、有名人に関連する文書は、文脈によりランク付けされた同義語拡張した検索結果のリスト中では最後の場所にランク付けされる。宇宙の星を主題にした文書は、より上位にランク付けされ、NGC星表(NGC:New General Catalogue)番号を有する星を主題にした文書は、さらに上位にランク付けされるが、星団NGC2547中の星に関する記事は、さらに上位にランク付けされる。NGC星表番号への興味が明らかであっても、人気急上昇であると断言されているハリウッド女優に関する記事は、当然ながら、検索の視点ではその記事も文脈上の利点を有するため、他の有名人の記事よりもリスト上では上位に引き上げられる。
より詳細には、文脈に基づくランク付けは、本発明に係るいくつかの異なる方法および手段によって行うことができる。「出現する文脈」とは、少なくとも1つの検索語がその中に現れる文脈、すなわち少なくとも1つの検索語が出現する文脈を意味する。例えば、ユーザが、検索エンジンまたはプログラムに「ロンドンへのフライト」という検索クエリを入力した場合、これらの検索語が出現する文脈は、ユーザが検索クエリを行った際にユーザのコンピュータ上にある他のアプリケーション中のデータおよび検索語がその時現れている文脈に関連する任意のデータを含む。ユーザが「3月1日〜3日にロンドンに訪問」という言葉を含むEメールメッセージを開いており、「ロンドンへのフライト」という検索語が3月1日〜3日の間にロンドンに行く人の文脈に現れている場合、3月1日〜3日の任意の出発直前の2泊3日のパッケージが文脈により上位にランク付けされる。従って、「出現する文脈」とは、ユーザのコンピュータ上の文脈データおよび/または検索語が現れる際にユーザのコンピュータがアクセスした(すなわち、検索エンジンおよび/またはプログラムに提供された)文脈データを意味する。
本発明の一実施形態では、本システムは、開いているアプリケーション、Eメール、メッセージ、一時的なフォルダ、デスクトップ、カレンダ、クロック、GPSチップ、オペレーティングシステム、過去に閲覧したウェブページなどの文脈から言葉または数を選別する。本発明によれば、文脈を定義する言葉、数または他の制約要因の選別を、ランダムに、または、いくつかのアルゴリズムによって、あるいは、いくつかの実施形態では、さらにユーザによって行うことができる。ここでは、本システムは、同義語拡張した検索語、典型的には膨大な数の検索結果、および文脈を定義する用語を有する。
ここで、選択された文脈用語に最も類似性が高い文書を最初に配置する順序で、検索結果を再配置することができる。
本発明の単純な一実施形態では、受信した検索結果を、文脈用語による一般的なヒット順で単純にランク付けする。「箱を船で送る方法」という検索クエリを用いた先の例で、ユーザが、「急いで寿司レストランに魚を船で送る」というタイトルのウェブページを開いていると仮定し、例えば、本システムが、おそらく世界最大の漁港であるスペインのビゴにいることを知っていると仮定する。本発明によれば、「魚」、「急いで」、「寿司」および「レストラン」という文脈用語が選択される。ここでは、ビゴの埠頭に着いた後、氷箱に入れて直送で寿司用の切り身を送るトロール漁船について記載している文書は、検索結果の中ではおそらく一般に百万番目などのシードで埋もれる。しかし、本明細書は、最高頻度の文脈用語に注目し、文脈によるランク付けではそれらを最初の場所に再配置する。その最も単純な実施形態では、本発明の文脈に基づくランク付けは、取得した文脈用語のみに基づく最初の検索結果に対して新しい検索を実行するものである。
異なる検索語および/または文脈用語は異なる重みを有していてもよく、その重みは、ユーザまたは本システムによって割り当てられるか、ネットワークから更新されるか、あるいは、本発明に従ってコンピュータに予めプログラムされ得ることを理解されたい。
文脈用語は、単に平易な言葉または数ではなく関数であってもよく、例えば、文脈用語は、日付、時間、位置などの関数形式で取得することができ、すなわち、文脈用語は、平易な意味を超える関数または条件付きとすることができることも理解されたい。
一実施形態では、文脈によるランク付けを文脈オントロジに基づいて行う。オントロジとは、オントロジ(コンピュータ科学:通常は階層的であり、かつ全ての関連した実体およびそれらの関係を含むいくつかの知識範囲の厳密かつ網羅的な体系。出典:Wordnet)を意味する。
本発明によれば、単語はオントロジを有していてもよく、例えば、「アップル(apple)」という単語は、それが一般に果物の一例ならびに「カルヴィルブラン(Calville Blanc)(フランスの料理用のリンゴ)」または、「グラニースミス(Granny
Smith)(しっかりした味を有するオーストラリアの緑色のリンゴ)または「レッドデリシャス(Red
Delicious)(米国で特に幅広い消費者の支持を有する明赤色のリンゴ)」などの属から種(品種)まで、およびカリフォルニアの人気の高いパーソナルコンピュータであるというオントロジを有する。上記に加えて、「アップル」という単語は、条件付きのオントロジを有する場合があり、例えば、「ビッグ(Big)」という接頭辞を有し、かつ大文字で「ビッグアップル(Big Apple)」となっている場合はニューヨーク市を意味する。
単語のオントロジは典型的に、少なくとも1つの検索エンジンプログラムによって読み込まれるファイル内に格納することができる。検索エンジンなどは、1台のコンピュータ上にあるかコンピュータネットワーク上に分散された、それらの単語のオントロジを定義する全ての一般的な言語で全ての単語に対するデータファイルを有することができる。あるいは、それらのファイルまたはそれらのファイルの一部を、PCまたはアップル社製Macコンピュータなどのユーザが使用している端末コンピュータのような加入者端末に格納することができる。
本発明によれば、単語のオントロジ内には異なる部分に対して可変的な重みが存在し得ることに留意されたい。先の例を熟考すると、本発明のいくつかの実施形態では、「グラニースミス」は、「アップル」のオントロジにおいて「カルヴィルブラン」よりも高い相対的な重みを有することができ、それは、アプリオリの1つでは、アップルを検索している多くのユーザが、より知られているグラニースミスの方を検索すると仮定することができるからである。当然のことながら、本発明のいくつかの実施形態では、「カルヴィルブラン」に対してより高い相対的な重みを与えて、この選択を逆に行うことができる。一般に、関連性が実際の単語そのものから遠い程、相対的な重みは低くなる。「アップル」という単語では、「アップル」という単語自体のオントロジにおけるその相対的な重みは、いくつかの実施形態では100%であるが、本発明によれば、「カルヴィルブラン」および「グラニースミス」に対しては、それぞれ1%および2%またはその逆とすることができる。
文脈を定義するために選択された単語がオントロジを有し得ると述べたように、実際に、いくつかの実施形態では、十分に定義されたオントロジを有するそれらの単語は典型的に、オントロジを有しない単語、あるいは十分に定義されていないかあまり使用されていないオントロジなどを有する単語よりも文脈用語として選択される。
いくつかの実施形態では、文脈用語のオントロジを用いて検索結果を検索し、文脈用語のオントロジに最も類似しているそれらの検索結果の文書は、ランク付けで優先され、すなわち、より関連性が低い検索結果の文書よりも前にランク付けされる。
本発明のいくつかの実施形態では、選択された文脈用語のいくつかまたは全てが同義語拡張したものであってもよい。次いで、取り出された検索結果を、同義語拡張した文脈用語によって再検索し、いくつかの実施形態での文脈によるランク付けでは、最も類似しているかヒット件数が最も多い同義語拡張した文脈用語を有する検索結果を最初にランク付けする。
異なる検索語、文脈用語および/またはオントロジは、異なる重みを有していてもよく、その重みは、ユーザまたは本システムによって割り当てられるか、ネットワークから更新されるか、あるいは、本発明に従ってコンピュータに予めプログラムされ得ることを理解されたい。
文脈用語および/またはオントロジは、単に平易な言葉または数ではなく、関数であってもよく、例えば、文脈用語は、日付、時間、位置などの関数形式で取得することができ、すなわち、文脈用語は、平易な意味を超える関数とすることができることも理解されたい。例えば、文脈用語「時間:12:00」について検討する。人の用語では、時間が12:00の+/−15分である場合、時間:12:00は、「今」にかなり等しい。この状況では、非常に明らかなように、「今」は、文脈用語の時間:12:00のオントロジに含まれるが、関数および/または条件付きの場合にのみ含まれ、8.00pmであった場合、「今」は、文脈用語のオントロジに含まれることはあり得ない。
より精巧な実施形態では、ユーザまたはユーザ端末は、例えば、Eメール文脈、閲覧文脈および/または刊行物文脈などの異なるオントロジを有するいくつかの文脈を有していてもよい。
例えば、Eメール文脈は、時間、送信者および/または受信者、それらの識別などの内容以外の他の情報を含む。多くの場合、Eメールの実際の内容は、通信している人たちによって記憶されていない。すなわち、Eメール文脈の文脈オントロジを定義するのは、むしろ、送信者、Eメールの送信および/または受信時間、その重要性の分類または他のパラメータである。
本発明のいくつかの実施形態では、閲覧文脈をブラウザキャッシュから読み込むことができる。例えば、ある時間にアクセスしたウェブページは、同時にあるいは同じまたは類似したクエリ列でアクセスした他のウェブページの文脈で解釈されるはずである。このように読み込む場合、本発明によれば、ブラウザキャッシュを使用して、閲覧文脈オントロジを決定することができる。
他方、刊行物文脈は、ユーザまたはユーザ端末が決定する公開内容に関する。多くのユーザは、興味のない多くのゴミのような情報を受信するが、全く興味のない発行物に関してウェブページに連絡したりEメールまたはFTPファイルを送ったりすることは滅多になく、当然のことながら、それらの発行物は他の人々にも興味がないものであるかもしれない。ユーザまたはユーザ端末がインターネット上で、あるいはメッセージ送信の形態で選択群に公開するデータを使用して、刊行物文脈のオントロジを定義することができる。
文脈オントロジが指定されると、ユーザはオントロジの特定の領域に、あるいはオントロジ全体に重みを割り当てることができる。例えば、Eメール文脈オントロジでは、全ての送信されたEメールあるいは送信されたEメールに現れる用語またはデータには、ユーザが割り当てる相対的な100の重みを与えることができ、受信したEメール中の用語および/またはデータの場合は、1の重みを与えることができる。ユーザは、自分自身で上述の相対的な重みを設定することができ、また、それらを予めプログラムすることや、第三者によってインターネットおよび/またはネットワークサーバから設定することができる。非常に明らかなように、刊行物文脈では、オントロジ内のいくつかの要素の重みは、例えば、刊行物の頻度の関数とすることができる。本発明のいくつかの実施形態では、ユーザが常に更新しているウェブページは、例えば1回のみ更新されたウェブページ(=相対的重み1)と比較して、87回更新された場合に87の重みを有する可能性がある。
また、異なる文脈および文脈オントロジは、ユーザが割り当てるか、ネットワークサーバから割り当てるか、および/または予めプログラムすることができる異なる重みを有していてもよい。主に自分の自己表現のためにEメールを使用する弁護士は、閲覧もしくは刊行物オントロジに対してより高い適切な重みを有するEメール文脈オントロジを有する。対照的に、メディアの市場調査関係の人は、自分の心の中で最も重要なことが、例えばウェブページまたはプレスリリースによって自分が公開したことであるため、例えばEメール文脈オントロジよりも重みが高い刊行物文脈オントロジを有する。
その最も単純な実施形態では、ある文脈は、例えばEメール文脈を例に挙げると、常に同じである1つまたは一まとまりの文脈用語を有することができる。ユーザが英国航空券を販売している旅行代理店である場合、ほぼ全ての事業が顧客のためにEurotravellerエコノミー座席を予約することに関連しているため、「英国航空」および「Eurotraveller」は、かなり一定の文脈用語となる。これらの一定の文脈用語のオントロジが常に一定である場合、これは実質的に、文脈(すなわち、この場合はEメール文脈)オントロジも一定であることを意味する。
当然のことながら、同じ文脈用語または文脈オントロジを有することは、全ユーザの大部分を占める多才なユーザにとって望ましくない。ユーザの変化する要望に適応するために、異なる文脈も変わり、現在のユーザの活動および意図を最も反映させると思われるそれらの文脈用語を選択することが必要である。例えば、ユーザがEメールプログラムを開き、送信用のEメールを書いている場合、ユーザが現在書いているEメールから少なくともいくつか文脈用語をシステムによって取得することは良い考えである。
本発明によれば、文脈が異なる時間または異なる状況で異なる文脈用語を有する場合には、当然のことながら、上記理由により文脈の動的オントロジを引き出す実施形態が得られる。本発明のいくつかの実施形態では、ユーザがコンピュータシステムを使用すると、文脈の数は最新のものになり、好ましくはユーザの活動に最も適合する文脈が常に選択され、好ましくはユーザ活動を最も反映する文脈用語が常に選択され、好ましくは少なくとも1つの文脈用語および/または文脈のオントロジがユーザ活動を反映するように最新のものとなる。
いくつかの実施形態では、異なる文脈を組み合わせて、異なる相対的な重みを有する文脈の定義を生成し得ることに留意されたい。例えば、ユーザがEメールメッセージを開き、かつインターネットを閲覧している場合、本発明によれば、Eメール文脈を70%、閲覧文脈を30%とすることができる。このように、本発明に従って異なる文脈を組み合わせて使用してもよい。
本発明によれば、文脈オントロジ内の異なる文脈用語は、異なる相対的な重みを有し得ることに留意されたい。例えば、用語の頻度によって文脈用語に重みを追加することができる。ユーザが、「フライト」という言葉を5回引用したEメールメッセージを開いている場合、「フライト」という文脈用語は、オントロジに含まれない独立した文脈用語としてそれ自体で、あるいは文脈用語オントロジとして、引用される回数の少ない文脈用語よりも高い相対的な重みを有するはずである。
要約すると、異なる相対的な重みを、検索語、文脈用語、文脈、検索語オントロジ、文脈用語オントロジ、文脈オントロジおよび/または任意のオントロジ内の個々の要素に加えることができ、このようにして、本発明の任意の実施形態では、本発明によれば、文脈によるランク付けの任意の基準を形成することができる。
文脈オントロジに基づく文脈によるランク付けは、リソースディスクリプションフレームワーク(RDF:Resource Description Framework)/メタデータグラフの助けを借りて視覚化することができる。この一例は、「デスクトップ検索:文脈情報は検索結果およびランク付けにどのように影響を与えるか(Desktop Search - How Contextual Information Influences Search
Results and Rankings)」(PaiuおよびNejdl著)の図1の例であり、この内容は本明細書に引用され、参照として本出願に組み込まれる。このRDF/メタデータグラフは、それらの中に関係を有するEメール、ファイル、ウェブページおよび刊行物から文脈メタデータを指定する文脈オントロジを示す。その関係は、「セマンティックデスクトップ検索のための活動に基づくメタデータ(Activity Based Metadata for Semantic Desktop Search)」-2005年5月、ギリシャのイラクリオンで開催された第2回ヨーロッパセマンティックウェブ国際会議の会議録に記載されており、この内容も参照として本明細書に引用され、本出願に組み込まれる。文脈オントロジ要素およびそれらの関係を使用して、同義語拡張した検索結果を検索し、文脈によるランク付けによってこれらの検索結果を優先させることができる。いくつかの実施形態では、オントロジ内の関係およびメタデータは、典型的にユーザの活動から引き出され、例えば、いつ、誰に対して、そして、どのような件名でユーザがメッセージをEメールで送るか、ならびに、どのような添付ファイルと一緒であるかということから引き出される。典型的には、メタデータおよび/または関係を含む文脈オントロジに対する類似性が最も高いと評価されたそれらの同義語拡張した検索結果は、本発明に係る文脈によるランク付けで最高位に位置づけられる。
文脈に基づくランク付けを視覚化する別の実施形態は、スキーマグラフを用いた信頼性移行アノテーション(authority transfer annotation)に関するものであり、これについても、「デスクトップ検索:文脈情報は検索結果およびランク付けにどのように影響を与えるか」(PaiuおよびNejdl著)に説明されている。いくつかのメタデータは、他のメタデータよりも重要であり、例えば、送信者フィールドが従業員の上司を含む場合、これは、我々の大部分が受信する無限のスパムEメールの送信者フィールドよりも信頼すべきメタデータである。上述の文書の図2には、文脈オントロジ内での信頼性移行方法について示されており、例えば、ファイルがスパムEメールによって届けられた場合よりも、上司が送ったEメールに添付された添付文書の方が信頼できるものである。本発明のいくつかの実施形態では、文脈オントロジ内の要素が信頼できる程、それが有する相対的な重みは高くなる。同義語拡張した検索結果を文脈オントロジに対するそれらのランク付けによって文脈によるランク付けを行う場合、本発明によれば、文脈オントロジのより重要かつ/または信頼できる部分との類似性を有するそれらの同義語拡張した検索結果は、最初の場所にランク付けされる。
さらに、文書「文脈を意識した意味的関連性のランク付け(Context-Aware Semantic Association Ranking)」(Aleman−Meza、Halaschek、ArpinarおよびSheth著)は、文脈に基づくランク付けの技術について詳細に記載しており、それは、本出願の参照として本明細書に含まれる。本発明によれば、文脈によるランク付けは、意味的関連性のランク付けに基づく。本実施形態では、文脈オントロジは先に説明したように定義される。ここでは、どちらの検索結果が意味論的に文脈および/または文脈オントロジと最も密接に関連しているかを確認することによって、同義語拡張した検索結果を文脈オントロジと比較する。文脈と同義語拡張した検索結果との意味的関連性を、全体的な経路の重みによって測定する。「文脈を意識した意味的関連性のランク付け」(Aleman−Meza、Halaschek、ArpinarおよびSheth著)に説明されているように、全体的な経路の重みW=ユーザ定義された重み+文脈の重み+包摂的重み(経路におけるクラス分化)+信頼性の重み(文脈と検索結果との間の経路の重み)である。本発明によれば、同義語拡張した検索結果をそのように文脈によりランク付けし、指定された文脈および/または文脈オントロジに意味論的に最も密接に関連する(および/または最も高い全体的な経路の重みを有する)それらの同義語拡張した検索結果を最初にランク付けする。非常に明らかなように、本発明によれば、意味的関連性および/または全体的な経路長さは、上述の構成要素の任意の置き換えおよび/または組み合わせで構成することができる。例えば、本発明のいくつかの実施形態では、ユーザ定義された重みを除外することができる。
上述のように、段階130の文脈によるランク付けは、異なる技術を用いて行ってもよい。本発明によれば、これらの技術を本発明に従って組み合わせかつ/または置き換えることができる。
段階140では、文脈によりランク付けされた同義語拡張した検索結果を、文脈上の関連性の順序でユーザに表示する。典型的には、前記リストをモニタに表示し、ユーザは、詳細な表示のために、任意の検索結果をリスト中の異なる位置に移動させて選択することができる。いくつかの実施形態では、最終的な検索結果のいくつか、例えば、文脈上の関連性が最も低い検索結果を破棄してもよい。ここでは、検索結果の破棄は、初期の検索語の文脈による分析に基づく破棄ほど危険ではない。いくつかの実施形態では、破棄される検索結果は、検索語の実質的な意味のその目的の内容と比較し、かつその文脈を全体としてあるいは部分的にクエリの文脈と比較して検討したものである。
実際には、同義語拡張が十分に広範囲であり、かつユーザが文脈を定義するのに十分な情報を提供する限り、本発明は検索される文書の中からユーザのクエリに最も適合するものを見つけ出すものであると明言することができる。当然のことながら、本発明をインターネットに接続すること以外の方法で所望の文書が入手可能である場合にユーザが以前よりも上手くそれらの所望の情報を見つけ出すことは別の問題である。
方法10の任意の特徴、段階または部分を、本発明に係る実施形態20、30、40で自由に置き換えることができ、また、それらと組み合わせることができる点に留意されたい。
図2は、本発明の検索を行うための例示的な構成を示す。実施形態20は、より詳細にはインターネット検索を指すが、当然のことながら、本発明は、任意の数の文書またはデータベースからの任意のデータ検索と共に使用することができる。ユーザは、キーボード220および/またはマウス200などの周辺機器を用いてコンピュータ210を使用し、スクリーン230で結果を見て読む。検索クエリがコンピュータ210上の少なくとも1つのデータベースまたは文書を対象とする場合、本発明の検索方法は、「オフラインで」、すなわちコンピュータ内部で動作させることができ、検索結果は、スクリーン230上に示される。いくつかの実施形態では、本発明の方法で検索を行うために必要な検索ソフトウェアは、サーバ240上のみに存在し、本発明の検索方法でコンピュータ210上にある文書を検索しなければならない。本実施形態では、サーバ240は、コンピュータ210上のハードドライブ、メモリ、ファイルまたはデータベースを検索する。
多くの実施形態では、本システムのいくつかの部分が少なくとも1つのクライアントコンピュータに分散され、かつ異なるまたは同じいくつかの部分がサーバコンピュータに分散されるように、本発明のシステムの一部は、いくつかのサーバ、いくつかのクライアントコンピュータに分散させることができる。
本発明の最も典型的な使用実施形態は、通常のインターネット検索である。検索クエリは、ユーザのコンピュータからインターネット検索エンジンのサーバに転送される。例示的な先行技術の検索エンジンは、現在では、Google(商標)、Bing(商標)、Yahoo(商標)およびLycos(商標)などの様々な名前で動作することが知られている。サーバ240は、検索クエリを受信し、本発明のインターネット検索を行う。いくつかの実施形態では、特に同義語拡張によって非常に多くの同義語拡張した検索クエリが生じる場合、サーバに、別々の検索クエリとして同時または連続的に検索クエリを実行させ、同義語拡張した検索クエリによる検索から得た検索結果の全体リストを収集することが好ましい。本実施形態では、文脈によるランク付けの前に、全体リスト(すなわち、同義語拡張した検索結果の総合リスト)から冗語を除外することが好ましい。それは、冗語の除外によって、ランク付けされる検索結果が減少し、処理リソースが節約されるからである。
サーバ240は典型的にインターネットまたはデータベースを検索するように構成されているが、本発明によれば、アクセス可能な任意のファイル、文書および/またはデータを検索してもよい。本発明によれば、検索クエリの処理を共有する2台以上のサーバ240が存在するか、あるいは、サーバ240は、本発明よれば、別のサーバに検索クエリを送ってもよい。
本発明によれば、コンピュータ210、スクリーン230、キーボード220および/またはマウス200を、携帯電話、ラップトップコンピュータまたは任意の携帯型計算装置、あるいは、実際には、計算資源がその装置および/またはサーバ240に存在するか否かに関わらず検索クエリを受信することができる任意の装置で置き換えることができる。本発明によれば、検索クエリを音声または画像によって入力することができ、その場合、コンピュータは、マイクロホン、または検索クエリを受信するための通常の電話無線もしくは有線によってのみ置き換えることができる。画像入力の場合、コンピュータは、画像を撮るために使用されるカメラを備えるか、カメラで置き換えられる。いくつかの実施形態では、本発明の検索のための入力としてデジタル画像を受信することが好ましいが、当然のことながら、本発明によれば、フィルム画像をデジタル化し、本発明のコンピュータ化された検索によって使用することができる。
任意のコンピュータまたは装置間の全ての通信接続は、クライアントコンピュータ、ダム端末またはサーバ装置であるか否かに関わらず、ラジオ/マイクロ波/光学などの無線接続、例えば、GSM(登録商標)、CDMA、WIFI、自由空間光通信(FSO)、および/またはデータケーブル、POTSおよび/または光ネットワーク(例えば、SONET/SDH/イーサネット(登録商標))などの固定式通信接続として構成することができる。非常に明らかなように、本発明の方法は、1台のコンピュータのみ、いくつかのコンピュータまたはコンピュータネットワークを含む構成で実行することができる。
同義語拡張した検索結果の文脈によるランク付けを行うために必要な文脈データは、様々な方法で得ることができる。いくつかの実施形態では、サーバ240は、ユーザによってなされた過去の検索、インターネットおよび/またはデータベースおよび/またはユーザの文書閲覧行動を観察し、その文書中の言葉の出現に基づいて文脈を推測してもよい。
いくつかの実施形態では、ユーザは、コンピュータに対して、テキスト入力または複数の選択肢によって文脈を指定してもよい。いくつかの実施形態では、ユーザのコンピュータ210上に、文脈データを定義するために使用されるデータが存在していてもよい。ユーザのコンピュータ上のデータを使用して、多くの方法で文脈データを定義することができる。文脈を定義するためにコンピュータ210上の全てのデータを使用することができるが、これには、かなり多くのデータ処理が必要となる。本発明のいくつかの実施形態では、ユーザは、ユーザにとって興味のある領域に関する文書を含む専用のフォルダを有する。いくつかの実施形態では、このフォルダ内の文書のみを読み出して、文脈データを定義する。例えば、ユーザは、コンピュータ上の自分の文脈フォルダ内の「漁業」という言葉の走査を許可することができる。ユーザが「箱を船で送る方法」を入力し、文脈が「漁業」である場合、魚の箱を船で送るトロール漁船に関する文書は、最終的な検索結果では上位にランク付けされる。
実際には、いくつかの実施形態では、本発明に係る同義語拡張を行わずに、ユーザのコンピュータ上の専用の文脈フォルダに基づく文脈によるランク付けを使用することができる。
本発明のいくつかの実施形態では、本発明の検索方法を使用して、アプリケーション(例えば、Eメールアプリケーション)に格納されたデータも検索できることに留意されたい。いくつかの実施形態では、本発明によれば、同義語拡張を行わずに、ユーザのコンピュータ上の専用の文脈フォルダに基づく文脈によるランク付けを使用して、アプリケーション内のデータを検索することができる。ユーザのコンピュータ上またはネットワーク内の専用の文脈フォルダに基づく文脈によるランク付けは、それ自体で十分に進歩性があり、本発明によれば、検索結果だけでなく同義語をランク付けするためにも使用してもよい。例えば、同義語拡張の同義語を、専用の文脈フォルダ内の内容に基づく文脈によるランク付けによってランク付けすることができ、その際、本発明によれば、最高位にランク付けされている同義語のみが少なくとも1つの検索クエリに受け入れられる。
非常に明らかなように、段階130に関連して説明されている任意の文脈によるランク付け方法は、構成20において、あるいは構成20によって使用してもよい。
構成20の任意の特徴、段階または部分を、本発明に係る実施形態10、30、40で自由に置き換えることができ、また、それらと組み合わせることができる点に留意されたい。
図3は、ある言語から別の言語に翻訳するように活用した本発明の検索方法の一実施形態を示す。翻訳を行う際に別の言語の対応する単語を検索するという意味で、言語翻訳は検索に類似している。ここで、段階300では、ユーザ、ソフトウェア、インターネットブラウザまたは検索エンジンソフトウェアを、外国語のテキストを含むウェブページに進入させる。いくつかの実施形態では、外国語のウェブページに進入するプロセスは、ユーザの目に見えない状態で行うことができ、すなわち、本実施形態では、進入するウェブページは、それを要求しているユーザには示されない。
段階310では、段階300で進入したウェブページのテキストが本発明のコンピュータシステムによって認識される。好ましくは、段階310では、テキストがここで使用されているヨーロッパのアルファベットとは異なる文字群、例えば、中国語、日本語、韓国語、タイ語、キリル文字、ギリシャ語、インドネシア語、ウルドゥー語もしくはヒンディー語などの任意のインドのアルファベットなどを有する場合であっても、任意の言語で認識される。本発明に係るいくつかの実施形態では、ラテン語またはエジプトの象形文字などの、もはや使用されていない言語も認識することができる。
いくつかのウェブページには、原文のデータがテキストの形態で格納されておらず、テキストは画像中にあり、その画像がウェブページ上にある。本発明によれば、文字認識、例えば、OCR(オブジェクト文字認識)または類似した認識アルゴリズムによって画像データからテキストを認識する。
段階320では、外国語のテキストを、ユーザの好ましい言語の同義語拡張したテキスト群に翻訳する。例えば、ウェブページが「箱を船で送る方法」という文を含み、ユーザが、母国語または最良の言語あるいは選択した任意の言語であり、自分の好ましい言語としてフィンランド語を使用する場合、翻訳された同義語拡張した群としては、例えば、「Kuinka rahdata laatikko laivalla」、「Kuinka
lahettaa laatikko」、「Milla keinoin lahettaa paketti」などを挙げることができる。
ここでは、本発明のいくつかの実施形態では、本発明の翻訳システムは、コンマ間、コンマとピリオドの間またはピリオド間のテキスト、あるいは、ある長さの言葉(例えば10個の言葉)のブロックとしてテキスト群を定義する。
段階330では、同義語拡張したテキスト群の結果を、文脈上の関連性に基づいてランク付けする。ウェブページ上にテキスト群が1つのみである場合、文脈上最も関連性の高いテキスト群が、ユーザの好ましい言語または母国語の翻訳としてユーザに示される。いくつかの実施形態では、その翻訳は、ユーザのコンピュータ上の異なるアプリケーションおよび/またはインターネットブラウザウィンドウに示される。いくつかの実施形態では、インターネットブラウザは、翻訳されたテキストをウェブページ上の同じ場所に示し、すなわち、それにより、異なる言語であること以外は元のウェブページと同じに見える異なる言語の『仮想ウェブページ』を生成する。文脈によるランク付けを行うために必要な文脈データは、本出願に説明されている他の実施形態と同様に得ることができる。
ウェブページ上に2つ以上のテキスト群がある場合、段階340では、翻訳されたテキスト群の結果の組み合わせをそれらの文脈上の関連性に基づいてランク付けする。文脈上の関連性は、例えば、異なる翻訳されたテキスト群がいかに十分に適合しているか、すなわち、その翻訳が組み合わせで意味をなすかに基づいて推定することができる。
翻訳の文脈によるランク付けは、段階130に関連して述べられている任意の方法によって行うことができる。例えば、文をいくつかの同義語拡張した翻訳結果に翻訳する。次いで、同義語拡張した翻訳結果を、テキスト中の他の文との類似性について比較する。典型的には、人間が作ったテキストの段落は、テキスト全体にわたって同じまたは非常に類似した用語を使用させる先行詞などを特徴とする。本発明の好ましい実施形態では、少なくとも1つの周囲の文に文脈上最も類似している翻訳結果、あるいは周囲の言葉に最も類似している翻訳結果中の言葉が翻訳として選択される。その最も単純な実施形態では、少なくとも1つの他の単一の言葉に対するその文脈上の類似性に基づいて、翻訳語を選択することができる。
非常に明らかなように、本発明に係る段階130に関連して説明されている任意の方法によって、翻訳結果を文脈によりランク付けすることができる。ランク付けが達成されると、典型的には、文脈上最高位にランク付けされている翻訳が、本発明に係る最終的な翻訳としてユーザに提供される。
異なる検索語および/または文脈用語は異なる重みを有していてもよく、その重みは、ユーザまたは本システムによって割り当てられるか、ネットワークから更新されるか、あるいは、本発明に従ってコンピュータに予めプログラムされ得ることを理解されたい。
文脈用語は、単に平易な言葉または数ではなく、関数であってもよく、例えば、文脈用語は、日付、時間、位置などの関数形式で取得することができ、すなわち、文脈用語は、平易な意味を超える関数または条件付きとすることができることも理解されたい。
段階130での説明と同様に、本発明によれば、翻訳語を、文脈用語、文脈用語オントロジおよび/または文脈オントロジに対して比較することができる。本発明のいくつかの実施形態では、翻訳語のオントロジを、文脈用語、文脈用語オントロジおよび/または文脈オントロジに対して比較してもよい。段階130で説明した実施形態と同様に、翻訳された単語群および/または文を、本発明に係る文脈用語、文脈用語オントロジおよび/または文脈オントロジに対して比較することができる。典型的には、文脈用語、文脈用語オントロジおよび/または文脈オントロジとの類似性が最も高い翻訳結果を、文脈によるランク付けで最高位にランク付けし、本発明に係る翻訳として選択する。
段階130での説明と同様に、意味的関連性を使用することもできる。本発明のいくつかの実施形態では、典型的に、少なくとも1つの文脈用語および/または複数の文脈用語に対して最大の意味論的経路の重みを有する翻訳結果を、文脈によるランク付けによる翻訳として選択する。例えば、異なる文法規則を経路の重みによって実施することができる。文が文の述語であると思われる動詞の前に主語を有する場合、その後に続く少なくとも1つの名詞は、動詞の目的語である可能性が高い。従って、目的語の状態にある名詞は、その文ではより高い経路の重みを有する。非常に明らかなように、文法規則を、本発明に係る他の文脈によるランク付け技術によって活用することもできる。本発明の一実施形態では、基本的な文法規則は、単語のオントロジにプログラムされるように構成されている。
また、文脈上の関連性は、文脈フォルダ内のデータに基づくものとすることができる。すなわち、所望の漁具の大部分を製造している典型的にスウェーデンの店で漁具を探しているフィンランド人のユーザは、例えば、画像、テキストまたは文書ファイルとして、例えば、フィンランドの漁業許可証を文脈フォルダ内に置くことができる。インターネットブラウザおよび/または検索プログラムは、文脈フォルダ内のデータを分析することによって、その時の全体的な文脈が漁業であることを検出する。フィンランド人のユーザが、ルアー、ネット、釣竿などの製品説明をスウェーデン語で行っているスウェーデン語のウェブページの閲覧を開始すると、インターネットブラウザはスウェーデン語をフィンランド語に翻訳し、フィンランド人の顧客は、自分のブラウザで翻訳された『仮想的な』ウェブページを読むことができる。
文脈によるランクが最も高いテキスト群の組み合わせを、別のウィンドウのウェブページおよび/または元のテキストがあった同じ場所のウェブページ(すなわち、翻訳された言語で仮想的なウェブページが生成されている)上に段階350での翻訳としてユーザに表示する。
従って、ウェブページを定義された言語に翻訳し、所望の言語で外国語のウェブページを示すインターネットブラウザまたは検索エンジンは本発明に係るものである。
また、本発明によれば、本発明の翻訳ソフトウェアがウェブページ上で動作するにつれて、任意の好ましい言語のウェブページの中身全体が増加する。これらのウェブページのいくつかを、本発明に係る検索エンジンによってインデックス付けするか、さらに格納してもよい。当然のことながら、ここで、これらの翻訳されたウェブページを、本発明に従って、検索、通常の検索または上述した本発明の検索方法を用いた検索にかけることができる。
非常に明らかなように、本発明を使用して、任意の文書をある言語から別の言語に翻訳することができる。本発明の使用は、ウェブ閲覧に限定されない。
方法30の任意の特徴、段階または部分を、本発明に係る実施形態10、20、40で自由に置き換えることができ、また、それらと組み合わせることができる点に留意されたい。
図4は、異なるカテゴリの入力に適した本発明に係る検索/翻訳の実施形態40を示す。段階400では、ユーザは、典型的には、ユーザの好ましい言語、母国語またはユーザが最も知っている言語である基本言語で少なくとも1つの言葉を発する。実際には、本発明によれば、基本言語は任意の言語とすることができる。段階410では、音声認識によって発せられた言葉を識別し、それらをテキストに変換する。いくつかの実施形態では、音声に画像データを追加し、かつ/または音声を画像データで置き換えることができ、画像データから、パターン認識および/または文字認識によってテキストを抽出する。いくつかの実施形態では、画像および音声データを組み合わせで認識することもでき、例えば、ビデオカメラによって音声および画像を記録し、音声および/または音認識を使用して、音から言葉を識別することができ、パターン認識および/または文字認識を使用して、画像フォーマット中のテキスト、すなわち画像同等物(「ボール」と識別されるボールの画像を有する言葉)を認識することができる。上述の方法および他の方法で、視聴覚データをテキストに変換することができる。このテキストを、本発明に従って別の言語に翻訳することもできる。例えば、自然言語の英語で変換されたテキストを、本発明に従って、フランス語の自然言語に翻訳することができる。
段階420では、本出願のどこかに説明されているように、視聴覚データから抽出されたテキストは、所望の標的言語で拡張した同義語である。異なるテキスト群を異なる同義語拡張によって拡張する。ここで、入力データが様々なソースから到着すると、全てのテキストを、本発明に従って1つのテキスト群として同義語拡張することができるが、入力テキストをテキスト群に分割することがより好ましい場合もある。どのような声がその言葉を発したということおよび他の要因に基づいて、音声認識によって引き出されたテキストを別々にソートすることができる。本発明の例示的な実施形態では、本コンピュータシステムは、誰が話しているのかを識別することができる。ある声を有する音声認識された言葉を、10個またはそれ以上もしくはそれ以下の数の言葉のブロックで認識することができ、また、本発明によれば、例えば息つぎと息つぎの間の単語群を、異なるテキスト群として認識することができる。画像データからパターン認識された言葉を、例えば、テキスト群として同義語拡張することができる個々の単語または単語群として識別することができる。異なる種類の視聴覚データから抽出された言葉を組み合わせることも本発明に係るものである。
実際には、本発明に係る同義語拡張または文脈によるランク付けを伴わないパターン/文字認識による視聴覚データからの言葉のテキスト抽出は、それ自体で十分に進歩性のある実施形態である。
但し、本発明によれば、認識されたパターン/文字は、本発明に係る同義語(おそらくは多くの同義語)を有することが可能である。例えば、「C」のような形状のパターンは、ヨーロッパのアルファベットの「C」という文字である可能性は高いが、絵の中の競技場または競輪場の半分部分である可能性もある。この場合、「半分の競輪場」、「半分の競技場」および「C」が同義語となる。これは、本発明に係る字体に基づく言語から自然言語への翻訳である。本発明によれば、視聴覚データからの翻訳は、それ自体で十分に進歩性があるため、いくつかの実施形態では、文脈によるランク付けまたは同義語拡張を使用しなくてもよい。本発明によれば、同義語拡張または文脈によるランク付けのみを本発明に従って個々に使用することも可能である。但し、いくつかの実施形態では、同義語拡張および文脈によるランク付けの両方を使用することが好ましく、いくつかの実施形態では、文脈によるランク付けを同義語拡張した翻訳テキスト群候補のみに対して行うことがさらにより好ましい。
段階430では、翻訳されたテキスト群または元から基本言語であり翻訳の必要のなかったそれらの群を、文脈上の関連性に基づいてランク付けする。
次いで、段階440では、翻訳されたテキスト群の組み合わせを文脈上の関連性に基づいてランク付けする。
文脈によるランクが最も高い組み合わせを、テキストの翻訳および/または抽出としてユーザに対して再生する。段階450では、スピーカからの声として、スクリーン上の画像および/または映画フィルムとして、および/またはユーザの基本言語でその2つを組み合わせたビデオとして言葉を再生することによって、再生を行うことができる。
本発明のいくつかの実施形態では、自然言語間に翻訳機能を使用しないことが可能である(例えば、英語の交通標識を英語のテキスト、次いで音声に翻訳する)。有用な実施形態は、例えば、交通標識が録画および/または撮影されるとそれらを運転者に読み出す車カメラおよびコンピュータである。本発明によれば、ユーザはテキスト抽出機能(すなわち、パターン、文字、画像、声をテキスト言葉に翻訳する機能)のみを動作させることができる。本発明のいくつかの実施形態では、本発明の同義語拡張/文脈によるランク付け技術によって、データに対応する抽出されたテキスト言葉を検索する。
従って、本発明によって、インターネットの中あるいは、ビデオに録画し、そのデータのテキスト翻訳が得られる我々を囲む周囲の世界の視聴覚データから、テキストの物語を抽出することができる。
本発明の単純な一実施形態を、同義語拡張/文脈によるランク技術を用いて、例えば、英語の音声をフランス語のスピーカ放送に翻訳する携帯機器の中に実現することができる。
但し、異なる媒体型からデータを得ることができることで、特に文脈に基づくランク付けを非常に向上させる。例えば、ユーザがフィンランドの港で携帯を持っているとする。ユーザは、港の写真を撮ったところである。パターン認識は、画像から「海」および「船」という言葉を認識し、その画像は、偶発的に携帯機器の文脈フォルダ(文脈データソースとしての機能を果たす)に保存された。ここでは、郵便局を探しているのではなく、いくつかの目的地に向かう実際の船に箱を乗せることを試みていることが文脈上明らかであるため、「箱を船で送る方法」は、他の選択肢の代わりに、フィンランド語の「Kuinka rahdata laatikko laivalla」に翻訳される。
本発明に係る言語音声変換装置の文脈フォルダ内のテキスト文書を使用することも本発明に係るものである。
方法40の任意の特徴、段階または部分を、本発明に係る実施形態10、20、30で自由に置き換えることができ、また、それらと組み合わせることができる点に留意されたい。
以上、上記実施形態を参照しながら本発明について説明し、いくつかの商業上および産業上の利点を示してきた。本発明の方法および構成によって、本発明の同義語拡張/その同義語拡張した単語群に対する文脈によるランク付け技術に基づいて、関連する文書を見つけ出すことができる。同じ技術によって、インターネットまたは文書のある自然言語から別の言語、あるいは画像言語および音声の組み合わせからテキストまたは音声の形態の自然言語へのより正確な翻訳が得られる。
以上、上記実施形態を参照しながら本発明について説明してきた。但し、本発明がこれらの実施形態のみに限定されるものではなく、本発明の考えおよび以下の特許請求の範囲の趣旨および範囲内の全ての可能な実施形態を含むことは明らかである。
参考文献
WO 2009/002864
A2, Reizler, Stefan, Vasserman, Alexander, I. "Machine translation for
query expansion".
"Desktop
Search - How Contextual Information Influences Search Results and
Rankings" Raluca Paiu and Wolfgang Nejdl.
"Context-Aware
Semantic Association Ranking" Aleman-Meza Boanerges, Halaschek Chris,
Arpinar I. Budak and Sheth Amit.
"Activity
Based Metadata for Semantic Desktop Search" - Proceedings of the 2nd
European Semantic Web Conference, Heraklion, Greece, May 2005, P. Chirita, R.
Gavriloaie, S. Ghita, W. Nejdl and R. Paiu.

Claims (14)

  1. − 少なくとも1つの検索語を含む検索クエリを受信する工程と、
    − 少なくとも1つの検索語に対して少なくとも1つの同義語を引き出す工程と、
    − 前記受信した検索クエリを前記少なくとも1つの同義語で拡張する工程と、
    − 少なくとも1つの前記拡張した検索クエリを用いて少なくとも1つの文書を検索する工程と、
    − 少なくとも1つの前記拡張したクエリによって得られた検索結果を取り出す工程と、
    − 少なくとも1つの検索語が出現する文脈に基づいて、前記同義語拡張した検索結果をランク付けする工程と、
    を特徴とするコンピュータで実施される方法。
  2. 前記文脈は、ユーザの過去の検索、前記ユーザのコンピュータ上のデータおよび/または一般的な統計から利用可能なデータから引き出されることを特徴とする、請求項1に記載のコンピュータで実施される方法。
  3. 少なくとも1つのコンピュータを含む構成であって、
    − 少なくとも1つの検索語を含む検索クエリが受信されるように構成されていること、
    − 少なくとも1つの検索語に対して少なくとも1つの同義語が引き出されるように構成されていること、
    − 前記受信した検索クエリが前記少なくとも1つの同義語で拡張されるように構成されていること、
    − 少なくとも1つの文書が少なくとも1つの前記拡張した検索クエリを用いて検索されるように構成されていること、
    − 少なくとも1つの前記拡張したクエリによって得られた検索結果が取り出されるように構成されていること、
    − 前記同義語拡張した検索結果が、少なくとも1つの検索語が出現する文脈に基づいてランク付けされるように構成されていること、
    を特徴とする構成。
  4. 請求項1に記載の方法を実行することができるソフトウェアを含む記憶装置。
  5. 少なくとも1つのコンピュータを含み、テキストをある言語から別の言語に翻訳するためのコンピュータで実施される方法であって、
    − 少なくとも1つの翻訳される用語を含む翻訳クエリを受信する工程と、
    − 少なくとも1つの翻訳される用語の少なくとも1つの同義語を引き出す工程と、
    − 前記受信した翻訳クエリを前記少なくとも1つの同義語で拡張する工程と、
    − 少なくとも1つの前記拡張した翻訳クエリによって得られた翻訳結果を取り出す工程と、
    − 少なくとも1つの翻訳される用語が出現する文脈に基づいて、前記同義語拡張した翻訳結果をランク付けする工程と、
    を特徴とするコンピュータで実施される方法。
  6. 前記翻訳クエリは、翻訳のための入力として自動的に読み込まれるか画像および/または音などの視聴覚データから分析された文または段落であることを特徴とする、請求項5に記載のテキストを翻訳するためのコンピュータで実施される方法。
  7. 前記出現する文脈は、前記翻訳クエリに先行および/または後続する文および/または段落から引き出されたことを特徴とする、請求項5に記載のテキストを翻訳するためのコンピュータで実施される方法。
  8. 少なくとも1つのコンピュータを含み、テキストをある言語から別の言語に翻訳するためにコンピュータで実施される構成であって、
    − 少なくとも1つの翻訳される用語を含む少なくとも1つの翻訳クエリが受信されるように構成されていること、
    − 少なくとも1つの翻訳される用語の少なくとも1つの同義語が引き出されるように構成されていること、
    − 前記受信された翻訳クエリが前記少なくとも1つの同義語で拡張されるように構成されていること、
    − 少なくとも1つの前記拡張した翻訳クエリによって得られた翻訳結果が取り出されるように構成されていること、
    − 前記同義語拡張した翻訳結果が、少なくとも1つの翻訳される用語が出現する文脈に基づいてランク付けされるように構成されていること、
    を特徴とする構成。
  9. 請求項5に記載の方法を実行することができるソフトウェアを含む記憶装置。
  10. ファイルシステムの専用部分からデータを読み込んで、検索および/または翻訳のための文脈データを抽出するように構成されていることを特徴とするソフトウェアを含む記憶装置。
  11. ユーザのインターネットブラウザ、オペレーティングシステム、ファイルシステム、データベースソフトウェアおよび/またはアプリケーションから引き出された文脈データに基づいて、同義語拡張した検索結果をランク付けするように構成されていることを特徴とする検索エンジンソフトウェア。
  12. ユーザのインターネットブラウザ、オペレーティングシステム、ファイルシステム、データベースソフトウェアおよび/またはアプリケーションから引き出された文脈データに基づいて、同義語拡張した検索結果をランク付けするように構成されていることを特徴とするオペレーティングシステムソフトウェア。
  13. ユーザのインターネットブラウザ、オペレーティングシステム、ファイルシステム、データベースソフトウェアおよび/またはアプリケーションから引き出された文脈データに基づいて、同義語拡張した検索結果をランク付けするように構成されていることを特徴とするソフトウェアアプリケーション。
  14. ユーザのインターネットブラウザ、オペレーティングシステム、ファイルシステム、データベースソフトウェアおよび/またはアプリケーションから引き出された文脈データに基づいて、同義語拡張した検索結果をランク付けするように構成されていることを特徴とするデータベースソフトウェア。
JP2012525129A 2009-08-21 2010-08-10 データ検索および言語翻訳のための方法および手段 Pending JP2013502631A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP09168388A EP2341450A1 (en) 2009-08-21 2009-08-21 Method and means for data searching and language translation
EP09168388.8 2009-08-21
US12/758,258 US20110047149A1 (en) 2009-08-21 2010-04-12 Method and means for data searching and language translation
US12/758,258 2010-04-12
PCT/EP2010/061611 WO2011020742A1 (en) 2009-08-21 2010-08-10 Method and means for data searching and language translation

Publications (1)

Publication Number Publication Date
JP2013502631A true JP2013502631A (ja) 2013-01-24

Family

ID=41361190

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012525129A Pending JP2013502631A (ja) 2009-08-21 2010-08-10 データ検索および言語翻訳のための方法および手段

Country Status (7)

Country Link
US (3) US20110047149A1 (ja)
EP (3) EP2341450A1 (ja)
JP (1) JP2013502631A (ja)
CN (1) CN102483757A (ja)
AU (1) AU2010285122A1 (ja)
CA (1) CA2770563A1 (ja)
WO (1) WO2011020742A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020034897A (ja) * 2018-08-02 2020-03-05 サウンドハウンド,インコーポレイテッド 自然言語会話に関連する情報の視覚的提示

Families Citing this family (192)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US8464150B2 (en) * 2008-06-07 2013-06-11 Apple Inc. Automatic language identification for dynamic text processing
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
EP2341450A1 (en) 2009-08-21 2011-07-06 Mikko Kalervo Väänänen Method and means for data searching and language translation
US10002198B2 (en) * 2009-10-28 2018-06-19 Verizon Patent And Licensing Inc. Mobile taxi dispatch system
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8903794B2 (en) 2010-02-05 2014-12-02 Microsoft Corporation Generating and presenting lateral concepts
US8150859B2 (en) 2010-02-05 2012-04-03 Microsoft Corporation Semantic table of contents for search results
US8983989B2 (en) 2010-02-05 2015-03-17 Microsoft Technology Licensing, Llc Contextual queries
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US20110302149A1 (en) * 2010-06-07 2011-12-08 Microsoft Corporation Identifying dominant concepts across multiple sources
US10061850B1 (en) * 2010-07-27 2018-08-28 Google Llc Using recent queries for inserting relevant search results for navigational queries
US20120047247A1 (en) * 2010-08-18 2012-02-23 Openwave Systems Inc. System and method for allowing data traffic search
US9710429B1 (en) * 2010-11-12 2017-07-18 Google Inc. Providing text resources updated with translation input from multiple users
US20120215533A1 (en) * 2011-01-26 2012-08-23 Veveo, Inc. Method of and System for Error Correction in Multiple Input Modality Search Engines
US8527483B2 (en) 2011-02-04 2013-09-03 Mikko VÄÄNÄNEN Method and means for browsing by walking
CN102650986A (zh) * 2011-02-27 2012-08-29 孙星明 一种用于文本复制检测的同义词扩展方法及装置
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US9183199B2 (en) * 2011-03-25 2015-11-10 Ming-Yuan Wu Communication device for multiple language translation system
US9760566B2 (en) 2011-03-31 2017-09-12 Microsoft Technology Licensing, Llc Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof
US10642934B2 (en) 2011-03-31 2020-05-05 Microsoft Technology Licensing, Llc Augmented conversational understanding architecture
US9842168B2 (en) * 2011-03-31 2017-12-12 Microsoft Technology Licensing, Llc Task driven user intents
CN102737021B (zh) * 2011-03-31 2014-10-22 北京百度网讯科技有限公司 搜索引擎及其实现方法
US9183294B2 (en) * 2011-04-08 2015-11-10 Siemens Aktiengesellschaft Meta-data approach to querying multiple biomedical ontologies
US9064006B2 (en) 2012-08-23 2015-06-23 Microsoft Technology Licensing, Llc Translating natural language utterances to keyword search queries
US8972240B2 (en) * 2011-05-19 2015-03-03 Microsoft Corporation User-modifiable word lattice display for editing documents and search queries
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US9129606B2 (en) * 2011-09-23 2015-09-08 Microsoft Technology Licensing, Llc User query history expansion for improving language model adaptation
US8386477B1 (en) 2011-11-30 2013-02-26 Google Inc. System and method for determining user language intent
KR20130082617A (ko) * 2011-12-12 2013-07-22 에스케이플래닛 주식회사 어플리케이션 마켓 확장 검색 장치 및 방법
US20130218876A1 (en) * 2012-02-22 2013-08-22 Nokia Corporation Method and apparatus for enhancing context intelligence in random index based system
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
WO2013154947A1 (en) 2012-04-09 2013-10-17 Vivek Ventures, LLC Clustered information processing and searching with structured-unstructured database bridge
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9218333B2 (en) * 2012-08-31 2015-12-22 Microsoft Technology Licensing, Llc Context sensitive auto-correction
US10127271B2 (en) * 2012-09-06 2018-11-13 Koninklijke Philips N.V. Generating a query
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
GB201300031D0 (en) * 2013-01-02 2013-02-13 Canonical Ltd Ubuntu UX innovations
CN113470640B (zh) 2013-02-07 2022-04-26 苹果公司 数字助理的语音触发器
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
WO2014146032A2 (en) * 2013-03-15 2014-09-18 Suarez Sergio David Jr System for method for data sweeping using keywords
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
WO2014200728A1 (en) 2013-06-09 2014-12-18 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
WO2015020942A1 (en) 2013-08-06 2015-02-12 Apple Inc. Auto-activating smart responses based on activities from remote devices
KR101491843B1 (ko) * 2013-11-13 2015-02-11 네이버 주식회사 대화 기반 검색 도우미 시스템 및 그 방법
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US20150169285A1 (en) * 2013-12-18 2015-06-18 Microsoft Corporation Intent-based user experience
CN103744841A (zh) * 2013-12-23 2014-04-23 武汉传神信息技术有限公司 一种信息碎片的翻译方法及系统
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
EP3480811A1 (en) 2014-05-30 2019-05-08 Apple Inc. Multi-command single utterance input method
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20160371342A1 (en) * 2015-06-19 2016-12-22 Lenovo (Singapore) Pte. Ltd. Adapting search queries using a specific result
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
KR102407630B1 (ko) * 2015-09-08 2022-06-10 삼성전자주식회사 서버, 사용자 단말 및 이들의 제어 방법.
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9864598B2 (en) 2015-09-18 2018-01-09 ReactiveCore LLC System and method for providing supplemental functionalities to a computer program
US11157260B2 (en) 2015-09-18 2021-10-26 ReactiveCore LLC Efficient information storage and retrieval using subgraphs
US9372684B1 (en) * 2015-09-18 2016-06-21 ReactiveCore LLC System and method for providing supplemental functionalities to a computer program via an ontology instance
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
CN106202286B (zh) * 2016-06-30 2019-11-01 北京奇虎科技有限公司 基于自然搜索结果提供实体词的搜索方法及装置
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10297254B2 (en) 2016-10-03 2019-05-21 Google Llc Task initiation using long-tail voice commands by weighting strength of association of the tasks and their respective commands based on user feedback
US10534645B2 (en) * 2016-11-23 2020-01-14 Wipro Limited Method and system for executing processes in a virtual storage area network
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
TWI645303B (zh) * 2016-12-21 2018-12-21 財團法人工業技術研究院 字串驗證方法、字串擴充方法與驗證模型訓練方法
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11138208B2 (en) * 2016-12-30 2021-10-05 Microsoft Technology Licensing, Llc Contextual insight system
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US9965798B1 (en) 2017-01-31 2018-05-08 Mikko Vaananen Self-shopping refrigerator
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770428A1 (en) 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
CN109213777A (zh) * 2017-06-29 2019-01-15 杭州九阳小家电有限公司 一种基于语音的食谱处理方法及系统
US10901811B2 (en) 2017-07-31 2021-01-26 Splunk Inc. Creating alerts associated with a data storage system based on natural language requests
US20190034555A1 (en) * 2017-07-31 2019-01-31 Splunk Inc. Translating a natural language request to a domain specific language request based on multiple interpretation algorithms
US11494395B2 (en) 2017-07-31 2022-11-08 Splunk Inc. Creating dashboards for viewing data in a data storage system based on natural language requests
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10885619B2 (en) * 2017-10-17 2021-01-05 Photo Butler, Inc. Context-based imagery selection
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US10944859B2 (en) 2018-06-03 2021-03-09 Apple Inc. Accelerated task performance
CN108932218B (zh) * 2018-06-29 2022-09-30 北京百度网讯科技有限公司 一种实例扩展方法、装置、设备和介质
CN108920473B (zh) * 2018-07-04 2022-08-09 中译语通科技股份有限公司 一种基于同类词与同义词替换的数据增强机器翻译方法
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11315082B2 (en) 2019-04-17 2022-04-26 Mikko Vaananen Mobile secretary meeting scheduler
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
DK201970511A1 (en) 2019-05-31 2021-02-15 Apple Inc Voice identification in digital assistant systems
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
US11183193B1 (en) 2020-05-11 2021-11-23 Apple Inc. Digital assistant hardware abstraction
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
CN112256822A (zh) * 2020-10-21 2021-01-22 平安科技(深圳)有限公司 文本搜索方法、装置、计算机设备和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008204416A (ja) * 2007-02-19 2008-09-04 Yasuhiro Yamazaki 高度情報収得システム

Family Cites Families (102)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5579471A (en) * 1992-11-09 1996-11-26 International Business Machines Corporation Image query system and method
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US6026388A (en) * 1995-08-16 2000-02-15 Textwise, Llc User interface and other enhancements for natural language information retrieval system and method
JP3181548B2 (ja) * 1998-02-03 2001-07-03 富士通株式会社 情報検索装置及び情報検索方法
DE19842176A1 (de) * 1998-09-15 2000-03-16 Bosch Gmbh Robert Verfahren und Vorrichtung zur Verkehrszeichenerkennung und Navigation
US6266442B1 (en) * 1998-10-23 2001-07-24 Facet Technology Corp. Method and apparatus for identifying objects depicted in a videostream
US6314398B1 (en) 1999-03-01 2001-11-06 Matsushita Electric Industrial Co., Ltd. Apparatus and method using speech understanding for automatic channel selection in interactive television
US6643620B1 (en) 1999-03-15 2003-11-04 Matsushita Electric Industrial Co., Ltd. Voice activated controller for recording and retrieving audio/video programs
US6446064B1 (en) 1999-06-08 2002-09-03 Albert Holding Sa System and method for enhancing e-commerce using natural language interface for searching database
US6598039B1 (en) 1999-06-08 2003-07-22 Albert-Inc. S.A. Natural language interface for searching database
US6813395B1 (en) 1999-07-14 2004-11-02 Fuji Photo Film Co., Ltd. Image searching method and image processing method
US7725307B2 (en) * 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US7450734B2 (en) 2000-01-13 2008-11-11 Digimarc Corporation Digital asset management, targeted searching and desktop searching using digital watermarks
EP1170677B1 (en) * 2000-07-04 2009-03-18 International Business Machines Corporation Method and system of weighted context feedback for result improvement in information retrieval
AU2001288469A1 (en) * 2000-08-28 2002-03-13 Emotion, Inc. Method and apparatus for digital media management, retrieval, and collaboration
US6748375B1 (en) 2000-09-07 2004-06-08 Microsoft Corporation System and method for content retrieval
US6885869B2 (en) * 2001-01-26 2005-04-26 Ericsson Inc. Method for mating a mobile terminal with a cordless phone system
ES2236483T3 (es) * 2001-02-28 2005-07-16 Voice-Insight Sistema de consulta de lenguaje natural para acceder a un sistema de informacion.
US7860706B2 (en) * 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
US20050108200A1 (en) * 2001-07-04 2005-05-19 Frank Meik Category based, extensible and interactive system for document retrieval
US7668718B2 (en) 2001-07-17 2010-02-23 Custom Speech Usa, Inc. Synchronized pattern recognition source data processed by manual or automatic means for creation of shared speaker-dependent speech user profile
US6778979B2 (en) * 2001-08-13 2004-08-17 Xerox Corporation System for automatically generating queries
US20030120478A1 (en) * 2001-12-21 2003-06-26 Robert Palmquist Network-based translation system
US7421660B2 (en) * 2003-02-04 2008-09-02 Cataphora, Inc. Method and apparatus to visually present discussions for data mining purposes
US20030164819A1 (en) * 2002-03-04 2003-09-04 Alex Waibel Portable object identification and translation system
JP2004005364A (ja) * 2002-04-03 2004-01-08 Fuji Photo Film Co Ltd 類似画像検索システム
ATE330287T1 (de) * 2002-04-12 2006-07-15 Targit As Verfahren zur verarbeitung von mehrsprachigen abfragen
US20090254510A1 (en) * 2006-07-27 2009-10-08 Nosa Omoigui Information nervous system
US20040209515A1 (en) 2003-04-03 2004-10-21 Caveney Jack E. High density patch panel
US7496230B2 (en) * 2003-06-05 2009-02-24 International Business Machines Corporation System and method for automatic natural language translation of embedded text regions in images during information transfer
US7400785B2 (en) * 2003-08-13 2008-07-15 Hewlett-Packard Development Company, L.P. Systems and methods for associating images
WO2005020091A1 (en) * 2003-08-21 2005-03-03 Idilia Inc. System and method for processing text utilizing a suite of disambiguation techniques
US20050073436A1 (en) * 2003-08-22 2005-04-07 Negreiro Manuel I. Method and system for alerting a patrol officer of a wanted vehicle
US20060047649A1 (en) * 2003-12-29 2006-03-02 Ping Liang Internet and computer information retrieval and mining with intelligent conceptual filtering, visualization and automation
US20050149498A1 (en) * 2003-12-31 2005-07-07 Stephen Lawrence Methods and systems for improving a search ranking using article information
US7707039B2 (en) * 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US7565139B2 (en) * 2004-02-20 2009-07-21 Google Inc. Image-based search engine for mobile phones with camera
US7751805B2 (en) * 2004-02-20 2010-07-06 Google Inc. Mobile image-based information retrieval system
US8873890B2 (en) * 2004-04-02 2014-10-28 K-Nfb Reading Technology, Inc. Image resizing for optical character recognition in portable reading machine
US8036895B2 (en) * 2004-04-02 2011-10-11 K-Nfb Reading Technology, Inc. Cooperative processing for portable reading machine
US7707218B2 (en) * 2004-04-16 2010-04-27 Mobot, Inc. Mobile query system and method based on visual cues
KR100462542B1 (ko) * 2004-05-27 2004-12-17 엔에이치엔(주) 신뢰성 있는 컨텐츠를 제공하는 컨텐츠 검색 시스템 및 그방법
US8953908B2 (en) 2004-06-22 2015-02-10 Digimarc Corporation Metadata management and generation using perceptual features
US9058388B2 (en) 2004-06-22 2015-06-16 Digimarc Corporation Internet and database searching with handheld devices
JP5372369B2 (ja) 2004-06-22 2013-12-18 ディジマーク コーポレイション デジタル資産管理、ターゲットを定めたサーチ、及びデジタル透かしを使用するデスクトップサーチ
US7720674B2 (en) * 2004-06-29 2010-05-18 Sap Ag Systems and methods for processing natural language queries
US7293017B2 (en) 2004-07-01 2007-11-06 Microsoft Corporation Presentation-level content filtering for a search result
JP4346084B2 (ja) 2004-07-06 2009-10-14 東洋ゴム工業株式会社 タイヤ成型用金型
US7853574B2 (en) * 2004-08-26 2010-12-14 International Business Machines Corporation Method of generating a context-inferenced search query and of sorting a result of the query
US7873911B2 (en) * 2004-08-31 2011-01-18 Gopalakrishnan Kumar C Methods for providing information services related to visual imagery
US8489583B2 (en) * 2004-10-01 2013-07-16 Ricoh Company, Ltd. Techniques for retrieving documents using an image capture device
GB2419208A (en) 2004-10-18 2006-04-19 Qinetiq Ltd Optical correlation employing an optical bit delay
US20060176516A1 (en) * 2004-11-29 2006-08-10 Rothschild Trust Holdings, Llc System and method for embedding and retrieving information in digital images and using the information to copyright the digital images
US7450163B2 (en) * 2004-11-29 2008-11-11 Rothschild Trust Holdings, Llc Device and method for embedding and retrieving information in digital images
US20120113273A1 (en) 2004-11-29 2012-05-10 Ariel Inventions Llc System, Method, and Devices for Searching for a Digital Image over a Communication Network
US7475092B2 (en) * 2004-11-29 2009-01-06 Rothschild Trust Holdings, Llc System and method for embedding symbology in digital images and using the symbology to organize and control the digital images
US7873654B2 (en) * 2005-01-24 2011-01-18 The Intellection Group, Inc. Multimodal natural language query system for processing and analyzing voice and proximity-based queries
US7565345B2 (en) * 2005-03-29 2009-07-21 Google Inc. Integration of multiple query revision models
US7636714B1 (en) * 2005-03-31 2009-12-22 Google Inc. Determining query term synonyms within query context
US7765231B2 (en) * 2005-04-08 2010-07-27 Rathus Spencer A System and method for accessing electronic data via an image search engine
US7809722B2 (en) 2005-05-09 2010-10-05 Like.Com System and method for enabling search and retrieval from image files based on recognized information
US7760917B2 (en) * 2005-05-09 2010-07-20 Like.Com Computer-implemented method for performing similarity searches
US7945099B2 (en) * 2005-05-09 2011-05-17 Like.Com System and method for use of images with recognition analysis
US20080009268A1 (en) * 2005-09-14 2008-01-10 Jorey Ramer Authorized mobile content search results
US20070133947A1 (en) 2005-10-28 2007-06-14 William Armitage Systems and methods for image search
US8208764B2 (en) * 2006-01-21 2012-06-26 Elizabeth Guckenberger Photo automatic linking system and method for accessing, linking, and visualizing “key-face” and/or multiple similar facial images along with associated electronic data via a facial image recognition search engine
US7617199B2 (en) * 2006-01-31 2009-11-10 Northwestern University Characterizing context-sensitive search results as non-spam
US7818315B2 (en) * 2006-03-13 2010-10-19 Microsoft Corporation Re-ranking search results based on query log
US20070233806A1 (en) * 2006-03-29 2007-10-04 Mehrzad Asadi Method and system for conducting an internet search using a mobile radio terminal
CN101443759B (zh) * 2006-05-12 2010-08-11 北京乐图在线科技有限公司 多语言信息检索的方法和系统
US7854347B2 (en) 2006-06-02 2010-12-21 Hudson Wang Manual gas inflator
US8631012B2 (en) * 2006-09-29 2014-01-14 A9.Com, Inc. Method and system for identifying and displaying images in response to search queries
US8041730B1 (en) * 2006-10-24 2011-10-18 Google Inc. Using geographic data to identify correlated geographic synonyms
KR100868331B1 (ko) * 2007-02-23 2008-11-11 성균관대학교산학협력단 상황인식을 위한 온톨로지 시스템과 그 온톨로지 관리 방법및 이를 기록한 기록매체
US8861898B2 (en) * 2007-03-16 2014-10-14 Sony Corporation Content image search
US20080240572A1 (en) * 2007-03-26 2008-10-02 Seiko Epson Corporation Image Search Apparatus and Image Search Method
US20080268876A1 (en) * 2007-04-24 2008-10-30 Natasha Gelfand Method, Device, Mobile Terminal, and Computer Program Product for a Point of Interest Based Scheme for Improving Mobile Visual Searching Functionalities
US20080267504A1 (en) * 2007-04-24 2008-10-30 Nokia Corporation Method, device and computer program product for integrating code-based and optical character recognition technologies into a mobile visual search
IL183391A (en) * 2007-05-24 2011-06-30 Peretz Shoval Filtering method based on ontology and content for personal newspapers
US20080306924A1 (en) * 2007-06-05 2008-12-11 Paolini Michael A Mobile telephone object lookup and identification
US9002869B2 (en) 2007-06-22 2015-04-07 Google Inc. Machine translation for query expansion
US20090049132A1 (en) * 2007-08-15 2009-02-19 Moshe Livne Gutovski Device, system, and method of routing electronic mail
TW200910875A (en) * 2007-08-29 2009-03-01 Inventec Appliances Corp Method and system for instantly translating text within an image
KR101434394B1 (ko) * 2007-08-31 2014-08-27 삼성전자주식회사 전화번호를 검색하는 방법 및 휴대단말기
EP2570945A1 (en) 2007-09-21 2013-03-20 Google Inc. Cross-language search
US20090132506A1 (en) * 2007-11-20 2009-05-21 International Business Machines Corporation Methods and apparatus for integration of visual and natural language query interfaces for context-sensitive data exploration
US7961080B2 (en) * 2007-11-29 2011-06-14 International Business Machines Corporation System and method for automotive image capture and retrieval
US20090182622A1 (en) * 2008-01-15 2009-07-16 Agarwal Amit D Enhancing and storing data for recall and use
KR101622360B1 (ko) 2008-06-06 2016-05-19 톰슨 라이센싱 이미지들의 유사성 검색을 위한 시스템 및 방법
US20100030803A1 (en) * 2008-07-30 2010-02-04 Erik Rothenberg Method for generating business intelligence
US20100070488A1 (en) * 2008-09-12 2010-03-18 Nortel Networks Limited Ranking search results based on affinity criteria
US8239359B2 (en) * 2008-09-23 2012-08-07 Disney Enterprises, Inc. System and method for visual search in a video media player
US20100161641A1 (en) * 2008-12-22 2010-06-24 NBC Universal, Inc., a New York Corporation System and method for computerized searching with a community perspective
US8439683B2 (en) * 2009-01-07 2013-05-14 Sri International Food recognition using visual analysis and speech recognition
US10373513B2 (en) * 2009-06-16 2019-08-06 Zen Technologies Limited Motion platform system
US9135277B2 (en) * 2009-08-07 2015-09-15 Google Inc. Architecture for responding to a visual query
EP2341450A1 (en) 2009-08-21 2011-07-06 Mikko Kalervo Väänänen Method and means for data searching and language translation
US8335784B2 (en) * 2009-08-31 2012-12-18 Microsoft Corporation Visual search and three-dimensional results
US8379912B2 (en) * 2010-06-18 2013-02-19 Google Inc. Identifying establishments in images
US20120084323A1 (en) * 2010-10-02 2012-04-05 Microsoft Corporation Geographic text search using image-mined data
US8675957B2 (en) * 2010-11-18 2014-03-18 Ebay, Inc. Image quality assessment to merchandise an item
US20120323967A1 (en) 2011-06-14 2012-12-20 Microsoft Corporation Spelling Using a Fuzzy Pattern Search

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008204416A (ja) * 2007-02-19 2008-09-04 Yasuhiro Yamazaki 高度情報収得システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020034897A (ja) * 2018-08-02 2020-03-05 サウンドハウンド,インコーポレイテッド 自然言語会話に関連する情報の視覚的提示

Also Published As

Publication number Publication date
US20160154810A1 (en) 2016-06-02
EP2341450A1 (en) 2011-07-06
EP2629211A1 (en) 2013-08-21
US9953092B2 (en) 2018-04-24
CN102483757A (zh) 2012-05-30
EP2467792A1 (en) 2012-06-27
AU2010285122A1 (en) 2012-03-08
WO2011020742A1 (en) 2011-02-24
CA2770563A1 (en) 2011-02-24
US20110047149A1 (en) 2011-02-24
US20120143858A1 (en) 2012-06-07

Similar Documents

Publication Publication Date Title
US9953092B2 (en) Method and means for data searching and language translation
US8812300B2 (en) Identifying related names
US8856119B2 (en) Holistic disambiguation for entity name spotting
US9201868B1 (en) System, methods and user interface for identifying and presenting sentiment information
Noruzi Folksonomies: Why do we need controlled vocabulary?
US8874590B2 (en) Apparatus and method for supporting keyword input
US20070175674A1 (en) Systems and methods for ranking terms found in a data product
CN101251844A (zh) 用于检索内容的设备和方法
WO2022052817A1 (zh) 搜索处理方法、装置、终端及存储介质
US20110072023A1 (en) Detect, Index, and Retrieve Term-Group Attributes for Network Search
CN106062791B (zh) 使电子消息的分段与一个或多个分段收信人相关联
US20090307183A1 (en) System and Method for Transmission of Communications by Unique Definition Identifiers
WO2019200699A1 (zh) 政务系统发文方法、装置、计算机设备及存储介质
Shatnawi et al. Verification hadith correctness in islamic web pages using information retrieval techniques
JP5661719B2 (ja) 質問応答装置、方法、及びプログラム
RU2711123C2 (ru) Способ и система компьютерной обработки одной или нескольких цитат в цифровых текстах для определения их автора
Al-Zyoud et al. Arabic stemming techniques: comparisons and new vision
KR100923936B1 (ko) 일본어 사전 서비스에 있어서 2개 단어 이상의 쿼리, 한글쿼리 또는 일반적인 쿼리의 입력 시 검색 결과를 제공하는방법 및 시스템
Renouf Corpus linguistics beyond Google: The WebCorp linguist’s search engine
AU2015244356A1 (en) Augmenting search results
JP2005234772A (ja) 文書管理装置および方法
Byrne 'Pauper Aliens' and'Political Refugees': A Corpus Linguistic Approach to the Language of Migration in Nineteenth-Century Newspapers
KR20130142192A (ko) 통신 네트워크를 통한 비디오 콘텐트 검색들을 위한 보조
Makagonov et al. Computer Analysis of Texts in Social Networks, Its Method and Tools: State-of-the-Art Review
Wagner Berge als Widersacher: Studien zu einem Bergmotiv in der jüdischen Apokalyptik by Peter Juhás

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130611

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130830

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130906

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140225