JP6320637B2 - コンピュータ自然言語処理における見出語と汎用オントロジとのマッピング - Google Patents

コンピュータ自然言語処理における見出語と汎用オントロジとのマッピング Download PDF

Info

Publication number
JP6320637B2
JP6320637B2 JP2017525068A JP2017525068A JP6320637B2 JP 6320637 B2 JP6320637 B2 JP 6320637B2 JP 2017525068 A JP2017525068 A JP 2017525068A JP 2017525068 A JP2017525068 A JP 2017525068A JP 6320637 B2 JP6320637 B2 JP 6320637B2
Authority
JP
Japan
Prior art keywords
headwords
language
ontology
headword
mapping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017525068A
Other languages
English (en)
Other versions
JP2017539006A (ja
Inventor
ナウゼ,ファブリセ
クローステルマン,ヘールト・ヤン
フェデラール,アルベルト・デルク・エデュアルト
Original Assignee
オラクル・インターナショナル・コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by オラクル・インターナショナル・コーポレイション filed Critical オラクル・インターナショナル・コーポレイション
Publication of JP2017539006A publication Critical patent/JP2017539006A/ja
Application granted granted Critical
Publication of JP6320637B2 publication Critical patent/JP6320637B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Machine Translation (AREA)

Description

関連出願の相互参照
本願は、2014年11月10日に出願され、「言語入力データからのNグラムから概念関係の自動一括生成」と題された米国仮特許出願第62/077868号の優先権を主張する。また、本願は、2014年11月10日に出願され、「見出語と汎用オントロジとのマッピング」と題された米国仮特許出願第62/077887号の優先権を主張する。これらの出願の各々は、あらゆる目的で参照により本明細書に組み込まれる。
以下の2015年7月7日と同一日付に出願された3つの出願は、すなわち、2015年7月7日にFabrice Nauzeらによって出願され、「言語入力データからNグラムおよび概念関係の自動生成」と題された米国特許出願第14/793677号(代理人整理番号88325−934160)、2015年7月7日にMargaret Salomeらによって出願され、「自然言語処理アプリケーション用のオントロジの自動生成」と題された米国特許出願第14/793701号(代理人整理番号88325−913826)、および2015年7月7日にFabrice Nauzeらによって出願され、「コンピュータ自然言語処理における見出語と汎用オントロジとのマッピング」と題された米国特許出願第14/793658号(代理人番号:88325−934161)は、相互関連している。これらの出願の各々は、参照により本明細書に組み込まれる。
背景
一般的な意味では、オントロジは、基本概念および概念間の相互関係に関する哲学的研究である。オントロジは、どの実体が存在するか、その実体をどのように階層に論理的に分類するか、およびどのような類似性および/または相違性を用いて、オントロジの概念グループを互いに分離するかに関する課題を取り扱う。コンピュータおよび情報科学において、通常のオントロジは、特定のコンピューティングドメインに本質的に存在する種類、性質および関係の命名および定義に変換される。例えば、オントロジは、一連の計算に必要とされる変数を区画化し、これらの変数間の関係を形成することができる。
簡単な要約
一実施形態において、オントロジを言語間にマッピングする方法は、第1言語の第1オントロジを受信するステップを含むことができる。第1オントロジは、第1複数の見出語と、複数の見出語間の複数の関係とを含む。また、この方法は、第2言語の第2複数の見出語を受信するステップと、第2言語の第2複数の見出語の各々を第1言語の第1複数の見出語の各々にマッピングするステップとを含むことができる。さらに、この方法は、第1オントロジ内の複数の関係を用いて第2言語の第2複数の見出語間の関係を作成することによって、第2言語の第2オントロジを生成するステップを含むことができる。
別の実施形態において、非一時的なコンピュータ可読媒体が提供される。コンピュータ可読媒体は、一連の命令を含むことができる。命令は、1つ以上のプロセッサによって実行されると、1つ以上のプロセッサに以下の操作の処理を実行させる。当該操作は、第1言語の第1オントロジを受信する操作を含み、第1オントロジは、第1複数の見出語と、複数の見出語間の複数の関係とを有する。また、当該操作は、第2言語の第2複数の見出語を受信する操作と、第2言語の第2複数の見出語の各々を第1言語の第1複数の見出語内の対応する見出語にマッピングする操作とを含むことができる。さらに、当該操作は、第1オントロジ内の複数の関係を用いて、第2言語の第2複数の見出語の相互関係を作成することによって、第2言語の第2オントロジを生成する操作とを含むことができる。
さらに別の実施形態において、システムが提供される。このシステムは、1つ以上のプロセッサと、1つ以上のプロセッサと通信可能に結合され、プロセッサによって読取可能なメモリとを含むことができる。メモリは、一連の命令を含むことができる。命令は、1つ以上のプロセッサによって実行されると、1つ以上のプロセッサに以下の操作を実行させる。当該操作は、第1言語の第1オントロジを受信する操作を含み、第1オントロジは、第1複数の見出語と、複数の見出語間の複数の関係とを有する。また、当該操作は、第2言語の第2複数の見出語を受信する操作と、第2言語の第2複数の見出語の各々を第1言語の第1複数の見出語内の対応する見出語にマッピングする操作とを含むことができる。さらに、当該操作は、第1オントロジ内の複数の関係を用いて、第2言語の第2複数の見出語の相互関係を作成することによって、第2言語の第2オントロジを生成する操作とを含むことができる。
明細書および図面の残りの部分を参照することによって、本発明の本質および利点をさらに理解することができる。いくつかの図面において、同様の参照番号を用いて、同様の構成要素を参照する。いくつかの例において、参照番号にサブラベルを付けることによって、複数の類似する構成要素のうち1つを表す。存在するサブラベルを指定せず、参照番号を使用する場合、複数の類似する構成要素の全体を参照することを意図している。
いくつかの実施形態に従って、自然言語処理に使用されるオントロジを示す図である。 いくつかの実施形態に従って、2つの異なるオントロジを生成するための並列言語解析パイプラインを示す図である。 いくつかの実施形態に従って、汎用オントロジを使用する言語解析パイプラインを示す図である。 いくつかの実施形態に従って、見出語翻訳を使用する言語解析パイプラインを示す図である。 いくつかの実施形態に従って、見出語マッピング中のオントロジを示す図形である。 いくつかの実施形態に従って、関係マッピング中のオントロジを示す図である。 いくつかの実施形態に従って、同義語データベースを用いてオントロジを生成するためのシステムを示す図である。 いくつかの実施形態に従って、言語翻訳サービスデータベースを用いてオントロジを生成するためのシステムを示す図である。 いくつかの実施形態に従って、自然言語処理に使用されるオントロジを生成するための方法を示すフローチャートである。 いくつかの実施形態を実現するための分散システムを示す簡略ブロック図である。 一実施形態に従って、サービスをクラウドサービスとして提供することができるシステム環境の構成要素を示す簡略ブロック図である。 さまざまな実施形態を実装することができる例示的なコンピュータシステムを示す図である。
詳細な説明
一般的に、オントロジ、階層および分類法は、検索システムおよび情報検索システムにしばしば使用され、再現率を改善する。例えば、「BMW」が「車の商標」であることを分かると、検索作業の再現率を改善し、分類作業の精度を向上させることができる。通常、オントロジは、最初に単語を見出語に関連し、その後、オントロジ/階層関係を用いて、見出語を他の見出語に関連することによって、言語特有モジュールとして構築される。しかしながら、本明細書に説明するように、オントロジにおける見出語の相互に関連する関係は、殆ど言語に依存しないモジュールに抽象化することができる。本明細書に記載の実施形態は、この抽象化を達成する方法を提供する。これによって、第1言語の既存オントロジに基づいて、第2言語のオントロジを形成することができる。
いくつかの実施形態において、プロセスは、第1オントロジを選択または定義することによって開始する。この第1オントロジは、「グラウンドトルース」オントロジまたは「汎用」オントロジと呼ばれ、英語などの共通語で形成されてもよい。この第1オントロジは、見出語として符号化された概念間の関係を記述することができる。その後、このプロセスは、入力コーパスのセグメント化/トークン化、品詞解析、およびトークンの見出し語化の後に始動される言語解析パイプラインを利用することができる。次に、このプロセスは、第1オントロジにおける見出語(必要に応じて、それらの品詞)と第2オントロジにおける見出語との間のマッピングを定義することができる。汎用オントロジを用いて各言語の見出語および関係をマッピングすることによって、新しい言語オントロジの実装に必要な時間が最小限に抑えられ、オントロジの質が特定の言語で関係を符号化する人間に依存しないため、言語間の全体的な質を高めることができる。
いくつかの実施形態において、プロセスは、言語に依存しないオントロジを第1オントロジとして構築することができる。第1オントロジは、見出語として符号化された概念の相互関係を含む。例えば、「タンデム」は「自転車」であり、「自転車」は「車両」である。次に、プロセスは、第1オントロジの第1言語と異なる第2言語を選択することができる。第2言語は、第2オントロジにとって望ましい言語であってもよい。次に、プロセスは、第1言語の単語と第2言語の単語との間のマッピングを生成することができる。プロセスは、言語間に共通の意味をマッピングするデータベースを利用することもできる。このマッピングは、第1言語の単語が第2言語の対応する単語にマッピングされるように包括的なものであってもよく、または品詞(PoS)間のマッピングが容易になるように特定的なものであってもよい。例えば、包括的なマッピングの場合、「見出語(第2言語)→見出語(第1言語)」となるが、品詞別のマッピングの場合、「PoS+見出語(第2言語)→見出語(第1言語)」となる。
第1言語の見出語および第2言語の見出語をマッピングした後、マッピングされた見出語は、次の言語解析パイプラインに渡すことができる。具体的には、第2オントロジにおける見出語の相互関係を用いて、第1オントロジにおける見出語間の関係を直接にマッピングすることができる。基本的に、第1オントロジに定義された関係を用いて、第2オントロジにおける見出語を相互に関連付けることによって、対応関係を形成する。このプロセスは、2つのオントロジ間に単語のマッピングを自動的に作成し、このマッピングを用いて第2オントロジの相互関係を形成する。このようにして、第1オントロジは、第2オントロジのテンプレートとして使用され、第2言語の単語は、テンプレートの関係間のノードを充填する。したがって、ユーザは、第2オントロジのために、手動で関係を割り当てるまたは語彙を決定する必要がない。
このプロセスは、常に経時的に更新することができる。第1オントロジは、特定のコーパス、例えばウェブサイトまたはウェブドメインに関連付けられてもよい。コーパスが経時的に変化する(例えば、ウェブページが更新される)場合、第1オントロジは、第1言語で変化し得る。新しい語彙を追加したり、古い語彙を削除したり、関係を調整したりすることができる。この場合、第2言語の新しい語彙を第2オントロジに追加することができ、使用されていない語彙は、第2オントロジから削除することができる。第2オントロジの関係は、調整された第1オントロジの関係に従って調整することもできる。この自動化プロセスは、自動的に最新状態に維持される第1オントロジに基づいて、複数の言語特有オントロジを生成することができる。
図1は、いくつかの実施形態に従って、自然言語処理に使用されるオントロジを表すダイヤグラム100を示す。ダイヤグラム100は、意味によって概念をグループ化し、相互関係を用いてグループ化概念を他の概念に関連付ける汎用オントロジを示している。例えば、自転車(Bike)114は、人力駆動二輪車という概念を表すことができる。オントロジは、自転車(Bike)114という同様の概念を記述する他の単語または同義語104のセットを含むことができる。自転車(Bike)114は、他の概念と階層的に関連してもよい。例えば、自転車(Bike)114は車両(Vehicle)102であり、車両(Vehicle)102は、車両の概念を表すことができる同義語のセットを有する。階層内の親子関係は、親と子との間に「〜の一種である」という関係である。別の例として、オフロードバイク(Dirt Bike)106、タンデムバイク(Tandem)108、およびツーリングバイク(Touring)110は、すべて自転車(Bike)114を表す親ノードの分類である。
汎用オントロジは、1つ以上の単語によって表される概念を用いて構築される。しかしながら、個々の単語、特に英語の単語は、複数の概念を表していることに注意すべきである。一例において、「自転車」という用語は、名詞および動詞の両方を表すことができる。図1に示すオントロジは、「自転車」という用語を動詞(「自転車で行く」)として使用する第2概念も含む。動詞の自転車(Bike)116という概念は、対応の名詞と同様に、同様の概念を表す同義語112のセットを含む。動詞の自転車116は、親の動詞「移動」(Move)118の子であり、したがって親の動詞とは「〜の一種である」という関係を有する。
以下に説明するように、汎用オントロジを用いて概念を言語間にマッピングする場合、その言語に使用された単語だけでなく品詞を用いて、概念を区別することがしばしば有用である。これらの概念は、本明細書において「見出語」として呼ばれる。さまざまな言語間の概念を結ぶマッピングエンジンを使用することによって、汎用オントロジの見出語を言語特有オントロジの見出語にマッピングすることができる。例示的なマッピングエンジンは、以下の図4A〜4Bに説明される。また、図1に示された汎用オントロジは、言語に依存しない方法で、概念および関係を表現することができる。例示のために、英語で汎用オントロジを表しているが、任意の言語を用いて汎用オントロジを表すことができる。
図2Aは、いくつかの実施形態に従って、2つの異なるオントロジを生成するための並列言語解析パイプライン200aを示す。言語解析パイプラインを用いて、コーパス202から言語特有オントロジを生成することができる。コーパスは、ウェブドメイン、文献セット、技術文書などを含むことができる。一般的に、コーパスは、特定のコンテキストに使用された特定言語のサブセットである。例えば、コーパスは、航空業界に共通の用語を広く使用する航空会社のウェブドメインを含むことができる。一般言語のサブセットに限定された特定のコーパスを使用することによって、コーパス202に特有であり、一般言語のオントロジよりも小さく効率的なオントロジであり、コーパス202に特有な定義のみを含むオントロジを得ることができ、再現率および検索効率を向上させることができる。
一般的に、異なる言語のオントロジを生成するために、2つの言語解析パイプラインが必要である。この例において、英語オントロジ214−1およびフランス語オントロジ214−2を各々生成するために、英語解析パイプラインおよびフランス語解析パイプラインが必要となる。解析を行うために、英語コーパス202−1およびフランス語コーパス202−2をパイプラインに提供する必要がある。いくつかのケースのにおいて、英語のコーパス202−1およびフランスのコーパス202−2は、異なる訳語で実質的に同様の内容を表すことができる。例えば、各コーパス202は、異なる言語に翻訳された同様のウェブページを表すことができる。別々のオントロジを生成するためには、言語解析パイプラインで各コーパスを別々に実行する必要がある。
コーパス202からオントロジ214を生成するプロセスは、以下のように実施され得る。コーパス202は、コーパス202内の目標テキストを分離するコーパス解析エンジン204に提供され得る。コーパス解析エンジン204は、メタデータ、コメント、表示コードおよび/または他の非実質的なテキストをコーパス202から削除することによって、オントロジ214の可能な単語のリストを生成することができる。例えば、ウェブドメインの場合、コーパス解析エンジン204は、HTMLの書式コード、開発者のコメント、メタデータおよび/または属性などを除去し、画面上でユーザに表示されるテキストのみを検索エンジンに与えることができる。
次に、見出語生成エンジン206は、単語を受け取り、見出語を生成することができる。見出語は、nグラムを構成する単一の単語または複数の単語により構成されてもよい。例えば、電子メールサービスを説明するウェブサイトの場合、「Eメール」という用語は、単一語の見出語であり、「検索フィルタ」という用語は、単一の概念を参照する二単語の見出語である。見出語生成エンジン206は、nグラムを生成するための最大数および/または最小数nを定義する入力を受付ることができる。例えば、入力は、nグラムを作成するための最小数1および最大数4を定義することができる。次いで、見出語生成エンジン206は、コーパス解析エンジン204によって与えられたテキストをスキャンし、連続する単一語または複数語の組み合わせとしてテキストに出現することが可能な(予測される)見出語のリストを生成する。
見出語フィルタリング/集約エンジン208は、見出語生成エンジン206から可能な見出語のリストを受け取り、見出語候補を絞り込み、オントロジ214に出現する見出語の最終リストを生成することができる。見出語フィルタリング/集約エンジン208は、見出語候補のリストをフィルタリングするために使用できるいくつかのパラメータ定義を含むことができる。例えば、1つのパラメータは、オントロジ見出語のリストに残しておくために、見出語候補をコーパスに使用する必要性である使用頻度を定義することができる。コーパス202に1回または2回のみ出現した見出語候補は、広義の意味を有しておらずまたはオントロジ214に有用な意味をもたらさない個々の単語のグループであると決めることができる。したがって、残すべき見出語候補は少なくとも最小回数でコーパス202に出現することが要求される。他のパラメータは、見出語候補を比較する対象としての辞書または他の利用可能な見出語データベースを定義することができる。これによって、既知の見出語と一致する見出語はリストに残され、他の見出語が破棄されまたはさらに処理される。いくつかの実施形態において、見出語フィルタリング/集約エンジン208は、ユーザインターフェイスに表示される画面を生成することができる。これによって、ユーザは、任意の自動フィルタリング処理を行う前または後に、見出語候補のリストを検査することができる。ユーザは、残っている見出語候補のリストを素早く検査し、リストに属さない見出語候補をリストから除去することができる。
この時点で、コーパス202内の大量の未処理テキストは、オントロジ214の見出語の最終リストに変換されている。言語解析パイプラインの次の部分、関係割り当てエンジン210および関係視覚化/絞り込みエンジン212は、多くの場合、プロセスの最も難しく時間のかかる段階であると考えられる。関係割り当てエンジン210は、コーパス202における見出語の相対位置並びに見出語の品詞、辞書定義および既知の同義語に基づいて、見出語の相互関係を自動的に生成する試みを行うことができる。次いで、関係視覚化/絞り込みエンジン212を用いて、グラフィックインターフェイスにおいて予備の関係割り当てをユーザに表示させることができる。次いで、ユーザは、表示装置上で図形または木フォーマットに表示された関係を視覚的に操作して、見出語間の関係の最終セットを生成することができる。その後、最終的な見出語216および最終的な関係218の組み合わせは、言語解析パイプラインからオントロジ214として出力することができる。
フランス語オントロジ214−2および英語オントロジ214−1を生成するために、言語解析パイプラインの各ステップは、各言語ごとに実行されなければならない。このことは、ユーザが、手動で見出語フィルタリング/集約エンジン208からの最終的な見出語リストを検査し、手動で最終的な関係218を形成する必要があることを意味する。これには、オントロジを生成するための広範なユーザ関与、複数の言語の専門知識を必要とするユーザ関与が必要となる。
図2Bは、いくつかの実施形態に従って、汎用オントロジを使用する言語解析パイプライン200bを示す。上述したように、汎用オントロジ214−1は、必要に応じて英語などの特定言語によって表されるが、言語に依存しないものであってもよい。汎用オントロジ214−1は、見出語セット216−1と、見出語セット216−1に対応する関係セット218−1とを含む。フランス語コーパス202−2からフランス語オントロジ214−2を生成するために、汎用オントロジ214−1を用いて、言語解析パイプラインにおいてフランス語の見出語間の関係を生成するステップのうち、時間のかかるステップを省くことができる。
上述したように、コーパス解析エンジン204−2を用いて、フランス語コーパス202−2を解析することができ、見出語生成エンジン206−2を用いて、見出語セットを生成することができる。見出語フィルタリング/集約エンジン208−2を用いて、見出語候補をフィルタリングおよび編集することによって、フランス語オントロジ214−2の見出語216−2の最終セットを生成する。この時に、言語間見出語マッピングエンジン220は、フランス語オントロジ214−2の見出語216−2の最終セットを受け取り、見出語216−2の最終セットの意味を汎用オントロジ214−1の見出語216−1にマッピングすることができる。
言語間見出語マッピングエンジン220によって使用された、フランス語オントロジ214−2の見出語216−2の最終セットを汎用オントロジ214−1の見出語216−1にマッチングするための方法は、特定の実施形態によって異なる可能性がある。いくつかの実施形態において、既存のデータベースを用いて、言語特有同義語または同義語のセットを共有索引レイヤに関連付けすることによって、言語間の見出語を関連付けすることができる。例えば、Euro WordNetプロジェクトは、異なる言語の概念間の意味を関連付けするデータベースを提供する。他の実施形態において、自動言語翻訳サービス(例えば、Google(登録商標)翻訳)を用いて、言語間の同義語を生成することができる。例えば、見出語216−2の最終セットからの見出語は、汎用オントロジ214−1の言語に翻訳され、汎用オントロジ214−1の見出語216−1の見出語にマッピングされることができる。いくつかの実施形態において、既に言語を汎用オントロジにマッピングした場合、コーパスを用いて、汎用オントロジ言語に並列データが存在している見出語を生成することができる。例えば、並列コーパスにおいて、整列された新しい言語の文章が、汎用オントロジ言語の並列文章に直接マッピングされる。よく知られている統計的方法を用いて、両方の言語の単語および複数トークン語を整列することができる。次に、見出語およびマッピングを自動的に生成することができる。
見出語216−2の最後セットを汎用オントロジ214−1の見出語216−1にマッピングした後、関係マッピングエンジン222によって、汎用オントロジの関係218−1を見出語216−2の最後セットに直接にマッピングすることができる。多くの場合、フランス語関係218−2を生成するために、関係218−1をフランス語オントロジ214−2の見出語216−2の最終セットに直接にマッピングすることができる。場合によって、フランス語オントロジ214−2の見出語216−2の最後セット内の見出語は、汎用オントロジ214−1の見出語216−1に直接に類似していない可能性がある。この状況は、以下でさらに詳しく説明する。いくつかの実施形態において、関係マッピングエンジン222は、単に汎用オントロジから関係を読み込み、読み込んだ関係をフランス語オントロジ214−2に直接に適用することができる。これによって、フランス語関係218−2は、汎用オントロジの関係218−1と同様となる。フランス語オントロジと汎用オントロジとの間に直接マッピングできない見出語が存在する場合、必要に応じて手動で追加の関係を追加することができる。この作業は、あまり使用されない。
図2Cは、いくつかの実施形態に従って、見出語翻訳を使用する言語解析パイプライン200cを示す。この実施形態において、汎用オントロジ214−1を特定のコーパス用に開発することができる。例えば、英語のウェブドメインのマスタバージョンを用いて、特定のウェブドメインに特有の汎用オントロジを生成することができる。多国籍企業の場合によくあるように、ウェブドメインのマスターバージョンをさまざまな言語に翻訳し、国際的な顧客基盤を提供することができる。英語のウェブドメインのマスタバージョンの翻訳を別々に解析する代わりに、汎用オントロジ214−1を用いて、さまざまな他の言語のオントロジを自動的に生成することができる。
見出語変換エンジン224は、汎用オントロジ214−1に存在する見出語216−1の各々に対応して、フランス語などの別の言語の見出語216−2の最終セットを生成することができる。場合によって、英語単語を翻訳する時に、フランス語に使用できる同義語セットを生成することがある。例えば、「bicycle」という英語単語は、フランス語で5つの同義語のセットを生成することができる。フランス語の同義語をウェブドメインのフランス語翻訳の実際のコーパスと比較して、フランス語オントロジ214−2に使用されるべき同義語を判断することができる。フランス語オントロジ214−2の見出語216−2の最終セットを生成した後、関係マッピングエンジン222を用いて、フランス語オントロジ214−2の関係218−2を生成することができる。留意すべきことは、この実施形態において、言語解析パイプラインでウェブドメインのフランス語コーパスを処理することなく、汎用オントロジ214−1に基づいて、完全なフランス語オントロジ214−2を生成したことである。
図3Aは、いくつかの実施形態に従って、見出語マッピング中のオントロジを表すダイヤグラム300aを示す。プロセスのこの段階において、言語解析パイプラインによってフランス語の見出語を生成することができる。例えば、パリの自転車輸送を取り扱うウェブドメインを解析して、図3Aに示された見出語を生成することができる。フランス語の見出語の言語を汎用オントロジの言語(例えば英語)に翻訳することによって、フランス語の見出語を汎用オントロジの見出語にマッピングすることができる。上述したように、各見出語概念は、概念を言語間にマッピングするために使用される1つ以上の同義語を有することができる。図3Aには、車両(vehicle)302および車両(vehicule)314の概念がマッピングされ、バイク(Bike)304および(Biyclette)316の概念がマッピングされ、特定の種類のバイク、例えば、ツーリングバイク(touring)306および(Tourisme)320、モータバイク(Motor Bike)310および(Moto)322、および/またはタンデムバイク(Tandem)312および(Tandem)324がマッピングされる。
なお、オフロードバイク(Dirt Bike)308の概念は、特定のフランス語コーパスからのフランス語見出語のセットにおいて、対応する単語を有していない。いくつかの実施形態において、言語間の相違が予期されるべきであり、ある言語の見出語が必ずしも別の言語の見出語と直接に整列できるとは限らない。
図3Bは、いくつかの実施形態に従って、関係マッピング中のオントロジを表すダイヤグラム300bを示す。図3Bのマッピングされた見出語を用いて、汎用オントロジからの見出語の相互関係をマッピングおよび複製することによって、フランス語オントロジを形成することができる。ダイヤグラム300bに示すように、フランス語オントロジは、車両の見出語(vehicule)314と、自転車の見出語(Biyclette)316との間に「ある種の」関係を用いて形成される。フランス語専門家でフランス語コーパス中の見出語間の関係を整理する代わりに、汎用オントロジの既存の関係を用いて、フランス語オントロジにおける対応する関係を自動的に生成することができる。
図4Aは、いくつかの実施形態に従って、同義語データベースを用いてオントロジを生成するためのシステム400aを示す。言語解析パイプライン404は、コーパス402(例えば、ウェブドメイン)を入力として受け取り、見出語を生成すること(406)ができる。見出語マッピングエンジン408は、生成された見出語を汎用オントロジ412の概念にマッピングすることができる。見出語マッピングエンジン408は、追加のリソース、例えば、言語間の概念をマッピングする市販のまたは専門の同義語データベース416を用いて、見出語のマッピングを行うことができる。見出語マッピングエンジン408は、APIまたはウェブインターフェイス420を介して、データベース416にアクセスすることができる。次に、関係マッピングエンジン410は、汎用オントロジ412からの関係を再利用して、上述したように最終的な言語特有オントロジ414を生成することができる。
図4Bは、いくつかの実施形態に従って、言語翻訳サービスデータベースを用いてオントロジを生成するためのシステム400bを示す。システム400bの実施形態は、APIまたはウェブインターフェイス424がウェブ翻訳サービス422を用いて、コーパス402の見出語と汎用オントロジ412の見出語との間のマッピングを生成する点を除き、システム400aの実施形態と同様である。
図5は、いくつかの実施形態に従って、自然言語処理に使用されるオントロジを生成するための方法を示すフローチャート500である。この方法は、見出語と見出語の相互関係とを含む第1言語の第1オントロジを受信するステップ(502)を含むことができる。第1オントロジは、関係によって関連付けされた言語に依存しない見出語概念のセットであってもよい。第1オントロジは、ウェブドメインまたは文書のセットなどの特定のコーパスに特有であってもよい。いくつかの実施形態において、第1オントロジは、言語解析パイプラインを用いて生成することができる。言語解析パイプラインは、コーパスから見出語を抽出およびフィルタリングし、言語エキスパートから見出語間の関係を受付けることができる。
また、この方法は、第2言語の第2セットの見出語を受付るステップ(504)を含むことができる。第2言語は、第1オントロジすなわち汎用オントロジを表すために使用された第1言語とは異なってもよい。第2セットの見出語は、第1オントロジの見出語の生成と同様に、言語解析パイプラインから生成することができる。いくつかの実施形態において、第2セットの見出語のコーパスと第1オントロジのコーパスとは、同一のコーパスから異なる言語で導き出すことができる。さらに、方法は、第2言語の見出語の各々を第1言語の見出語にマッピングするステップ(506)を含むことができる。このステップは、第2言語の見出語を第1言語の同義語セットに翻訳した後、第1オントロジの見出語に出現する同義語を識別することによって達成され得る。最後に、この方法は、第1オントロジ内の複数の関係を用いて、第2言語の見出語間の関係を作成することによって、第2言語の第2オントロジを生成するテップ(508)をさらに含むことができる。
理解すべきことは、図5に示された具体的なステップは、本発明のさまざまな実施形態に従って、オントロジを生成するための具体的な方法を提供することである。別の実施形態に従って、他の一連のステップを実行することもできる。例えば、本発明の代替的な実施形態は、異なる順序で上記で概説したステップを実行することができる。さらに、図5に示された各ステップは、各ステップに応じてさまざまなシーケンスで実行できる複数のサブステップを含むことができる。さらに、特定の応用に応じて、ステップを追加または削除することができる。当業者であれば、多くの変形例、修正例および代替例を認識するだろう。
本明細書に記載の方法の各々は、コンピュータシステムによって実施することができる。これらの方法の各ステップは、コンピュータシステムによって自動的に実行されてもよく、および/またはユーザの関与で入力/出力を提供してもよい。例えば、ユーザは、方法の各ステップに入力を提供し、各入力は、コンピュータシステムによって生成された、その入力を必要とする特定の出力に対応する。各入力は、対応する要求出力に応じて、受信されてもよい。さらに、入力は、ユーザから受信されてもよく、他のコンピュータシステムからデータストリームとして受信されてもよく、メモリ位置から検索されてもよく、ネットワークを介して検索されてもよく、および/またはウェブサービスから要求されてもよい。同様に、出力は、ユーザに提供されてもよく、データストリームとして別のコンピュータシステムに提供されてもよく、メモリ位置に保存されされてもよく、ネットワークを介して送信されてもよく、ウェブサービスに提供されてもよい。簡潔に言えば、本明細書に記載の方法の各ステップは、コンピュータシステムによって実行されてもよく、ユーザの関与が必須ではないコンピュータシステムに入力または出力される任意数の入力、出力、および/または要求を含むことができる。ユーザの関与が必要としないステップは、人間の介入なしにコンピュータシステムによって自動的に実行されるとも言える。したがって、本開示に照らして、本明細書に記載の各方法の各ステップは、ユーザからの入力を受け取り、ユーザに出力を与えるように変更してもよく、または人間の介入なしに、プロセッサが判断を行い、コンピュータシステムによって自動的に実行されてもよい。さらに、本明細書に記載の各方法のいくつかの実施形態は、有形の非一時的記憶媒体に記憶され、有形のソフトウェア製品を形成する一組の命令として実装されてもよい。
図6は、実施形態のうちの1つを実現するための分散システム600を示す簡略図である。図示の実施形態において、分散システム600は、1つ以上のネットワーク610を介して、ウェブブラウザまたは専用クライアント(たとえば、オラクルフォーム)などのようなクライアントアプリケーションを実行および作動するように構成された1つ以上のクライアントコンピューティング装置602、604、606および608を含む。サーバ612は、ネットワーク610を介して、リモートクライアントコンピューティング装置602、604、606および608と通信可能に連結されてもよい。
さまざまな実施形態において、サーバ612は、システムの1つ以上のコンポーネントによって提供される1つ以上のサービスまたは1つ以上のソフトウェアアプリケーションを実行するように構成され得る。いくつかの実施形態において、これらのサービスは、ウェブサービスまたはクラウドサービスとして、またはSaaS(Software as a Service)モデルに基づいて、クライアントコンピューティング装置602、604、606および/または608のユーザに提供されてもよい。よって、クライアントコンピューティング装置602、604、606および/または608を操作するユーザは、1つ以上のクライアントアプリケーションを用いて、サーバ612と情報を交換することによって、これらのコンポーネントによって提供されたサービスを利用することができる。
図示の構成において、システム600のソフトウェア要素618、620および622は、サーバ612上に実装されている。他の実施形態において、システム600の1つ以上の構成要素および/またはこれらのコンポーネントによって提供されたサービスは、1つ以上のクライアントコンピューティング装置602、604、606および/または608によって実現されてもよい。クライアントコンピューティング装置を操作するユーザは、1つ以上のクライアントアプリケーションを用いて、これらのコンポーネントによって提供されたサービスを利用することができる。これらの構成要素は、ハードウェア、ファームウェア、ソフトウェア、またはこれらの組み合わせで実現されてもよい。理解すべきことは、分散システム600と異なるさまざまなシステム構成が可能であることである。したがって、図示された実施形態は、実施形態のシステムを実現するための分散システムの一例であり、限定する意図をしていない。
クライアントコンピューティング装置602、604、606および/または608は、たとえば、Microsoft Windows Mobile(登録商標)のようなソフトウェア、および/またはiOS、Windowsフォン、アンドロイド、ブラックベリー10およびパームOSなどのさまざまなモバイルオペレーティングシステムを実行することができ、インターネット、電子メール、ショートメッセージサービス(SMS)、ブラックベリー(登録商標)または他の通信プロトコルが有効化された手持ち式携帯装置(たとえば、iPhone(登録商標)、携帯電話、Ipad(登録商標)、タブレット、携帯情報端末(PDA)または着用できる装置(Google Glass(登録商標)ヘッドマウントディスプレイ)であってもよい。クライアントコンピューティング装置は、例示として、Microsoft Windows(登録商標)オペレーティングシステム、Apple Macintosh(登録商標)オペレーティングシステムおよび/またはLinux(登録商標)オペレーティングシステムのさまざまなバージョンを実行するパーソナルコンピュータおよび/またはラップトップコンピュータを含む汎用のパーソナルコンピュータであってもよい。クライアントコンピューティング装置は、たとえば、さまざまなGNU/Linuxオペレーティングシステム、たとえば、Google Chrome OSを含むがこれに限定されない市販のUNIX(登録商標)またはUNIXに類似するさまざまなオペレーティングシステムを動かすワークステーションコンピュータであってもよい。代替的にまたは追加的には、クライアントコンピューティング装置602、604、606および608は、ネットワーク610を介して通信可能なシンクライアントコンピュータ、インターネット対応のゲームシステム(たとえば、Kinect(登録商標)ジェスチャ入力装置を備えるまたは備えないMicrosoft Xboxゲームコンソール)、および/またはパーソナルメッセージング装置などの他の電子機器であってもよい。
例示の分散システム600は、4つのクライアントコンピューティング装置を備えると示されているが、任意の数のクライアントコンピューティング装置をサポートすることができる。他の装置、たとえばセンサを有する装置は、サーバ612と情報を交換することができる。
分散システム600のネットワーク610は、TCP/IP(伝送制御プロトコル/インターネットプロトコル)、SNA(システムネットワークアーキテクチャ)、IPX(インターネットパケット交換)、Apple Talkなどを含むがこれらに限定されないさまざまな市販プロトコルのいずれかを使用してデータ通信をサポートすることができ、当業者に熟知される任意種類のネットワークであってもよい。単なる例示として、ネットワーク610は、イーサネット(登録商標)、トークンリングおよび/またはその他に基づくローカルエリアネットワーク(LAN)であってもよい。ネットワーク610は、広域ネットワークまたはインターネットであってもよい。ネットワーク610は、仮想プライベートネットワーク(VPN)を含むがこれに限定されない仮想ネットワーク、イントラネット、エクストラネット、公衆交換電話ネットワーク(PSTN)、赤外線ネットワーク、無線ネットワーク(たとえば、IEEE(Institute of Electrical and Electronic Engineers)802.11プロトコルスイート、Bluetooth(登録商標)、および/または任意の他の無線プロトコルの下で動作するネットワーク)および/またはこれらのネットワークと他のネットワークの組み合わせを含むことができる。
サーバ612は、1つ以上の汎用コンピュータ、専用サーバコンピュータ(例示として、PC(パーソナルコンピュータ)サーバ、UNIX(登録商標)サーバ、ミッドレンジサーバ、メインフレームコンピュータ、ラックマウントサーバを含む)、サーバファーム、サーバクラスタ、または任意の他の適切な構成および/または組み合わせから構成されてもよい。さまざまな実施形態において、サーバ612は、前述の開示に記載された1つ以上のサービスまたはソフトウェアアプリケーションを動かすように構成することができる。たとえば、サーバ612は、本開示の実施形態に従って上記に説明した処理を実行するためのサーバに対応することができる。
サーバ612は、上述したものいずれかを含むオペレーティングシステム、および任意の市販サーバオペレーティングシステムを動かすことができる。また、サーバ612は、HTTP(ハイパーテキスト転送プロトコル)サーバ、FTP(ファイル転送プロトコル)サーバ、CGI(共通ゲートウェイインターフェイス)サーバ、Java(登録商標)サーバ、データベースサーバなどを含むさまざまな追加サーバアプリケーションおよび/または中間層アプリケーションのいずれかを動かすことができる。例示的なデータベースサーバは、Oracle(登録商標)、Microsoft(登録商標)、Sybase(登録商標)、IBM(登録商標)などの会社から市販されているものを含むがこれらに限定されない。
いくつかの実現例において、サーバ612は、クライアントコンピューティング装置602、604、606、および608のユーザから受信したデータフィードおよび/またはイベント更新を分析および統合する1つ以上のアプリケーションを含んでもよい。例示として、データフィードおよび/またはイベント更新は、Twitter(登録商標)フィード、Facebook(登録商標)更新または1つ以上の第3情報源および連続データストリームから受信したリアルタイム更新を含むがこれらに限定されない。リアルタイム更新は、センサデータアプリケーション、金融相場表示機、ネットワーク性能測定ツール(たとえば、ネットワーク監視およびトラフィック管理アプリケーション)、ページ遷移(Clickstream)解析ツール、自動車交通監視装置などに関連するリアルタイムイベントを含むことができる。また、サーバ612は、クライアントコンピューティング装置602、604、606および608の1つ以上の表示装置を介して、データフィードおよび/またはリアルタイムイベントを表示するための1つ以上のアプリケーションを含むこともできる。
また、分散システム600は、1つ以上のデータベース614および616を含むこともできる。データベース614および616は、さまざまな場所に常駐することができる。例示として、1つ以上のデータベース614および616は、サーバ612の近く(および/またはその中)の非一時記憶媒体に常駐することができる。代替的には、データベース614および616は、リモートサーバ612から離れており、ネットワークに基づく接続または専用接続を介して、サーバ612と通信している。一組の実施形態において、データベース614および616は、記憶領域ネットワーク(SAN)に常駐することができる。同様に、サーバ612に寄与する機能を実行するための任意の必要なファイルは、必要に応じて、サーバ612上に/またはサーバ612から離れた場所に保存されてもよい。一組の実施形態において、データベース614および616は、たとえば、Oracleにより提供されるデータベースなどの関係データベースを含むことができる。これらの関係データベースは、SQLフォーマット命令に応じて、データを取得、保存および更新するように構成されている。
図7は、本開示の実施形態に従ったシステム環境700の1つ以上の構成要素を示す簡略ブロック図である。実施形態に従ったシステムの1つ以上の構成要素によって提供されるサービスは、クラウドサービスとして提供されることができる。図示の実施形態において、システム環境700は、1つ以上のクライアントコンピューティング装置704、706および708を含む。ユーザは、クライアントコンピューティング装置を用いて、クラウドサービスを提供するクラウドインフラストラクチャシステム702と情報を交換することができる。クライアントコンピューティング装置は、ウェブブラウザ、専用クライアントアプリケーション(たとえば、オラクルフォーム)または他のアプリケーションなどのクライアントアプリケーションを作動するように構成されることができる。ユーザは、クライアントアプリケーションを用いてクラウドインフラストラクチャシステム702と情報を交換することによって、クラウドインフラストラクチャシステム702により提供されたサービスを利用することができる。
理解すべきことは、図示のクラウドインフラストラクチャシステム702は、図示された構成要素以外の構成要素を備えてもよいことである。さらに、図示の実施形態は、本発明の実施形態を組み込むことができるクラウドインフラストラクチャシステムの一例に過ぎない。いくつかの他の実施形態において、クラウドインフラストラクチャシステム702は、図示よりも多いまたは少ない構成要素を有してもよく、2つ以上の構成要素を組み合わせてもよく、または異なる構成または配置の構成要素を有してもよい。
クライアントコンピューティング装置704、706および708は、上述したクライアントコンピューティング装置602、604、606および608と同様であってもよい。
例示的なシステム環境700は、3つのクライアントコンピューティング装置を備えると示されているが、任意の数のクライアントコンピューティング装置をサポートすることができる。他の装置、たとえばセンサを有する装置は、クラウドインフラストラクチャシステム702と情報を交換することができる。
ネットワーク710は、クライアント704、706および708とクラウドインフラストラクチャシステム702との間のデータの通信および交換を促進することができる。各ネットワークは、上記でネットワーク610に関して説明したプロトコルをさまざまな市販プロトコルのいずれかを用いてデータ通信をサポートすることができ、当業者に熟知する任意の種類のネットワークであってもよい。
クラウドインフラストラクチャシステム702は、上記でサーバ612に関して説明した構成要素を含み得る1つ以上のコンピュータおよび/またはサーバを含むことができる。
特定の実施形態において、クラウドインフラストラクチャシステムによって提供されたサービスは、需要に応じて、クラウドインフラストラクチャシステムからユーザに提供できるオンラインデータの記憶およびバックアップ、ウェブベースの電子メールサービス、ホストされたオフィススイートおよび文章連携サービス、データベース処理、管理できる技術サポートサービスなどの多くのサービスを含んでよい。クラウドインフラストラクチャシステムによって提供されるサービスは、ユーザのニーズを満たすように動的に拡張できる。クラウドインフラストラクチャシステムによって提供されたサービスの特定の例示は、本明細書において、「サービスインスタンス」と呼ばれる。一般的には、インターネットなどの通信ネットワークを介して、クラウドサービスプロバイダのシステムからユーザに提供できる任意のサービスは、「クラウドサービス」と呼ばれる。典型的には、パブリッククラウド環境において、クラウドサービスプロバイダのシステムを構成するサーバおよびシステムは、顧客のオンプレミスサーバおよびシステムとは異なる。たとえば、クラウドサービスプロバイダのシステムは、アプリケーションを提供することができ、ユーザは、必要に応じて、インターネットなどの通信ネットワークを介して、アプリケーションを注文し、使用することができる。
いくつかの例において、コンピュータネットワーククラウドインフラストラクチャ内のサービスは、保護されたコンピュータネットワークのストレージアクセス、ホストされたデータベース、ホストされたウェブサーバ、ソフトウェアアプリケーション、またはクラウドベンダによってユーザに提供された他のサービス、または当該技術分野に知られている他のサービスを含むことができる。たとえば、サービスは、インターネットを介して、クラウド上のリモートストレージに対して、パスワードにより保護されたアクセスを含むことができる。別の例として、サービスは、ウェブサービスにホストされている関係データベースおよびネットワーク上の開発者により私的使用のためのスクリプト言語ミドルウェアエンジンを含むことができる。別の例として、サービスは、クラウドベンダのウェブサイト上でホストされている電子メールソフトウェアアプリケーションに対するアクセスを含むことができる。
特定の実施形態において、クラウドインフラストラクチャシステム702は、セルフサービスのサブスクリプションに基づく、柔軟なスケーラビリティ、信頼性、高可用性および安全性を有する方法で、顧客に提供できる一連のアプリケーション、ミドルウェアおよびデータベースサービスを含むことができる。このようなクラウドインフラストラクチャシステムの例示として、本願譲受人により提供されたOracleパブリッククラウドが挙げられる。
さまざまな実施形態において、クラウドインフラストラクチャシステム702は、顧客から申込んだクラウドインフラストラクチャシステム702のサービスを自動的に提供、管理および追跡するように構成されることができる。クラウドインフラストラクチャシステム702は、さまざまな展開モデルを介して、クラウドサービスを提供することができる。たとえば、サービスは、クラウドサービスを販売する組織に所有された(たとえば、Oracleに所有された)クラウドインフラストラクチャシステム702を有するパブリッククラウドモデルで提供され、一般人または異なる業界の企業に利用されることができる。別の例として、サービスは、単一の組織に専用されたクラウドインフラストラクチャシステム702を有するプライベートクラウドモデルで提供され、組織内の1つ以上の実体に利用されることができる。また、クラウドサービスは、集団クラウドモデルで提供されてもよい。よって、クラウドインフラストラクチャシステム702およびクラウドインフラストラクチャシステム702により提供されたサービスは、関連する集団内の複数の組織によって共有される。また、クラウドサービスは、2つ以上の異なるモデルの組み合わせからなるハイブリッドクラウドモデルで提供されてもよい。
いくつかの実施形態において、クラウドインフラストラクチャシステム702によって提供されたサービスは、SaaS(Software as a Service)カテゴリ、PaaS(Platform as a Service)カテゴリ、IaaS(Infrastructure as a Service)カテゴリ、またはハイブリッドサービスを含む他のカテゴリのサービスに準拠して提供された1つ以上のサービスを含むことができる。顧客は、サブスクリプションの申込みによって、クラウドインフラストラクチャシステム702によって提供された1つ以上のサービスを注文することができる。これに応じて、クラウドインフラストラクチャシステム702は、顧客のサブスクリプション申込書に含まれたサービスを提供する処理を行う。
いくつかの実施形態において、クラウドインフラストラクチャシステム702によって提供されたサービスは、アプリケーションサービス、プラットフォームサービスおよびインフラストラクチャサービスを含むがこれらに限定されない。いくつかの例において、アプリケーションサービスは、SaaSプラットフォームを介して、クラウドインフラストラクチャシステムによって提供されてもよい。SaaSプラットフォームは、SaaSカテゴリに準拠するクラウドサービスを提供するように構成されてもよい。たとえば、SaaSプラットフォームは、統合の開発および展開プラットフォーム上でオンデマンドアプリケーションのスイートを構築し、提供するように、機能することができる。SaaSプラットフォームは、SaaSサービスを提供するために、基礎のソフトウェアおよびインフラストラクチャを管理し、制御することができる。SaaSプラットフォームにより提供されたサービスを利用することによって、顧客は、クラウドインフラストラクチャシステム上で動作するアプリケーションを利用することができる。顧客は、別々のライセンスおよびサポートを購入する必要なく、アプリケーションサービスを取得することができる。さまざまな異なるSaaSサービスを提供することができる。例示としては、販売実績管理、企業統合、および大規模組織のビジネス柔軟性に対する解決策を提供するサービスを含むがこれらに限定されない。
いくつかの実施形態において、プラットフォームサービスは、PaaSプラットフォームを介してクラウドインフラストラクチャシステムによって提供されてもよい。PaaSプラットフォームは、PaaSカテゴリに準拠するクラウドサービスを提供するように構成されてもよい。プラットフォームサービスの例としては、共有されている共通アーキテクチャ上で既存のアプリケーションを統合する能力、およびプラットフォームにより提供された共有サービスを活用する新規アプリケーションを構築する能力を組織(たとえば、Oracle)に与えるサービスを含むがこれに限定されない。PaaSプラットフォームは、PaaSサービスを提供するために、基礎のソフトウェアおよびインフラストラクチャを管理し、制御することができる。顧客は、クラウドインフラストラクチャシステム上で動作するアプリケーションを利用することができる。顧客は、別々のライセンスおよびサポートを購入する必要なく、アプリケーションサービスを取得することができる。さまざまな異なるSaaSサービスを提供することができる。プラットフォームサービスの例としては、oracle Javaクラウドサービス(JCS)、Oracleデータベースクラウドサービス(DBCS)およびその他を含むがこれらに限定されない。
PaaSプラットフォームにより提供されたサービスを利用することによって、顧客は、クラウドインフラストラクチャシステムにサポートされているプログラミング言語およびツールを利用することができ、展開されたサービスを制御することができる。いくつかの実施形態において、クラウドインフラストラクチャシステムによって提供されるプラットフォームサービスは、データベースクラウドサービス、ミドルウェアクラウドサービス(たとえば、Oracle Fusionミドルウェアサービス)、およびJavaクラウドサービスを含むことができる。一実施形態において、データベースクラウドサービスは、データベースリソースを蓄積する能力を組織に与えることができる共有サービス展開モデルをサポートすることができ、DBaaS(Database as a Service)をクラウドデータベースとして顧客に提供することができる。ミドルウェアクラウドサービスは、クラウドインフラストラクチャシステム上でさまざまなビジネスアプリケーションを開発および展開するためのプラットフォームを顧客に提供することができ、Javaクラウドサービスは、クラウドインフラストラクチャシステム上でJavaアプリケーションを展開するためのプラットフォームを顧客に提供することができる。
種々の異なるインフラストラクチャサービスは、IaaSプラットフォームによって、クラウドインフラストラクチャシステムに提供されてもよい。これらのインフラストラクチャサービスは、SaaSプラットフォームおよびPaaSプラットフォームにより提供されたサービスを利用する顧客のために、ストレージ、ネットワークおよびその他の基本的なコンピューティングリソースとしての基礎コンピューティングリソースの管理と制御を容易にする。
特定の実施形態において、クラウドインフラストラクチャシステム702はまた、クラウドインフラストラクチャシステムを利用する顧客に、さまざまなサービスを提供するために使用されるリソースを提供するためのインフラストラクチャリソース730を含むことができる。一実施形態において、インフラストラクチャリソース730は、PaaSプラットフォームおよびSaaSプラットフォームによって提供されたサービスを実行するために、事前に統合され且つ最適化されたサーバリソース、ストレージリソースおよびネットワークリソースなどのハードウェアの組み合わせを含んでもよい。
いくつかの実施形態において、クラウドインフラストラクチャシステム702内のリソースは、複数のユーザに共有されることができ、各々の需要に応じて動的に再割当てることができる。また、リソースは、異なるタイムゾーンでユーザに割当てることができる。たとえば、クラウドインフラストラクチャシステム730は、指定時間内でクラウドインフラストラクチャシステムのリソースを第一時間帯における第一グループのユーザに利用させ、その後、同様のリソースを異なる時間帯における別のグループのユーザに再配分することができ、リソースを最大に利用する。
特定の実施形態において、複数の内部共有サービス732は、提供され、クラウドインフラストラクチャシステム702の異なる構成要素またはモジュールに共有されおよびクラウドインフラストラクチャシステム702によって提供されたサービスに共有されることができる。これらの内部共有サービスは、安全性および識別サービス、統合サービス、企業リポジトリサービス、企業管理サービス、ウイルススキャンおよびホワイトリストサービス、高可用性のバックアップおよびリカバリサービス、クラウドサポートを可能にするサービス、メールサービス、通知サービス、およびファイル転送サービスなどを含むがこれらに限定されない。
特定の実施形態において、クラウドインフラストラクチャシステム702は、クラウドインフラストラクチャシステム内のクラウドサービス(たとえば、SaaSサービス、PaaSサービスおよびIaaSサービス)を包括的に管理する機能を提供することができる。一実施形態において、クラウド管理機能は、クラウドインフラストラクチャシステム702などによって受信した顧客のサブスクリプションを提供、管理、および追跡する機能を含んでもよい。
一実施形態において、図示のように、クラウド管理機能は、1つ以上のモジュール、たとえば、オーダー管理モジュール720、オーダーオーケストレーションモジュール722、オーダー支給モジュール724、オーダー管理および監視モジュール726、およびID管理モジュール728によって提供される。これらのモジュールは、1つ以上のコンピュータおよび/またはサーバを含んでもよく、これらを用いて形成されてもよい。これらのコンピュータおよび/またはサーバは、汎用コンピュータ、専用サーバコンピュータ、サーバファーム、サーバクラスタ、または任意の他の適切な配置および/またはこれらの組み合わせであってもよい。
例示的な操作734において、顧客は、クライアント装置、たとえば、クライアント装置704、706または708を使用して、クラウドインフラストラクチャシステム702により提供された1つ以上のサービスをリクエストし、クラウドインフラストラクチャシステム702によって提供された1つ以上のサービスをオーダーすることによって、クラウドインフラストラクチャシステム702と情報を交換することができる。特定の実施形態において、顧客は、クラウドユーザインターフェイス(UI)、クラウドUI 712、クラウドUI 714および/またはクラウドUI 716にアクセスし、これらのUIを介して、サブスクリプションをオーダーすることができる。クラウドインフラストラクチャシステム702が顧客のオーダーに応答して受信したオーダー情報は、顧客と、クラウドインフラストラクチャシステム702により提供され、顧客が購読しようとする1つ以上のサービスとを識別する情報を含むことができる。
顧客がオーダーした後、オーダー情報は、クラウドUI712、714および/または716を介して受信される。
操作736において、オーダーは、オーダーデータベース718に保存される。オーダーデータベース718は、クラウドインフラストラクチャシステム702によって操作され、または他のシステム要素と連動して操作されるいくつかのデータベースのうち1つであってもよい。
操作738において、オーダー情報は、オーダー管理モジュール720に転送される。いくつかの例において、オーダー管理モジュール720は、オーダーに関連する請求および会計機能、たとえば、オーダーの確認、および確認後オーダーの記入を実行するように構成されてもよい。
操作740において、オーダーに関する情報は、オーダーオーケストレーションモジュール722に伝達される。オーダーオーケストレーションモジュール722は、オーダー情報を利用して、顧客がオーダーしたサービスおよびリソースの提供を用意する。いくつかの例において、オーダーオーケストレーションモジュール722は、オーダー支給モジュール724のサービスを用いて、オーダーしたサービスをサポートするように、リソースの提供を用意することができる。
特定の実施形態において、オーダーオーケストレーションモジュール722は、各オーダーに関連したビジネスプロセスを管理することができ、ビジネスロジックを適用することによって、オーダーに対して支給をするか否かを判断することができる。操作742において、新規サブスクリプションのオーダーを受信すると、オーダーオーケストレーションモジュール722は、リソースを割当て、サブスクリプションオーダーを満たすために必要なリソースを構成するように、リクエストをオーダー支給モジュール724に送信する。オーダー支給モジュール724は、顧客がオーダーしたサービス用のリソースを割当てることができる。オーダー支給モジュール724は、クラウドインフラストラクチャシステム702により提供されたクラウドサービスと、リクエストされたサービスを提供するためのリソースを供給するために使用される物理的な実装層との間の抽象化レベルを形成する。このように、オーダーオーケストレーションモジュール722は、たとえば、サービスおよびリソースをその場で支給するかまたは事前に支給するか、リクエストに応じて割当てる/与えるかなどの実装詳細から独立している。
操作744において、サービスおよびリソースを支給した後、クラウドインフラストラクチャシステム702のオーダー支給モジュール724は、提供されるサービスの通知をクライアント装置704、706および/または708を操作する顧客に送信することができる。
操作746において、オーダー管理および監視モジュール726は、顧客のサブスクリプションオーダーを管理および追跡することができる。いくつかの例において、オーダー管理および監視モジュール726は、サブスクリプションオーダー内のサービスの利用統計、たとえば、ストレージの使用量、データの転送量、ユーザの数、システムの起動時間およびシステムの停止時間を収集するように構成されることができる。
特定の実施形態において、クラウドインフラストラクチャシステム700は、ID管理モジュール728を含むことができる。ID管理モジュール728は、クラウドインフラストラクチャシステム700に、識別サービス、たとえば、アクセス管理および認可サービスを提供するように構成することができる。いくつかの実施形態において、ID管理モジュール728は、クラウドインフラストラクチャシステム702によって提供されたサービスを利用したい顧客に関する情報を制御することができる。このような情報は、顧客のIDを承認する情報、およびさまざまなシステムリソース(たとえば、ファイル、ディレクトリ、アプリケーション、通信ポート、メモリセグメントなど)に対して許可された顧客の実行権限を記載する情報を含むことができる。ID管理モジュール728は、各顧客に関する記述情報、記述情報にアクセスおよび変更する方法、および記述情報にアクセスおよび変更した顧客に対する管理を含むことができる。
図8は、本発明のさまざまな実施形態を実現することができるコンピュータシステム800の一例を示す図である。コンピュータシステム800を用いて、上述したコンピュータシステムのいずれかを実現することができる。図示のように、コンピュータシステム800は、バスサブシステム802を介して、複数の周辺サブシステムと連通する処理ユニット804を含む。周辺サブシステムは、処理加速ユニット806と、I/Oサブシステム808と、記憶サブシステム818と、通信サブシステム824とを含むことができる。記憶サブシステム818は、有形コンピュータ可読記憶媒体822と、システムメモリ810とを含む。
バスサブシステム802は、コンピュータシステム800のさまざまな構成要素およびサブシステムが必要に応じて相互通信させるための機構を形成する。図示には、バスサブシステム802を単一のバスとして概略的に示しているが、代替的な実施形態において、バスサブシステムは、複数のバスを利用してもよい。バスサブシステム802は、メモリバスまたはメモリコントローラ、周辺バス、およびさまざまなバスアーキテクチャのいずれかを使用するローカルバスを備えるいくつかの種類のバス構造のいずれかを有してもよい。たとえば、このようなアーキテクチャは、業界標準アーキテクチャ(ISA)バス、マイクロチャネルアーキテクチャ(MCA)バス、拡張ISA(EISA)バス、ビデオエレクトロニクス規格協会(VESA)ローカルバス、および周辺構成要素相互接続(PCI)バスを含むことができる。これらのバスは、IEEE P1386.1規格に準拠した製造されたメザニンバスとして実現することができる。
1つ以上の集積回路(たとえば、従来のマイクロプロセッサまたはマイクロコントローラ)として実装することができる処理ユニット804は、コンピュータシステム800の操作を制御する。処理ユニット804は、1つ以上のプロセッサを含むことができる。これらのプロセッサは、シングルコアプロセッサであってもよく、マルチコアプロセッサであってもよい。特定の実施形態において、処理ユニット804は、各々シングルコアプロセッサまたはマルチコアプロセッサを備える1つ以上の独立した処理ユニット832および/または834として実装されてもよい。他の実施形態において、処理ユニット804は、2つのデュアルコア(dual-core)プロセッサを単一のチップに集積することにより形成されたクアッドコア(Quad-core)処理ユニットとして実装されてもよい。
さまざまな実施形態において、処理ユニット804は、プログラムコードに応じてさまざまなプログラムを実行することができ、複数のプログラムまたはプロセスを同時に実行することができる。任意の時点で、実行されるプログラムコードの一部または全てはプロセッサ804および/または記憶サブシステム818に常駐する。適切なプログラミングによって、プロセッサ804は、上述したさまざまな機能を提供することができる。コンピュータシステム800は、デジタルシグナルプロセッサ(DSP)および専用プロセッサなどを含むことができる処理加速ユニット806をさらに備えてもよい。
I/Oサブシステム808は、ユーザインターフェイス入力装置と、ユーザインターフェイス出力装置とを含むことができる。ユーザインターフェイス入力装置は、キーボード、マウスまたはトラックボールなどのポインティング装置、ディスプレイに組み込まれたタッチパッドまたはタッチスクリーン、スクロールホイール、クリックホイール、ダイヤル、ボタン、スイッチ、キーパッド、音声命令認識システムを備える音声入力装置、マイクロフォン、および他の種類の入力装置を含んでもよい。また、ユーザインターフェイス入力装置は、たとえば、Microsoft Kinect(登録商標)モーションセンサのようなモーション検知および/またはジェスチャ認識装置を含んでもよい。Microsoft Kinect(登録商標)モーションセンサは、ジェスチャおよび音声命令を利用する自然ユーザインターフェース(NUI)を介して、Microsoft Xbox(登録商標)360ゲームコントローラなどの入力装置を制御することができ、それと対話することができる。また、ユーザインターフェイス入力装置は、Google Glass(登録商標)瞬き検出器のような眼球ジェスチャ認識装置を含むことができる。Google Glass(登録商標)瞬き検出器は、ユーザの眼球活動(たとえば、写真を撮るときおよび/またはメニューを選択するときの「瞬き」)を検出し、眼球活動を入力装置(たとえば、Google Glass(登録商標))に入力する入力に変換する。さらに、ユーザインターフェイス入力装置は、音声命令を介してユーザと音声認識システム(たとえば、Siri(登録商標)ナビゲータ)との対話を可能にする音声認識検出装置を含んでもよい。
また、ユーザインターフェイス入力装置は、三次元(3D)マウス、ジョイスティックまたはポインティングスティック、ゲームパッド、グラフィックタブレット、スピーカなどのオーディオ/ビジュアル装置、デジタルカメラ、デジタルビデオカメラ、ポータブルメディアプレーヤ、ウェブカメラ、イメージスキャナ、指紋スキャナ、バーコードリーダ、3Dスキャナ、3Dプリンタ、レーザ距離計、および視線追跡装置を含むがこれらに限定されない。さらに、ユーザインターフェイス入力装置は、たとえば、コンピュータ断層撮影装置、磁気共鳴像装置、超音波放射断層撮影装置、および医療用超音波装置などのような医用画像入力装置を含んでもよい。また、ユーザインターフェイス入力装置は、たとえば、MIDIキーボードおよび電子楽器などの音声入力装置を含んでもよい。
ユーザインターフェイス出力装置は、ディスプレイサブシステム、インジケータライト、またはオーディオ出力装置などの非視覚ディスプレイを含んでもよい。ディスプレイサブシステムは、たとえば、陰極線管(CRT)、液晶ディスプレイ(LCD)またはプラズマディスプレイを使用するフラットパネル装置、投射装置またはタッチスクリーンであってもよい。一般に、「出力装置」という用語を使用する場合、コンピュータシステム800から情報をユーザまたは他のコンピュータに出力するためのすべての可能な種類の装置および機構を含むことを意図している。たとえば、ユーザインターフェイス出力装置は、文字、画像およびオーディオ/ビデオ情報を視覚的に伝達するさまざまな表示装置、たとえば、モニタ、プリンタ、スピーカ、ヘッドフォン、カーナビゲーションシステム、プロッタ、音声出力装置、およびモデムを含むがこれらに限定されない。
コンピュータシステム800は、記憶サブシステム818を含む。記憶サブシステム818は、ソフトウェア要素を備え、図示では、これらのソフトウェア要素は、システムメモリ810内に配置されている。コンピュータシステム800は、処理ユニット804にロード可能かつ実行可能なプログラム命令、およびこれらのプログラムの実行により生成されたデータを記憶することができる。
コンピュータシステム800の構成およびタイプに応じて、システムメモリ810は、揮発性メモリ(たとえば、ランダムアクセスメモリ(random access memory:RAM))であってもよく、および/または、不揮発性メモリ(たとえば、読取り専用メモリ(read-only memory:ROM)、フラッシュメモリ)であってもよい。一般に、RAMは、処理ユニット804がすぐにアクセス可能なデータおよび/またはプログラムモジュール、および/または、処理ユニット804によって現在操作および実行されているデータおよび/またはプログラムモジュールを収容する。いくつかの実現例では、システムメモリ810は、スタティックランダムアクセスメモリ(static random access memory:SRAM)またはダイナミックランダムアクセスメモリ(dynamic random access memory:DRAM)などの複数の異なるタイプのメモリを含み得る。いくつかの実現例では、始動中などにコンピュータシステム800内の要素間で情報を転送することを助ける基本ルーチンを含む基本入力/出力システム(basic input/output system:BIOS)が、一般にROMに格納され得る。一例としておよび非限定的に、システムメモリ810は、クライアントアプリケーション、ウェブブラウザ、中間層アプリケーション、リレーショナルデータベース管理システム(relational database management system:RDBMS)などを含み得るアプリケーションプログラム812、プログラムデータ814およびオペレーティングシステム816も示す。一例として、オペレーティングシステム816は、マイクロソフトウィンドウズ(登録商標)、Apple Macintosh(登録商標)および/もしくはLinux(登録商標)オペレーティングシステムのさまざまなバージョン、さまざまな市販のUNIX(登録商標)もしくはUNIXライクオペレーティングシステム(さまざまなGNU/Linuxオペレーティングシステム、Google Chrome(登録商標)OSなどを含むが、これらに限定されるものではない)、ならびに/または、iOS、Windows(登録商標)フォン、アンドロイド(登録商標)OS、ブラックベリー(登録商標)10 OSおよびパーム(登録商標)OSオペレーティングシステムなどのモバイルオペレーティングシステムを含み得る。
また、記憶サブシステム818は、いくつかの実施例の機能を提供する基本的なプログラミングおよびデータ構造を格納するための有形のコンピュータ可読記憶媒体を提供し得る。プロセッサによって実行されたときに上記の機能を提供するソフトウェア(プログラム、コードモジュール、命令)が記憶サブシステム818に格納され得る。これらのソフトウェアモジュールまたは命令は、処理ユニット804によって実行され得る。また、記憶サブシステム818は、本発明に従って使用されるデータを格納するためのリポジトリを提供し得る。
また、記憶サブシステム810は、コンピュータ可読記憶媒体822にさらに接続可能なコンピュータ可読記憶媒体リーダ820を含み得る。コンピュータ可読記憶媒体822は、システムメモリ810とともに、または必要に応じてシステムメモリ810と組み合わせて、コンピュータ可読情報を一時的および/または永久に収容、格納、送信および検索するための記憶媒体に加えて、リモート記憶装置、ローカル記憶装置、固定的な記憶装置および/または取外し可能な記憶装置を包括的に表すことができる。
また、コードまたはコードの一部を含むコンピュータ可読記憶媒体822は、当該技術分野において公知のまたは使用される任意の適切な媒体を含み得て、当該媒体は、情報の格納および/または送信のための任意の方法または技術において実現される揮発性および不揮発性の、取外し可能および取外し不可能な媒体などであるが、これらに限定されるものではない記憶媒体および通信媒体を含む。これは、RAM、ROM、電子的消去・プログラム可能ROM(electronically erasable programmable ROM:EEPROM)、フラッシュメモリもしくは他のメモリ技術、CD−ROM、デジタル多用途ディスク(digital versatile disk:DVD)、または他の光学式記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置もしくは他の磁気記憶装置、または他の有形のコンピュータ可読媒体などの有形のコンピュータ可読記憶媒体を含み得る。また、これは、データ信号、データ送信などの無形のコンピュータ可読媒体、または、所望の情報を送信するために使用可能であり且つコンピュータシステム800によってアクセス可能なその他の媒体を含み得る。
一例として、コンピュータ可読記憶媒体822は、取外し不可能な不揮発性磁気媒体から読取るまたは当該媒体に書込むハードディスクドライブ、取外し可能な不揮発性磁気ディスクから読取るまたは当該ディスクに書込む磁気ディスクドライブ、ならびに、CD ROM、DVDおよびブルーレイ(登録商標)ディスクまたは他の光学式媒体などの取外し可能な不揮発性光学ディスクから読取るまたは当該ディスクに書込む光学式ディスクドライブを含み得る。コンピュータ可読記憶媒体822は、ジップ(登録商標)ドライブ、フラッシュメモリカード、ユニバーサルシリアルバス(universal serial bus:USB)フラッシュドライブ、セキュアデジタル(secure digital:SD)カード、DVDディスク、デジタルビデオテープなどを含み得るが、これらに限定されるものではない。また、コンピュータ可読記憶媒体822は、フラッシュメモリベースのSSD、企業向けフラッシュドライブ、ソリッドステートROMなどの不揮発性メモリに基づくソリッドステートドライブ(solid-state drive:SSD)、ソリッドステートRAM、ダイナミックRAM、スタティックRAMなどの揮発性メモリに基づくSSD、DRAMベースのSSD、磁気抵抗RAM(magnetoresistive RAM:MRAM)SSD、およびDRAMとフラッシュメモリベースのSSDとの組み合わせを使用するハイブリッドSSDを含み得る。ディスクドライブおよびそれらの関連のコンピュータ可読媒体は、コンピュータ可読命令、データ構造、プログラムモジュールおよび他のデータの不揮発性記憶装置をコンピュータシステム800に提供し得る。
通信サブシステム824は、他のコンピュータシステムおよびネットワークとのインターフェイスを提供する。通信サブシステム824は、他のシステムからデータを受信したり、コンピュータシステム800から他のシステムにデータを送信するためのインターフェイスの役割を果たす。たとえば、通信サブシステム824は、コンピュータシステム800がインターネットを介して1つ以上の装置に接続することを可能にし得る。いくつかの実施例では、通信サブシステム824は、(たとえば3G、4GまたはEDGE(enhanced data rates for global evolution)などの携帯電話技術、高度データネットワーク技術を用いて)無線音声および/またはデータネットワークにアクセスするための無線周波数(radio frequency:RF)トランシーバ構成要素、WiFi(IEEE1602.11ファミリ標準または他のモバイル通信技術またはそれらの任意の組み合わせ)、全地球測位システム(global positioning system:GPS)レシーバ構成要素、および/または、他の構成要素を含み得る。いくつかの実施例では、通信サブシステム824は、無線インターフェイスに加えて、または無線インターフェイスの代わりに、有線ネットワーク接続(たとえばイーサネット)を提供し得る。
また、いくつかの実施例において、通信サブシステム824は、コンピュータシステム800を使用し得る1人以上のユーザを代表して、構造化されたおよび/または構造化されていないデータフィード826、イベントストリーム828、イベント更新830などの形態で入力通信を受信し得る。
一例として、通信サブシステム824は、ツイッター(登録商標)フィード、フェースブック(登録商標)更新、リッチ・サイト・サマリ(Rich Site Summary:RSS)フィードなどのウェブフィードなどのデータフィード826をリアルタイムでソーシャルネットワークおよび/または他の通信サービスのユーザから受信し、および/または、1つ以上の第三者情報源からリアルタイム更新を受信するように構成され得る。
また、通信サブシステム824は、連続的なデータストリームの形態でデータを受信するように構成され得て、当該データは、連続的である場合もあれば本質的に明確な端部を持たない状態で境界がない場合もあるリアルタイムイベントのイベントストリーム828および/またはイベント更新830を含み得る。連続的なデータを生成するアプリケーションの例としては、たとえばセンサデータアプリケーション、金融ティッカ、ネットワーク性能測定ツール(たとえばネットワークモニタリングおよびトラフィック管理アプリケーション)、クリックストリーム分析ツール、自動車交通モニタリングなどを含み得る。
また、通信サブシステム824は、構造化されたおよび/または構造化されていないデータフィード826、イベントストリーム828、イベント更新830などを、コンピュータシステム800に結合された1つ以上のストリーミングデータソースコンピュータと通信し得る1つ以上のデータベースに出力するように構成され得る。
コンピュータシステム800は、手持ち式携帯機器(たとえばiPhone(登録商標)携帯電話、Ipad(登録商標)計算タブレット、PDA)、ウェアラブル装置(たとえばGoogle Glass(登録商標)ヘッドマウントディスプレイ)、PC、ワークステーション、メインフレーム、キオスク、サーバラックまたはその他のデータ処理システムを含むさまざまなタイプのうちの1つであってもよい。
コンピュータおよびネットワークが絶え間なく進化し続けるため、図示されているコンピュータシステム800の説明は、特定の例として意図されているにすぎない。図に示されているシステムよりも多くのまたは少ない数の構成要素を有する多くの他の構成が可能である。例えば、ハードウェア、ファームウェア、(アプレットを含む)ソフトウェア、または組み合わせにおいて、カスタマイズされたハードウェアも使用されてもよく、および/または、特定の要素が実装されてもよい。さらに、ネットワーク入力/出力装置などの他の計算装置への接続が利用されてもよい。本明細書で提供される開示および教示に基づいて、当業者は、さまざまな実施例を実現するための他の手段および/または方法を理解するであろう。
前述の説明において、説明の目的で、本発明の実施形態を完全に理解できるようにするために、多くの具体的な詳細を記載する。しかしながら、これらの具体的な詳細がなくても本発明を実施できることは明らかであろう。場合によって、一部の周知の構造および装置は、ブロック図で示される。
上記の説明は、例示的な実施形態を提供するもののみであり、本開示の範囲、適用性または構成を限定するものではない。むしろ、例示的な実施形態の上記の説明は、例示的な実施形態を実施可能な説明を当業者に提供する。理解すべきことは、添付の特許請求の範囲に記載された発明の精神および範囲から逸脱することなく、要素の機能および要素の配置にさまざまな変更を加えることができることである。
本発明の実施形態を完全に理解するために、上記の記載において、具体的な詳細を説明した。しかしながら、当業者には、これらの具体的な詳細がなくても、本発明の実施形態を実施できることが理解されるであろう。例えば、不必要な詳細で実施形態を不明瞭にしないように、回路、システム、ネットワーク、プロセスおよび他の構成要素をブロック要素として示してもよい。他の例において、実施形態を不明瞭にしないように、不必要な詳細なしで、周知の回路、プロセス、アルゴリズム、構造および技術を示してもよい。
また、留意すべきことは、各々の実施形態は、フローチャート、フロー図、データフロー図、構造図、またはブロック図として示された処理として説明されていることである。フローチャートは、操作を順次処理として説明しているが、多くの操作は、並行でまたは同時に実行することができる。さらに、操作の順序を再配置してもよい。処理は、その操作が完了した時点で終了するが、図に示されていない追加のステップを含んでもよい。処理は、メソッド、関数、プロシージャ、サブルーチン、サブプログラムなどに対応することができる。処理が関数に対応する場合、その終了は、呼び出し関数またはメイン関数の戻りに対応することができる。
「コンピュータ可読媒体」という用語は、命令および/またはデータを記憶、格納または搬送することができる可搬型または固定型記憶装置、光記憶装置、無線チャネル、およびさまざまな他の媒体を含むが、これらに限定されない。コードセグメントまたは機械実行可能な命令は、プロシージャ、関数、サブプログラム、プログラム、ルーチン、サブルーチン、モジュール、ソフトウェアパッケージ、クラス、もしくは命令、データ構造またはプログラム文の任意の組合せを表すことができる。コードセグメントは、情報、データ、引数、パラメータ、またはメモリ内容を転送および/または受取ることによって、別のコードセグメントまたはハードウェア回路に結合されてもよい。情報、引数、パラメータおよびデータなどは、メモリ共有、メッセージ転送、トークン転送、ネットワーク送信などの任意の適切な手段を介して、伝達され、転送され、または送信され得る。
さらに、実施形態は、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語、またはそれらの任意の組み合わせによって実施されてもよい。ソフトウェア、ファームウェア、ミドルウェアまたはマイクロコードに実施される場合、必要な作業を実行するプログラムコードまたはコードセグメントは、機械可読媒体に格納されてもよい。プロセッサは、必要な作業を実行することができる。
上記の明細書では、本発明の局面は、その具体的な実施例を参照して記載されているが、本発明はこれに限定されるものではないことを当業者は認識するであろう。上記の発明のさまざまな特徴および局面は、個々にまたは一緒に使用されてもよい。さらに、実施例は、明細書のより広い精神および範囲から逸脱することなく、本明細書に記載されているものを越えたどのような環境およびアプリケーションでも利用可能である。したがって、明細書および図面は、限定的ではなく例示的であるものとみなされるべきである。
さらに、例示の目的のために、特定の順序で方法を記載した。代替の実施形態において、記載された順序と異なる順序で方法を実行してもよい。また、上述した方法は、ハードウェア構成要素によって実行されてもよく、または一連の機械実行可能な命令で具体化されてもよい。機械実行可能な命令を用いて、汎用または専用プロセッサもしくは命令でプログラムされたロジック回路に指示して、方法を実行することができる。これらの機械実行可能な命令は、1つ以上の機械可読媒体、例えば、CD−ROMまたは他の種類の光ディスク、フロッピー(登録商標)ディスク、ROM、RAM、EPROM、EEPROM、磁気または光カード、フラッシュメモリ、または電子命令の記憶に適した他の種類の機械可読媒体を含む。代替的に、これらの方法は、ハードウェアおよびソフトウェアの組み合わせによって実行されてもよい。

Claims (11)

  1. コンピュータドメインのオントロジを言語間にマッピングする方法であって、
    コンピュータシステムが、第1言語の第1オントロジを受付けるステップを含み、前記第1オントロジは、第1複数の見出語と、前記複数の見出語間の複数の関係とを有し、
    前記コンピュータシステムが、第2言語の第2複数の見出語を受付けるステップを含み、前記第2複数の見出語は、ウェブドメインの前記第2言語のバージョンから生成され、前記第1複数の見出語は、同じ前記ウェブドメインの前記第1言語のバージョンから生成され
    前記コンピュータシステムが、前記第2言語の前記第2複数の見出語の各々を前記第1言語の前記第1複数の見出語内の対応する見出語にマッピングするステップと、
    前記コンピュータシステムが、前記第1オントロジ内の前記複数の関係をテンプレートとして使用して前記第2複数の見出語を相互に関連付けすることによって、前記第2言語の前記第2複数の見出語間の関係を作成するステップと、
    前記コンピュータシステムが、前記第2複数の見出語と前記第2複数の見出語間の関係とを含む第2オントロジを生成するステップとを含む、方法。
  2. 前記第1オントロジは、前記第1複数の見出語によって表される概念の相互関係を符号化する言語に依存しないオントロジを含む、請求項1に記載の方法。
  3. 前記第2複数の見出語は、所定の長さよりも短く、少なくとも所定の回数でコーパスに出現するnグラムを含む、請求項1または2に記載の方法。
  4. 前記第1オントロジの前記複数の関係は、前記第2オントロジに直接挿入される、請求項1からのいずれか1項に記載の方法。
  5. 前記第2言語の前記第2複数の見出語の各々を前記第1言語の前記第1複数の見出語内の対応する見出語にマッピングするステップは、前記第2言語の前記第2複数の見出語を前記第1言語に翻訳することを含む、請求項1からのいずれか1項に記載の方法。
  6. 命令を含むコンピュータ可読プログラムであって、前記命令は、1つ以上のプロセッサによって実行されると、前記1つ以上のプロセッサに以下の操作を実行させ、当該操作は、
    第1言語の第1オントロジを受付ける操作を含み、前記第1オントロジは、第1複数の見出語と、前記複数の見出語間の複数の関係とを有し、
    第2言語の第2複数の見出語を受付ける操作を含み、前記第2複数の見出語は、ウェブドメインの前記第2言語のバージョンから生成され、前記第1複数の見出語は、同じ前記ウェブドメインの前記第1言語のバージョンから生成され
    前記第2言語の前記第2複数の見出語の各々を前記第1言語の前記第1複数の見出語内の対応する見出語にマッピングする操作と、
    前記第1オントロジ内の前記複数の関係をテンプレートとして使用して、前記第2複数の見出語を相互に関連付けすることによって、前記第2言語の前記第2複数の見出語間の関係を作成する操作と、
    前記第2複数の見出語と前記第2複数の見出語間の関係とを含む第2オントロジを生成する操作とを含む、コンピュータ可読プログラム。
  7. 前記第1オントロジは、前記第1複数の見出語によって表される概念の相互関係を符号化する言語に依存しないオントロジを含む、請求項に記載のコンピュータ可読プログラム。
  8. 前記第2複数の見出語は、所定の長さよりも短く、少なくとも所定の回数でコーパスに出現するnグラムを含む、請求項6または7に記載のコンピュータ可読プログラム。
  9. 前記第1オントロジの前記複数の関係は、前記第2オントロジに直接挿入される、請求項からのいずれか1項に記載のコンピュータ可読プログラム。
  10. 前記第2言語の前記第2複数の見出語の各々を前記第1言語の前記第1複数の見出語内の対応する見出語にマッピングする操作は、前記第2言語の前記第2複数の見出語を前記第1言語に翻訳することを含む、請求項からのいずれか1項に記載のコンピュータ可読プログラム。
  11. システムであって、
    1つ以上のプロセッサと、
    命令を含む1つ以上の記憶装置とを備え、前記命令は、前記1つ以上のプロセッサによって実行されると、前記1つ以上のプロセッサに以下の操作を実行させ、当該操作は、
    第1言語の第1オントロジを受付ける操作を含み、前記第1オントロジは、第1複数の見出語と、前記複数の見出語間の複数の関係とを有し、
    第2言語の第2複数の見出語を受付ける操作を含み、前記第2複数の見出語は、ウェブドメインの前記第2言語のバージョンから生成され、前記第1複数の見出語は、同じ前記ウェブドメインの前記第1言語のバージョンから生成され
    前記第2言語の前記第2複数の見出語の各々を前記第1言語の前記第1複数の見出語内の対応する見出語にマッピングする操作と、
    前記第1オントロジ内の前記複数の関係をテンプレートとして使用して前記第2複数の見出語を相互に関連付けすることによって、前記第2言語の前記第2複数の見出語の相互関係を作成する操作と、
    前記第2複数の見出語と前記第2複数の見出語間の関係とを含む第2オントロジを生成する操作とを含む、システム。
JP2017525068A 2014-11-10 2015-10-14 コンピュータ自然言語処理における見出語と汎用オントロジとのマッピング Active JP6320637B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201462077868P 2014-11-10 2014-11-10
US201462077887P 2014-11-10 2014-11-10
US62/077,887 2014-11-10
US62/077,868 2014-11-10
US14/793,658 2015-07-07
US14/793,658 US9582493B2 (en) 2014-11-10 2015-07-07 Lemma mapping to universal ontologies in computer natural language processing
PCT/US2015/055489 WO2016077015A1 (en) 2014-11-10 2015-10-14 Lemma mapping to universal ontologies in computer natural language processing

Publications (2)

Publication Number Publication Date
JP2017539006A JP2017539006A (ja) 2017-12-28
JP6320637B2 true JP6320637B2 (ja) 2018-05-09

Family

ID=55912345

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2017525070A Active JP6279153B2 (ja) 2014-11-10 2015-10-14 言語入力データからnグラムおよび概念関係の自動生成
JP2017525068A Active JP6320637B2 (ja) 2014-11-10 2015-10-14 コンピュータ自然言語処理における見出語と汎用オントロジとのマッピング
JP2018004992A Active JP6714024B2 (ja) 2014-11-10 2018-01-16 言語入力データからnグラムおよび概念関係の自動生成

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2017525070A Active JP6279153B2 (ja) 2014-11-10 2015-10-14 言語入力データからnグラムおよび概念関係の自動生成

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2018004992A Active JP6714024B2 (ja) 2014-11-10 2018-01-16 言語入力データからnグラムおよび概念関係の自動生成

Country Status (5)

Country Link
US (3) US9842102B2 (ja)
EP (2) EP3218820A1 (ja)
JP (3) JP6279153B2 (ja)
CN (2) CN107111608A (ja)
WO (2) WO2016077015A1 (ja)

Families Citing this family (148)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
DE212014000045U1 (de) 2013-02-07 2015-09-24 Apple Inc. Sprach-Trigger für einen digitalen Assistenten
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
DE112014002747T5 (de) 2013-06-09 2016-03-03 Apple Inc. Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9842102B2 (en) 2014-11-10 2017-12-12 Oracle International Corporation Automatic ontology generation for natural-language processing applications
GB2549240A (en) * 2015-01-06 2017-10-18 What3Words Ltd A method for suggesting one or more multi-word candidates based on an input string received at an electronic device
US9218427B1 (en) * 2015-01-21 2015-12-22 Maana, Inc. Dynamic semantic models having multiple indices
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10262061B2 (en) 2015-05-19 2019-04-16 Oracle International Corporation Hierarchical data classification using frequency analysis
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US10042998B2 (en) * 2015-06-04 2018-08-07 International Business Machines Corporation Automatically altering and encrypting passwords in systems
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US20170116180A1 (en) * 2015-10-23 2017-04-27 J. Edward Varallo Document analysis system
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) * 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10878191B2 (en) * 2016-05-10 2020-12-29 Nuance Communications, Inc. Iterative ontology discovery
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US9948664B2 (en) * 2016-07-11 2018-04-17 Petabi, Inc. Method and system for correlation and management of distributed and heterogeneous events
HK1220319A2 (zh) * 2016-07-29 2017-04-28 李應樵 基於結構化網絡知識的自動中文本體庫建構方法、系統及計算機可讀介質
US10621314B2 (en) * 2016-08-01 2020-04-14 Palantir Technologies Inc. Secure deployment of a software package
US10762297B2 (en) * 2016-08-25 2020-09-01 International Business Machines Corporation Semantic hierarchical grouping of text fragments
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10467347B1 (en) 2016-10-31 2019-11-05 Arria Data2Text Limited Method and apparatus for natural language document orchestrator
US10268680B2 (en) * 2016-12-30 2019-04-23 Google Llc Context-aware human-to-computer dialog
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US11507743B2 (en) * 2017-02-28 2022-11-22 Nice Ltd. System and method for automatic key phrase extraction rule generation
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
US10289615B2 (en) * 2017-05-15 2019-05-14 OpenGov, Inc. Natural language query resolution for high dimensionality data
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) * 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US10466963B2 (en) 2017-05-18 2019-11-05 Aiqudo, Inc. Connecting multiple mobile devices to a smart home assistant account
US20200167525A1 (en) * 2017-06-08 2020-05-28 3M Innovative Properties Company Systems and methods for word filtering in language models
US11568273B2 (en) 2017-11-14 2023-01-31 International Business Machines Corporation Multi-dimensional cognition for unified cognition in cognitive assistance
US11443196B2 (en) 2017-11-14 2022-09-13 International Business Machines Corporation Unified cognition for a virtual personal cognitive assistant when cognition is embodied across multiple embodied cognition object instances
US11544576B2 (en) * 2017-11-14 2023-01-03 International Business Machines Corporation Unified cognition for a virtual personal cognitive assistant of an entity when consuming multiple, distinct domains at different points in time
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
JP7074365B2 (ja) * 2017-12-11 2022-05-24 株式会社レボーン 香り品質特定システム、高機能携帯端末及びプログラム
CN108154395B (zh) * 2017-12-26 2021-10-29 上海新炬网络技术有限公司 一种基于大数据的客户网络行为画像方法
US10963495B2 (en) 2017-12-29 2021-03-30 Aiqudo, Inc. Automated discourse phrase discovery for generating an improved language model of a digital assistant
US10929613B2 (en) 2017-12-29 2021-02-23 Aiqudo, Inc. Automated document cluster merging for topic-based digital assistant interpretation
US10176171B1 (en) * 2017-12-29 2019-01-08 Aiqudo, Inc. Language agnostic command-understanding digital assistant
US10963499B2 (en) 2017-12-29 2021-03-30 Aiqudo, Inc. Generating command-specific language model discourses for digital assistant interpretation
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10872122B2 (en) * 2018-01-30 2020-12-22 Government Of The United States Of America, As Represented By The Secretary Of Commerce Knowledge management system and process for managing knowledge
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10671812B2 (en) * 2018-03-22 2020-06-02 Equifax Inc. Text classification using automatically generated seed data
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US11076039B2 (en) 2018-06-03 2021-07-27 Apple Inc. Accelerated task performance
CN110647589B (zh) * 2018-06-08 2021-06-25 北京三快在线科技有限公司 一种语料数据的生成方法、装置、电子设备及存储介质
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11874864B2 (en) * 2018-11-29 2024-01-16 Koninklijke Philips N.V. Method and system for creating a domain-specific training corpus from generic domain corpora
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11328007B2 (en) * 2019-02-04 2022-05-10 International Business Machines Corporation Generating a domain-specific phrasal dictionary
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11429789B2 (en) 2019-06-12 2022-08-30 International Business Machines Corporation Natural language processing and candidate response identification
US11163953B2 (en) 2019-06-12 2021-11-02 International Business Machines Corporation Natural language processing and candidate response evaluation
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
US20210097404A1 (en) * 2019-09-26 2021-04-01 Kpmg Llp Systems and methods for creating product classification taxonomies using universal product classification ontologies
WO2021195133A1 (en) 2020-03-23 2021-09-30 Sorcero, Inc. Cross-class ontology integration for language modeling
US11038934B1 (en) 2020-05-11 2021-06-15 Apple Inc. Digital assistant hardware abstraction
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11301639B2 (en) * 2020-06-26 2022-04-12 Huawei Technologies Co., Ltd. Methods and systems for generating a reference data structure for anonymization of text data
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
US11775773B2 (en) 2020-12-15 2023-10-03 Kore.Ai, Inc. Methods for conducting a conversation in an application enabled by a virtual assistant server and devices thereof
TWI800982B (zh) 2021-11-16 2023-05-01 宏碁股份有限公司 文章標記資料的產生裝置及其產生方法
US11977841B2 (en) 2021-12-22 2024-05-07 Bank Of America Corporation Classification of documents

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9727322D0 (en) 1997-12-29 1998-02-25 Xerox Corp Multilingual information retrieval
JP3768157B2 (ja) * 2001-12-28 2006-04-19 株式会社東芝 他言語オントロジー辞書利用装置及び方法並びにプログラム
JP2005316699A (ja) * 2004-04-28 2005-11-10 Hitachi Ltd コンテンツ公開システム、コンテンツ公開方法、及びコンテンツ公開プログラム
US20060122834A1 (en) * 2004-12-03 2006-06-08 Bennett Ian M Emotion detection device & method for use in distributed systems
JP4404211B2 (ja) * 2005-03-14 2010-01-27 富士ゼロックス株式会社 マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム
US7587308B2 (en) * 2005-11-21 2009-09-08 Hewlett-Packard Development Company, L.P. Word recognition using ontologies
US7676489B2 (en) 2005-12-06 2010-03-09 Sap Ag Providing natural-language interface to repository
JP2007219620A (ja) * 2006-02-14 2007-08-30 Fuji Xerox Co Ltd テキスト検索装置、テキスト検索プログラム、及びテキスト検索方法
US7797303B2 (en) 2006-02-15 2010-09-14 Xerox Corporation Natural language processing for developing queries
US8204751B1 (en) * 2006-03-03 2012-06-19 At&T Intellectual Property Ii, L.P. Relevance recognition for a human machine dialog system contextual question answering based on a normalization of the length of the user input
JP4891737B2 (ja) * 2006-11-17 2012-03-07 日本放送協会 知識メタデータ生成装置、ダイジェスト生成装置、知識メタデータ生成プログラム、及びダイジェスト生成プログラム
US20110087670A1 (en) 2008-08-05 2011-04-14 Gregory Jorstad Systems and methods for concept mapping
US8396287B2 (en) * 2009-05-15 2013-03-12 Google Inc. Landmarks from digital photo collections
US8423350B1 (en) 2009-05-21 2013-04-16 Google Inc. Segmenting text for searching
US8747115B2 (en) * 2012-03-28 2014-06-10 International Business Machines Corporation Building an ontology by transforming complex triples
US20140278362A1 (en) 2013-03-15 2014-09-18 International Business Machines Corporation Entity Recognition in Natural Language Processing Systems
US9984067B2 (en) 2014-04-18 2018-05-29 Thomas A. Visel Automated comprehension of natural language via constraint-based processing
US10540365B2 (en) 2014-05-30 2020-01-21 Apple Inc. Federated search
CN104133848B (zh) * 2014-07-01 2017-09-19 中央民族大学 藏语实体知识信息抽取方法
US9842102B2 (en) 2014-11-10 2017-12-12 Oracle International Corporation Automatic ontology generation for natural-language processing applications
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US10095689B2 (en) 2014-12-29 2018-10-09 International Business Machines Corporation Automated ontology building
US10262061B2 (en) 2015-05-19 2019-04-16 Oracle International Corporation Hierarchical data classification using frequency analysis

Also Published As

Publication number Publication date
US20160132482A1 (en) 2016-05-12
JP6279153B2 (ja) 2018-02-14
US9582493B2 (en) 2017-02-28
JP2017537391A (ja) 2017-12-14
CN107077466A (zh) 2017-08-18
EP3218820A1 (en) 2017-09-20
EP3218821A1 (en) 2017-09-20
US20160132487A1 (en) 2016-05-12
CN107077466B (zh) 2019-06-21
US9678946B2 (en) 2017-06-13
US9842102B2 (en) 2017-12-12
JP6714024B2 (ja) 2020-06-24
CN107111608A (zh) 2017-08-29
WO2016077015A1 (en) 2016-05-19
US20160132484A1 (en) 2016-05-12
JP2017539006A (ja) 2017-12-28
WO2016077016A1 (en) 2016-05-19
JP2018097887A (ja) 2018-06-21

Similar Documents

Publication Publication Date Title
JP6320637B2 (ja) コンピュータ自然言語処理における見出語と汎用オントロジとのマッピング
US9948700B2 (en) ADFDI support for custom attribute properties
JP6439043B2 (ja) 文脈検索文字列同義語の自動生成
US11334638B2 (en) Methods and systems for updating a search index
US10614048B2 (en) Techniques for correlating data in a repository system
US10789050B2 (en) Stage file objects in a visual design tool for integration development
US10855561B2 (en) Predictive service request system and methods
US9665560B2 (en) Information retrieval system based on a unified language model
US20210191938A1 (en) Summarized logical forms based on abstract meaning representation and discourse trees
US20170124181A1 (en) Automatic fuzzy matching of entities in context
US11392560B2 (en) Consolidating and transforming metadata changes
US20150199535A1 (en) Organization-based policies
US10262061B2 (en) Hierarchical data classification using frequency analysis
US20150199625A1 (en) Logical and physical organization management
US11971864B2 (en) Online merging of fragmented computing resources across storage servers by tenant in cloud environments
US20240005200A1 (en) Generation of inference logic from training-time artifacts for machine learning model deployments
US20230066143A1 (en) Generating similarity scores between different document schemas
US10372488B2 (en) Parallel processing using memory mapping

Legal Events

Date Code Title Description
A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20171225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180313

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180403

R150 Certificate of patent or registration of utility model

Ref document number: 6320637

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250