JP2007004633A - 言語モデル作成装置およびそれにより作成された言語モデルを使用する言語処理装置 - Google Patents

言語モデル作成装置およびそれにより作成された言語モデルを使用する言語処理装置 Download PDF

Info

Publication number
JP2007004633A
JP2007004633A JP2005185764A JP2005185764A JP2007004633A JP 2007004633 A JP2007004633 A JP 2007004633A JP 2005185764 A JP2005185764 A JP 2005185764A JP 2005185764 A JP2005185764 A JP 2005185764A JP 2007004633 A JP2007004633 A JP 2007004633A
Authority
JP
Japan
Prior art keywords
language model
reading
language
model creation
creation device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005185764A
Other languages
English (en)
Inventor
Hiroaki Kaneki
宏明 鹿子木
Miyuki Seki
美由紀 関
Ryoji Sato
良治 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Priority to JP2005185764A priority Critical patent/JP2007004633A/ja
Publication of JP2007004633A publication Critical patent/JP2007004633A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

【課題】 かな漢字変換候補のヒット率を向上させる。
【解決手段】 かな漢字変換処理で使用する言語モデルの記載内容に読みの要素を加える。より具体的には言語モデルを作成する際に同一の表記および読みを有する複数の単語の出現頻度をコーパスの中で計数し、少なくとも、その計数結果から得られる出現確率を格納するフィールドと対応の単語の読みを格納するフィールドおよび対応する表記を格納するフィールドとで言語モデルを構成する。
【選択図】 図3

Description

本発明は、読みをその表記に変換する言語処理装置で使用される言語モデルを作成する言語モデル作成装置およびそれにより作成された言語モデルを使用する言語処理装置などに関する。
従来、読みをその表記に変換する処理は、一般的にはかな漢字変換と呼ばれている。日本語や中国語などのように、言語処理装置に対して文字を入力する場合、読みを示す文字列をキーボードから入力し、言語処理装置において、入力された読み(表音文字、いわゆるかな文字)の文字列をその表記を表す文字列(表意文字、いわゆる漢字)に変換した後、変換された文字列をアプリケーションプログラム、例えば、ワープロソフトに引き渡す。
この際に、読みに対して、複数の変換候補、いわゆる同音異義語が存在する場合、言語処理装置は複数の変換候補あるいは最優先の変換候補を表示画面に表示してユーザの選択を受け付ける。同音異義語の優先順位を付ける場合に言語モデルを使用する言語処理方法が知られている(特許文献1参照)。
従来の言語モデルの構成を図1に示す。
図1に示す言語モデル100はトライグラム(3つの連続する単語の組み合わせ)の例を示す
図1において、101は第1番目の単語のフィールド(格納欄)で表記の文字列の形態で格納される。102は第1番目の単語に引き続いて使用される単語のフィールドで表記の文字列の形態で記憶される。103は第2番目の単語に引きついて使用される単語のフィールドであり、表記の文字列の形態で格納される。104はこれら3つの単語が存在する確率の値を格納するフィールドである。
新聞や雑誌に記載されている多数の文に基づいて3つの連続する単語の同一の組み合わせの出現個数が計数されて、確率の値があらかじめ決められる。
このような言語モデル100を使用して、同音異義語の順位付けを次に説明する。
図2(a)に示すように、ユーザがキーボードから「にほんはうつくしいくにです」と読みの文字列を入力し、第1番目の表記として「日本」を確定し、第2番目の表記として「は」を確定したとする。第3番目の表記を確定する前に情報処理装置は最初に「うつくしい」に相当する変換候補「美しい」、「うつくしい」、「ウツクシイ」、「倩」などの変換候補を漢字辞書から取得する。漢字辞書は単語辞書とも呼ばれ、読みと表記を記載した辞書である。
次に情報処理装置は図2(b)に示すように第1番目および第2番目の表記の文字列の単語と第3番目の変換候補の表記の文字列の単語を組み合わせ、その組み合わせに対応する確率を図1の言語モデルから取得する。取得した確率の順に優先順位が決められる。
上述の例はトライグラムの言語モデルを使用する変換例であるが、実際には、バイグラム(2つの単語の組み合わせ)の言語モデルと併用される。
特開平2002−117025
上述したように言語モデルはn(2以上の整数)個の表記の組み合わせとその組み合わせの出現の確率で少なくとも構成されるので、読みのつながりを配慮していない。
たとえば、「むだ」と入力した場合のかな漢字変換処理についての問題を説明する。
「夢」は「ゆめ」、「む」という読みを持つ。
読み「む」に対応する表記を有する単語しては以下のものがある。
夢 だ
白日 夢
無駄
夢 だ
従来技術は、表記だけでとらえる。従って、仮に上記単語に読みをあてた場合、以下のいずれも許容して、従来の言語モデルでは同じ出現確率としてしまう。
夢(ゆめ) だ
夢(む) だ
従来の言語モデルでは、上記の場合出現確率がP(夢)=3/7, P(だ|夢)=2/3, P(だ)=2/7, P(白日)=1/7, P(夢|白日)=1, P(無駄)=1/7 となる。
したがって「むだ」という読みを入力として与えられた場合、かな漢字変換処理では漢字(単語)辞書を引いて、「無駄」「夢」「だ」を得る。
次いで言語モデルを検索し、出現確率P(無駄)=1/7, P(夢)*P(だ|夢)=3/7*2/3=9/21を得る。その結果、「むだ」の読みに対して「夢だ」を変換結果として返してしまう。ユーザが「無駄」への変換を希望している場合、これはエラーである。
そこで、本発明の目的は、上述の点に鑑みて、読みから表記への変換効率(ヒット率)を向上させる言語モデル作成装置およびそれにより作成された言語モデルを使用する言語処理装置、ならびに関連の方法およびプログラムを提供することにある。
このような目的を達成するために、本発明は、複数の自然語の文が表記の文字の形態で記載されたコーパスを入力する入力手段と、当該入力されたコーパスの中の文に対して単語単位で読みを付加する付加手段と、当該付加された読みおよび対応する表記の前記コーパス中の出現個数を計数することにより該読みおよび対応する表記の出現確率を計算する計算手段と、当該計算手段により計算された出現確率、対応する読みおよび対応する表記を言語モデルとして記憶する記憶手段とを備えたことを特徴とする。
本発明は、さらに、請求項1に記載の言語モデル作成装置により作成された言語モデルを使用して、入力の読みを、対応する表記に変換する言語処理装置であって、前記言語モデルを記憶する記憶手段と、前記記憶手段に記憶された言語モデルの出現確率に応じて、読みから変換すべき変換候補の順位付けを行なう情報処理手段とを備えたことを特徴とする。
本発明によれば、従来の言語モデルの構成に単語の読みのつながりが単語の出現確率の値の中に加味されているので、表記のつながりの出現確率だけを使用する従来の言語モデルよりも出現確率の精度が向上する。
さらに本発明のモデルを使用することにより、読みから表記の際に行なう変換候補の順位付けの精度(ヒット率)も向上する。
具体例を挙げると、表記に読みを付加し、コーパスを以下の状態にする。
夢・ゆめ だ・だ
白日・はくじつ 夢・む
無駄・むだ
夢・ゆめ だ・だ
表記および読みの対の出現確率は、 P(夢・ゆめ)=2/7, P(だ・だ|夢・ゆめ)=1, P(だ,だ)=1/7, P(白日・はくじつ)=1/7, P(夢・む|白日・はくじつ)=1, P(夢・む)=1/7, P(無駄・むだ)=1/7. となる。
このため、入力として「むだ」を与えられた場合、かな漢字変換処理では漢字辞書を引き、「無駄・むだ」、「夢・む」、「だ・だ」を得る。次に、言語モデルを検索し、P(だ・だ|夢・む)という確率が存在しないので出現確率を0とし、さらに出現確率P(無駄・むだ)=1/7, P(夢・む)*P(だ・だ|夢・む)=1/7*0=0 を得る。「無駄・むだ」の方が(夢・む)(だ・だ)よりも出現確率が高いので、かな漢字変換処理では、そこで、出現確率の高い方の「無駄」を変換結果の候補として高い順位を与える。
以下、図面を参照して本発明の実施形態を詳細に説明する。
最初に本発明に係わる言語モデルの構成を図3を参照して説明する。図3において、300は言語モデルである。310は第1の単語のためのフィールドで有り、単語の表記のためのサブフィールド311およびその単語の読みのためのサブフィールド312を有する。320は第第1の単語に隣接して接続して使用される2の単語のためのフィールドで有り、単語の表記のためのサブフィールド321およびその単語の読みのためのサブフィールド322を有する。
330は第2の単語に隣接して接続して使用される3の単語のためのフィールドで有り、単語の表記のためのサブフィールド331およびその単語の読みのためのサブフィールド332を有する。
一例を挙げると「日本」「は」「美しい」という3つの連続する単語に対して、
「日本」という第1番目の単語の表記がサブフィールド311に格納され、その読み「にほん」がサブフィールド312に格納される。第2番目の単語の表記「は」はサブフィールド321に格納され、その読み「は」がサブフィールド322に格納される。第3番目の単語の表記「美しい」はサブフィールド331に格納され、その読み「うつくしい」がサブフィールド332に格納される。
なお、「日本」にはべつの読みとして「にっぽん」があるが、このように1つの単語の表記に対して複数の読みがある場合には、その読みを使用して、別のレコードを格納すればよい。
この例では「日本、にほん、は、は、美しい、うつくしい」が1つのレコードであり、さらに、「日本、にっぽん、は、は、美しい、うつくしい」という別のレコードが言語モデルに格納される。
340は上述した3つの単語の表記および読みの組み合わせが出現する確率(出現確率)の値を格納するフィールドである。
以上が言語モデル300の必要最小限のデータ構成であるが、その他、複数の単語の組み合わせの分野を示す属性値などを言語モデル300に格納してもよい。
図3に示す言語モデルを作成するための言語モデル作成装置を図4に示す。言語モデル作成装置としては市販されているパーソナルコンピュータを使用することができるので説明は簡単にとどめる。
図4において、401は言語モデルを作成するための情報処理を実行するCPU401である。402にはディスプレイであり、言語モデル作成に係わる表示を行なう。403はシステムメモリであり、CPU401が実行する言語モデル作成プログラム、そのプログラムの実行に必要なデータを記憶する。システムメモリ403に加えて、ハードディスク記憶装置を併用してもよい。404は第1の入力装置であり、コーパスの入力を行なう。第1の入力装置404としては、コーパスを文字の形態で入力するキーボード、コーパスを電子データの形態でフロッピー(登録商標)ディスク、CDROMなどから入力するディスクドライブ(ディスク読取装置)、インターネットなどを介して外部のコンピュータから入力するモデムなどの通信装置およびその他のいずれかを使用することができる。本実施形態では、コーパスとは新聞、雑誌など複数の文章、すなわち、自然言語の複数の単語の表記が記載された文書を総称する用語を意味する。
405は第2の入力装置であり、CPU401に対する指示などを入力する。第2の入力装置405としてはキーボードおよびマウスなどのポインティングデバイスを使用することができる。
406は言語モデルを出力するための出力装置であり、出力装置406としては、フロッピー(登録商標)ディスク、CDROMに書き込むディスク書き込み装置、モデムなどの通信装置、プリンタなどを種々の出力装置を使用することができる。
このようなシステム構成の言語モデル作成装置で実行される言語モデル作成処理を図5を参照して説明する。図5はCPU401が実行する言語モデル作成プログラムの内容を示す。
言語モデル作成プログラムは、不図示のハードディスク装置からシステムメモリ403にロードされた後、CPU401により実行される。
最初に第1の入力装置404からコーパスを入力する。一例としては、CPU401の制御でテキストファイルの形態で新聞記事が格納されたCDROMから新聞記事を第1の入力装置404により読み取り、システムメモリ403内の作業領域に格納する。次に、CPU401は格納されたテキストファイルをイメージに変換してディスプレイ402によりディスプレイ402の表示画面503に図6に示すように表示させる(S401)。ユーザはマウス(第2の入力装置405)を使用して作成ボタン501を操作するとCPU401は、システムメモリ403の作業領域に格納されている新聞記事(コーパス)の中の文(複数の単語の表記のつながり)を単語単位で区切る(S402)。単語を区切る方法は従来の言語モデル作成方法と同じ方法を使用することができ、また、その方法は良く知られているので、ここでは詳細な説明を省略する。続いて、CPU401は区切られた単語の表記の各々に読みを付加する。読みの付加の方法には
(1)キーボードを利用して読みを入力する。
(2)漢字辞書(表記とその読みを記載した辞書)を参照して、表記に対応する読みをCPU401により取得する。
などの方法を採用することができる。本実施形態は(2)の例を説明する。
このようにし各単語に対する読みをCPU401が取得すると、システムメモリ403の作業領域中で、単語の表記とその読みを1組のデータとしたストリーム(複数のデータのつながり)を作成する(S403)。CPU401は図7に示すように表画面の左画面601に入力した新聞記事を表示させ、右画面602には、作成したストリームを表示させる。
ユーザは自動的に付加された読みについて、修正すべき箇所をキーボード等により修正する。ユーザの修正に応じてCPU401はシステムメモリ403の作業領域中のストリームの中の該当箇所を修正する。最後にユーザがOKボタン502をマウスで操作するとCPU401は修正後のストリームに基づいて言語モデルを作成する。
一例としては、システムメモリ403の作業領域中のストリームの中の先頭から3つの連続する表記および読みの対を順次に取り出す。ただし、先頭の単語については2つの仮想単語の表記および読みを与える。2番目の単語については1つの仮想単語の表記および読みを与える。この表記を「@」で表すとする。図7のストリームの例では、CPU401は
(1)3つの単語の組み合わせは、先頭の単語(日本/にほん)については(@/@)、(@/@)、(日本/にほん)となる。
(2)2番目の単語については、(@/@)、(日本/にほん)、(は/は)となる。
(3)3番目の単語については、(日本/にほん)、(は/は)、(美しい/うつくしい)となる。
(4)以下、ターゲットとする単語の表記および読みの対を3番目の単語位置に配置し、それ以前に隣接する単語の表記および読みの対を第1番目および第2番目の単語位置に配置した3つの単語の組み合わせをシステムメモリ403の作業領域上で作成する(S404)。
CPU401は3つの単語の組み合わせを1組作成すると、ストリーム中を検索し、同じ組み合わせの出現個数を計数する(S405)。計数が終了すると、システムメモリ403中の言語モデル(図1参照)に、今回使用した3つの単語(表記および読み)および計数結果(出現確率)を対応するフィールドに書き込む(S406)。なお、計数結果の値の変わりに計数結果/ストリーム中の全単語数などを出現確率として使用してもよい。
以下、ターゲットする単語を移動させながら3つの連続する単語(表記および表記)を順次に選択して上述と同様の処理を繰り返す(S404〜S407のループ処理)。
ターゲットとする単語がストリーム中の最後の単語まで移動したときに図5の処理手順が終了する。ターゲットとなる単語を有する3つの単語の組み合わせの重複的な計数を避けるためには、計数に先立って、言語モデルの中に、これから計数しようとする3つの単語がすでに登録されているか、言語モデルを参照すればよい。登録されている場合には、計数を行なわずターゲットの単語を移動させる。
上述のようにしてシステムメモリ403中で作成された言語モデルは出力装置406により、CDROMなどの携帯用記録媒体に出力したり、通信回線を使用して他の情報処理装置に出力すればよい。上述の実施形態ではトライグラム(つの単語の組み合わせ)の言語モデルを作成する例を説明したが、バイグラム(2つの単語の組み合わせ)の場合には、図1の言語モデル中の単語のフィールドが3つから2つに変わることは当業者であれば容易に理解しえよう。各単語のフィールドが読みと表記のサブフィールドを有することは言うまでもない。また、コーパスから取り出す単語が3つから2つに変わることも同様に理解しえよう。
次に言語モデル作成装置により作成された言語モデルを使用してかな漢字変換(読みから表記へ変換する)処理を説明する。
この処理を行う言語処理装置としては市販のパーソナルコンピュータ、携帯電話、サーバなどを使用することができるので、詳細な説明を省略する。なお、システム構成については図4を参照されたい。
言語処理装置のハードディスクに対して上述の言語モデル作成装置により作成され、CDROM等に出力された本発明に係わる言語モデル(図3)が格納されているものとする。このための処理は、たとえば、かな漢字変換プログラムをCDROMからインストールする際に、言語モデルもCPU401によりハードディスクに記憶すればよい。CPU401はキーボード(第2の入力装置405)から表記へ変換すべき読み(たとえば、図9の(a)の読みの入力を受け付ける(S701)。「にほんは」の読みに対して「日本は」が確定されたものとすると、CPU401は、次に、読み「うつくしい」に対応する変換候補の表記「美しい」、「うつくしい」、「ウツクシイ」を単語辞書から取得する。次に、確定済の2つの単語の表記および各変換候補の表記および読みを組み合わせる、この例では、(日本/にほん)と(は/は)と変換候補の表記と読み(美しい/うつくしい)の組み合わせ、(日本/にほん)と(は/は)と変換候補の表記と読み(うつくしい/うつくしい)組み合わせ、(日本/にほん)と(は/は)と変換候補の表記と読み(ウツクシイ/うつくしい)の組み合わせがCPU401により作成される(S703)。CPU401は各組み合わせに対応する出現確率を言語モデルの検索により取得する(S704)。
最後にCPU401は出現確率の値の大きさの順位にしたがって、変換候補「美しい」、「うつくしい」、「ウツクシイ」等の順位付けを行なう(S706)。この例では最高位の「美しい」が初期的に変換候補として表示される(S707)。
以上の述べた変換候補の順位付け処理と従来のかな漢字変換時の順位付け処理の相違点をここで、説明しておく。
従来の順位付けは、変換後の表記のみを組み合わせて言語モデルから出現確率を取り出す。これに対して、本実施形態では表記およびその読みを有する3つの単語を組み合わせ、その組み合わせに対応する出現確率を言語モデルから取り出す点が従来と相違する。
このように、本実施形態では、たとえば、3つの単語の表記が一致し、および3つの単語の読みが一致するような変換候補(表記)を言語モデルから探すので、ヒット率が高くなることは理解されよう。
(第2の実施形態)
コーパスに記載された単語の表記に読みを付加する方法として、表を使用することができる。表はシステムメモリ403上に設ける。
第1の入力装置404からコーパスが入力されると、CPU401により、コーパスかに記載された単語を記載順に取り出して図10に示すように表記記載欄1001に格納していく。次に、表記記載欄1001に対応する読みをCPU401により、単語辞書から取得して読みの記載欄1002に格納する。全ての単語をコーパスから抽出し、読みを付加した後、ディスプレイに図10の表を表示してユーザのキーボードによる修正を受け付ける。修正の後、3つの単語(表記および読みの)を組み合わせて、出現頻度を計算する処理は上述と同様である。
上述の実施形態の他に次の形態を実施できる。
1)上述の実施形態では、言語モデル作成装置はかな漢字変換プログラム製造会社側に設置する例であったが、かな漢字変換プログラムに言語モデル作成プログラムを付加し、ユーザサイドで言語モデルを作成してもよい。
2)さらに、サーバに本発明に係わる分野ごとの言語モデルを用意し、サーバにアクセスしてくるパソコンに言語モデルを搭載するようにしてもよいこと勿論である。
上述の他にも種々の改良形態が存在するが、その改良形態が本発明の技術思想に基づくものである限り、その改良形態は本発明の技術範囲内に属する。
従来の言語モデルの構成の一例を示す説明図である。 かな漢字変換処理を説明するための説明図である。 本発明実施形態の言語モデルの構成の一例を示す説明図である。 本発明実施形態のシステム構成を示すブロック図である。 本発明実施形態の言語モデルの作成手順を示すフローチャートである。 言語モデル作成途中の表示画面の内容を示す説明図である。 言語モデル作成途中の表示画面の内容を示す説明図である。 本発明実施形態の言語モデルを使用したかな漢字変換処理を示すフローチャートである。 本発明実施形態のかな漢字処理の内容を説明するための説明図である。 第2の実施形態の言語モデル作成方法を説明するための説明図である。
符号の説明
401 CPU
402 ディスプレイ
403 システムメモリ
404 第1の入力装置
405 第2の入力装置
406 出力装置

Claims (21)

  1. 複数の自然語の文が表記の文字の形態で記載されたコーパスを入力する入力手段と、
    当該入力されたコーパスの中の文に対して単語単位で読みを付加する付加手段と、
    当該付加された読みおよび対応する表記の前記コーパス中の出現個数を計数することにより該読みおよび対応する表記の出現確率を計算する計算手段と、
    当該計算手段により計算された出現確率、対応する読みおよび対応する表記を言語モデルとして記憶する記憶手段と
    を備えたことを特徴とする言語モデル作成装置。
  2. 請求項1に記載の言語モデル作成装置において、前記記憶手段に記憶された言語モデルを出力する出力手段をさらに備えたことを特徴とする言語モデル作成装置。
  3. 請求項1または2に記載の言語モデル作成装置において、前記入力手段から入力されたコーパスを表示する表示手段をさらに有することを特徴とする言語モデル作成装置。
  4. 請求項1〜3のいずれかに記載の言語モデル作成装置において、前記付加手段は単語の読みと表記を記載した単語辞書を有し、前記付加手段は該単語辞書から、付加すべき読みを取得することを特徴とする言語モデル作成装置。
  5. 請求項4に記載の言語モデル作成装置において、前記単語辞書から取得され、単語の表記に付加された読みを修正する修正手段をさらに備えたことを特徴とする言語モデル作成装置。
  6. 請求項1〜5のいずれかに記載に言語モデル作成装置において、前記付加された読みおよび対応する表記のストリームを表示する表示手段をさらに備えたことを特徴とする言語モデル作成装置。
  7. 入力手段と、付加手段と、計算手段と、記憶手段とを有する言語モデル作成装置の言語モデル作成方法であって、
    前記入力手段から複数の自然語の文が表記の文字の形態で記載されたコーパスを入力する入力ステップと、
    当該入力されたコーパスの中の文に対して単語単位で読みを前記付加手段により付加する付加ステップと、
    当該付加された読みおよび対応する表記の前記コーパス中の出現個数を計数することにより該読みおよび対応する表記の出現確率を前記計算手段により計算する計算ステップと、
    当該計算手段により計算された出現確率、対応する読みおよび対応する表記を言語モデルとして前記記憶手段に記憶する記憶ステップと
    を備えたことを特徴とする言語モデル作成装置の言語モデル作成方法。
  8. 請求項7に記載の言語モデル作成装置の言語モデル作成方法において、前記言語作成装置は出力手段をさらに有し、前記記憶手段に記憶された言語モデルを前記出力手段により出力する出力ステップをさらに備えたことを特徴とする言語モデル作成装置の言語モデル作成方法。
  9. 請求項7または8に記載の言語モデル作成装置の言語モデル作成方法において、前記言語作成装置は表示手段をさらに有し、前記入力手段から入力されたコーパスを前記表示手段により表示する表示ステップをさらに有することを特徴とする言語モデル作成装置の言語モデル作成方法。
  10. 請求項7〜9のいずれかに記載の言語モデル作成装置の言語モデル作成方法において、前記付加手段は単語の読みと表記を記載した単語辞書を有し、前記付加により該単語辞書から、付加すべき読みを取得するステップをさらに備えたことを特徴とする言語モデル作成装置の言語モデル作成方法。
  11. 請求項10に記載の言語モデル作成装置の言語モデル作成方法において、前記言語作成装置は修正手段をさらに有し、前記単語辞書から取得され、単語の表記に付加された読みを前記修正手段により修正する修正ステップをさらに備えたことを特徴とする言語モデル作成装置の言語モデル作成方法。
  12. 請求項7〜11のいずれかに記載に言語モデル作成装置の言語モデル作成方法において、前記付加された読みおよび対応する表記のストリームを前記表示手段により表示する表示ステップをさらに備えたことを特徴とする言語モデル作成装置の言語モデル作成方法。
  13. 入力手段と、付加手段と、計算手段と、記憶手段とを有する言語モデル作成装置のためのプログラムであって、
    前記入力手段から複数の自然語の文が表記の文字の形態で記載されたコーパスを入力する入力ステップと、
    当該入力されたコーパスの中の文に対して単語単位で読みを前記付加手段により付加する付加ステップと、
    当該付加された読みおよび対応する表記の前記コーパス中の出現個数を計数することにより該読みおよび対応する表記の出現確率を前記計算手段により計算する計算ステップと、
    当該計算手段により計算された出現確率、対応する読みおよび対応する表記を言語モデルとして前記記憶手段に記憶する記憶ステップと
    を備えたことを特徴とする言語モデル作成装置のためのプログラム。
  14. 請求項13に記載の言語モデル作成装置のためのプログラムにおいて、前記言語作成装置は出力手段をさらに有し、前記記憶手段に記憶された言語モデルを前記出力手段により出力する出力ステップをさらに備えたことを特徴とする言語モデル作成装置のためのプログラム。
  15. 請求項13または14に記載の言語モデル作成装置のためのプログラムにおいて、前記言語作成装置は表示手段をさらに有し、前記入力手段から入力されたコーパスを前記表示手段により表示する表示ステップをさらに有することを特徴とする言語モデル作成装置のためのプログラム。
  16. 請求項13〜15のいずれかに記載の言語モデル作成装置のためのプログラムにおいて、前記付加手段は単語の読みと表記を記載した単語辞書を有し、前記付加手段により該単語辞書から、付加すべき読みを取得するステップをさらに備えたことを特徴とする言語モデル作成装置のためのプログラム。
  17. 請求項16に記載の言語モデル作成装置のためのプログラムにおいて、前記言語作成装置は修正手段をさらに有し、前記単語辞書から取得され、単語の表記に付加された読みを前記修正手段により修正する修正ステップをさらに備えたことを特徴とする言語モデル作成装置のためのプログラム。
  18. 請求項13〜17のいずれかに記載に言語モデル作成装置のためのプログラムにおいて、前記付加された読みおよび対応する表記のストリームを前記表示手段により表示する表示ステップをさらに備えたことを特徴とする言語モデル作成装置のためのプログラム。
  19. 請求項1に記載の言語モデル作成装置により作成された言語モデルを使用して、入力の読みを、対応する表記に変換する言語処理装置であって、
    前記言語モデルを記憶する記憶手段と、
    前記記憶手段に記憶された言語モデルの出現確率に応じて、読みから変換すべき変換候補の順位付けを行なう情報処理手段と
    を備えたことを特徴とする言語処理装置。
  20. 記憶手段および情報処理手段を有し、請求項1に記載の言語モデル作成装置により作成された言語モデルを使用して、入力の読みを、対応する表記に変換する言語処理装置のための言語処理方法であって、
    前記言語モデルを前記記憶手段に記憶する記憶ステップと、
    前記記憶手段に記憶された言語モデルの出現確率に応じて、読みから変換すべき変換候補の順位付けを前記情報処理手段により行なう情報処理ステップと
    を備えたことを特徴とする言語処理装置のための言語処理方法。
  21. 記憶手段および情報処理手段を有し、請求項1に記載の言語モデル作成装置により作成された言語モデルを使用して、入力の読みを、対応する表記に変換する言語処理装置のためのプログラムであって、
    前記言語モデルを前記記憶手段に記憶する記憶ステップと、
    前記記憶手段に記憶された言語モデルの出現確率に応じて、読みから変換すべき変換候補の順位付けを前記情報処理手段により行なう情報処理ステップと
    を備えたことを特徴とする言語処理装置のためのプログラム。
JP2005185764A 2005-06-24 2005-06-24 言語モデル作成装置およびそれにより作成された言語モデルを使用する言語処理装置 Pending JP2007004633A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005185764A JP2007004633A (ja) 2005-06-24 2005-06-24 言語モデル作成装置およびそれにより作成された言語モデルを使用する言語処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005185764A JP2007004633A (ja) 2005-06-24 2005-06-24 言語モデル作成装置およびそれにより作成された言語モデルを使用する言語処理装置

Publications (1)

Publication Number Publication Date
JP2007004633A true JP2007004633A (ja) 2007-01-11

Family

ID=37690174

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005185764A Pending JP2007004633A (ja) 2005-06-24 2005-06-24 言語モデル作成装置およびそれにより作成された言語モデルを使用する言語処理装置

Country Status (1)

Country Link
JP (1) JP2007004633A (ja)

Cited By (119)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982021A (zh) * 2011-08-11 2013-03-20 苹果公司 用于消除语言转换中的多个读法的歧义的方法
US8892446B2 (en) 2010-01-18 2014-11-18 Apple Inc. Service orchestration for intelligent automated assistant
US9190062B2 (en) 2010-02-25 2015-11-17 Apple Inc. User profiling for voice input processing
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US9300784B2 (en) 2013-06-13 2016-03-29 Apple Inc. System and method for emergency calls initiated by voice command
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9535906B2 (en) 2008-07-31 2017-01-03 Apple Inc. Mobile device having human language translation capability with positional feedback
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
US9620104B2 (en) 2013-06-07 2017-04-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US9626955B2 (en) 2008-04-05 2017-04-18 Apple Inc. Intelligent text-to-speech conversion
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9633674B2 (en) 2013-06-07 2017-04-25 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9646614B2 (en) 2000-03-16 2017-05-09 Apple Inc. Fast, language-independent method for user authentication by voice
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US9697822B1 (en) 2013-03-15 2017-07-04 Apple Inc. System and method for updating an adaptive speech recognition model
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9798393B2 (en) 2011-08-29 2017-10-24 Apple Inc. Text correction processing
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9922642B2 (en) 2013-03-15 2018-03-20 Apple Inc. Training an at least partial voice command system
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9953088B2 (en) 2012-05-14 2018-04-24 Apple Inc. Crowd sourcing information to fulfill user requests
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US9966068B2 (en) 2013-06-08 2018-05-08 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US10185542B2 (en) 2013-06-09 2019-01-22 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10199051B2 (en) 2013-02-07 2019-02-05 Apple Inc. Voice trigger for a digital assistant
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10283110B2 (en) 2009-07-02 2019-05-07 Apple Inc. Methods and apparatuses for automatic speech recognition
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US10332518B2 (en) 2017-05-09 2019-06-25 Apple Inc. User interface for correcting recognition errors
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US10356243B2 (en) 2015-06-05 2019-07-16 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US10410637B2 (en) 2017-05-12 2019-09-10 Apple Inc. User-specific acoustic models
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US10482874B2 (en) 2017-05-15 2019-11-19 Apple Inc. Hierarchical belief states for digital assistants
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US10568032B2 (en) 2007-04-03 2020-02-18 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10607140B2 (en) 2010-01-25 2020-03-31 Newvaluexchange Ltd. Apparatuses, methods and systems for a digital conversation management platform
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10755703B2 (en) 2017-05-11 2020-08-25 Apple Inc. Offline personal assistant
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US10791216B2 (en) 2013-08-06 2020-09-29 Apple Inc. Auto-activating smart responses based on activities from remote devices
US10789945B2 (en) 2017-05-12 2020-09-29 Apple Inc. Low-latency intelligent automated assistant
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US11217255B2 (en) 2017-05-16 2022-01-04 Apple Inc. Far-field extension for digital assistant services
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04211868A (ja) * 1990-07-31 1992-08-03 Dainippon Printing Co Ltd Cd―romデータの検索用キーワードの作成方法
JP2004118461A (ja) * 2002-09-25 2004-04-15 Microsoft Corp 言語モデルのトレーニング方法、かな漢字変換方法、言語モデルのトレーニング装置、かな漢字変換装置、コンピュータプログラムおよびコンピュータ読み取り可能な記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04211868A (ja) * 1990-07-31 1992-08-03 Dainippon Printing Co Ltd Cd―romデータの検索用キーワードの作成方法
JP2004118461A (ja) * 2002-09-25 2004-04-15 Microsoft Corp 言語モデルのトレーニング方法、かな漢字変換方法、言語モデルのトレーニング装置、かな漢字変換装置、コンピュータプログラムおよびコンピュータ読み取り可能な記録媒体

Cited By (168)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9646614B2 (en) 2000-03-16 2017-05-09 Apple Inc. Fast, language-independent method for user authentication by voice
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US8930191B2 (en) 2006-09-08 2015-01-06 Apple Inc. Paraphrasing of user requests and results by automated digital assistant
US8942986B2 (en) 2006-09-08 2015-01-27 Apple Inc. Determining user intent based on ontologies of domains
US9117447B2 (en) 2006-09-08 2015-08-25 Apple Inc. Using event alert text as input to an automated assistant
US10568032B2 (en) 2007-04-03 2020-02-18 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10381016B2 (en) 2008-01-03 2019-08-13 Apple Inc. Methods and apparatus for altering audio output signals
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
US9626955B2 (en) 2008-04-05 2017-04-18 Apple Inc. Intelligent text-to-speech conversion
US10108612B2 (en) 2008-07-31 2018-10-23 Apple Inc. Mobile device having human language translation capability with positional feedback
US9535906B2 (en) 2008-07-31 2017-01-03 Apple Inc. Mobile device having human language translation capability with positional feedback
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US10475446B2 (en) 2009-06-05 2019-11-12 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10795541B2 (en) 2009-06-05 2020-10-06 Apple Inc. Intelligent organization of tasks items
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant
US10283110B2 (en) 2009-07-02 2019-05-07 Apple Inc. Methods and apparatuses for automatic speech recognition
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US9548050B2 (en) 2010-01-18 2017-01-17 Apple Inc. Intelligent automated assistant
US10706841B2 (en) 2010-01-18 2020-07-07 Apple Inc. Task flow identification based on user intent
US8903716B2 (en) 2010-01-18 2014-12-02 Apple Inc. Personalized vocabulary for digital assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8892446B2 (en) 2010-01-18 2014-11-18 Apple Inc. Service orchestration for intelligent automated assistant
US10607140B2 (en) 2010-01-25 2020-03-31 Newvaluexchange Ltd. Apparatuses, methods and systems for a digital conversation management platform
US10984327B2 (en) 2010-01-25 2021-04-20 New Valuexchange Ltd. Apparatuses, methods and systems for a digital conversation management platform
US10607141B2 (en) 2010-01-25 2020-03-31 Newvaluexchange Ltd. Apparatuses, methods and systems for a digital conversation management platform
US11410053B2 (en) 2010-01-25 2022-08-09 Newvaluexchange Ltd. Apparatuses, methods and systems for a digital conversation management platform
US10049675B2 (en) 2010-02-25 2018-08-14 Apple Inc. User profiling for voice input processing
US9633660B2 (en) 2010-02-25 2017-04-25 Apple Inc. User profiling for voice input processing
US9190062B2 (en) 2010-02-25 2015-11-17 Apple Inc. User profiling for voice input processing
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10102359B2 (en) 2011-03-21 2018-10-16 Apple Inc. Device access using voice authentication
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US11120372B2 (en) 2011-06-03 2021-09-14 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8706472B2 (en) 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
KR101435265B1 (ko) * 2011-08-11 2014-08-28 애플 인크. 언어 변환에 있어서 다중 리딩 모호성 해결을 위한 방법
JP2013065284A (ja) * 2011-08-11 2013-04-11 Apple Inc 言語変換において複数の読み方の曖昧性を除去する方法
JP2015038731A (ja) * 2011-08-11 2015-02-26 アップル インコーポレイテッド 言語変換において複数の読み方の曖昧性を除去する方法
CN102982021A (zh) * 2011-08-11 2013-03-20 苹果公司 用于消除语言转换中的多个读法的歧义的方法
CN102982021B (zh) * 2011-08-11 2015-08-26 苹果公司 用于消除语言转换中的多个读法的歧义的方法
US9798393B2 (en) 2011-08-29 2017-10-24 Apple Inc. Text correction processing
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9953088B2 (en) 2012-05-14 2018-04-24 Apple Inc. Crowd sourcing information to fulfill user requests
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US10978090B2 (en) 2013-02-07 2021-04-13 Apple Inc. Voice trigger for a digital assistant
US10199051B2 (en) 2013-02-07 2019-02-05 Apple Inc. Voice trigger for a digital assistant
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US11388291B2 (en) 2013-03-14 2022-07-12 Apple Inc. System and method for processing voicemail
US9922642B2 (en) 2013-03-15 2018-03-20 Apple Inc. Training an at least partial voice command system
US9697822B1 (en) 2013-03-15 2017-07-04 Apple Inc. System and method for updating an adaptive speech recognition model
US9620104B2 (en) 2013-06-07 2017-04-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9633674B2 (en) 2013-06-07 2017-04-25 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
US10657961B2 (en) 2013-06-08 2020-05-19 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US9966068B2 (en) 2013-06-08 2018-05-08 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10185542B2 (en) 2013-06-09 2019-01-22 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US9300784B2 (en) 2013-06-13 2016-03-29 Apple Inc. System and method for emergency calls initiated by voice command
US10791216B2 (en) 2013-08-06 2020-09-29 Apple Inc. Auto-activating smart responses based on activities from remote devices
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US11257504B2 (en) 2014-05-30 2022-02-22 Apple Inc. Intelligent assistant for home automation
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10497365B2 (en) 2014-05-30 2019-12-03 Apple Inc. Multi-command single utterance input method
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10083690B2 (en) 2014-05-30 2018-09-25 Apple Inc. Better resolution when referencing to concepts
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US11133008B2 (en) 2014-05-30 2021-09-28 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9668024B2 (en) 2014-06-30 2017-05-30 Apple Inc. Intelligent automated assistant for TV user interactions
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10904611B2 (en) 2014-06-30 2021-01-26 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10431204B2 (en) 2014-09-11 2019-10-01 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US11556230B2 (en) 2014-12-02 2023-01-17 Apple Inc. Data detection
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US11087759B2 (en) 2015-03-08 2021-08-10 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US10311871B2 (en) 2015-03-08 2019-06-04 Apple Inc. Competing devices responding to voice triggers
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10356243B2 (en) 2015-06-05 2019-07-16 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11069347B2 (en) 2016-06-08 2021-07-20 Apple Inc. Intelligent automated assistant for media exploration
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11037565B2 (en) 2016-06-10 2021-06-15 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10553215B2 (en) 2016-09-23 2020-02-04 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10332518B2 (en) 2017-05-09 2019-06-25 Apple Inc. User interface for correcting recognition errors
US10755703B2 (en) 2017-05-11 2020-08-25 Apple Inc. Offline personal assistant
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US10410637B2 (en) 2017-05-12 2019-09-10 Apple Inc. User-specific acoustic models
US10789945B2 (en) 2017-05-12 2020-09-29 Apple Inc. Low-latency intelligent automated assistant
US10482874B2 (en) 2017-05-15 2019-11-19 Apple Inc. Hierarchical belief states for digital assistants
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US11217255B2 (en) 2017-05-16 2022-01-04 Apple Inc. Far-field extension for digital assistant services

Similar Documents

Publication Publication Date Title
JP2007004633A (ja) 言語モデル作成装置およびそれにより作成された言語モデルを使用する言語処理装置
KR101435265B1 (ko) 언어 변환에 있어서 다중 리딩 모호성 해결을 위한 방법
US7979268B2 (en) String matching method and system and computer-readable recording medium storing the string matching method
CN102439540B (zh) 输入法编辑器
CN103026318B (zh) 输入法编辑器
JP2003223437A (ja) 正解語の候補の表示方法、スペルチェック方法、コンピュータ装置、プログラム
CN102298582A (zh) 数据搜索和匹配方法和系统
JP5646792B2 (ja) 単語分割装置、単語分割方法、及び単語分割プログラム
JP6404511B2 (ja) 翻訳支援システム、翻訳支援方法、および翻訳支援プログラム
JP2015022590A (ja) 文字入力装置、文字入力方法、及び文字入力プログラム
Prabhakar et al. Machine transliteration and transliterated text retrieval: a survey
JP4845523B2 (ja) 文字処理装置、方法、プログラムおよび記録媒体
JP2014106707A (ja) 単語分割装置、単語分割用辞書のデータ構造、単語分割方法、およびプログラム
JP2013134753A (ja) 誤り文修正装置、誤り文修正方法およびプログラム
JP5629543B2 (ja) 文字列変換装置、文字列変換方法、コンピュータプログラムおよび記録媒体
JP2019095603A (ja) 情報生成プログラム、単語抽出プログラム、情報処理装置、情報生成方法及び単語抽出方法
JP2008276561A (ja) 形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体
JP2003178087A (ja) 外国語電子辞書検索装置および方法
JP5513985B2 (ja) 文字列ベクトル生成装置、文字列ベクトル生成方法、プログラム、及びプログラムを格納したコンピュータ読み取り可能な記録媒体
US20230267274A1 (en) Mapping entities in unstructured text documents via entity correction and entity resolution
Alam et al. Improving accessibility of archived raster dictionaries of complex script languages
JP6934621B2 (ja) 方法、装置、及びプログラム
JP2012198794A (ja) Nグラム検索のための転置インデックスの生成方法および生成装置、当該転置インデックスを用いた検索方法および検索装置、ならびに、コンピュータプログラム
JP6511874B2 (ja) コンピュータプログラム、検索装置及び検索方法
JP5708117B2 (ja) Nグラム検索のための転置インデックスの生成方法および生成装置、当該転置インデックスを用いた検索方法および検索装置、ならびに、コンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080530

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091127

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100301

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100702