JP2010531492A - ワード確率決定 - Google Patents
ワード確率決定 Download PDFInfo
- Publication number
- JP2010531492A JP2010531492A JP2010513604A JP2010513604A JP2010531492A JP 2010531492 A JP2010531492 A JP 2010531492A JP 2010513604 A JP2010513604 A JP 2010513604A JP 2010513604 A JP2010513604 A JP 2010513604A JP 2010531492 A JP2010531492 A JP 2010531492A
- Authority
- JP
- Japan
- Prior art keywords
- word
- probability value
- segmentation
- corpus
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
[全][球][最][大][的][捜][索][引][撃]、
[全球][最大][的][捜][索][引][撃]、
[全球][最大][的][捜索][引撃]、および
[全球最大][的][捜索引撃]など
上記の例示的セグメンテーションでは、各セグメントは、ワードコーパス402内の語である。ここで、「セグメンテーション」という用語は、文がセグメント化される方式を指す。したがって、[全][球][最][大][的][捜][索][引][撃]は1つのセグメンテーションであり、[全球最大][的][捜索引撃]は別のセグメンテーションである。各セグメンテーションは、1つまたは複数のセグメントを有することができる。例えば、セグメンテーション[全][球][最][大][的][捜][索][引][撃]は、9個のセグメント[全]、[球]、[最]、[大]、[的]、[捜]、[索]、[引]、および[撃]を含む。セグメンテーション[全球最大][的][捜索引撃]は、3個のセグメント[全球最大]、[的]、および[捜索引撃]を含む。
[ABC][D][A][E]、
[AB][C][D][A][E]、
[A][BC][D][A][E]、および
[A][B][C][D][A][E]
P([ABC][D][A][E])=(1/8)^4=0.000244、
P([AB][C][D][A][E])-(1/8)^5=0.0000305、
P([A][BC][D][A][E])=(1/8)^5=0.0000305、および
P([A][B][C][D][A][E])=(1/8)^6=0.00000381
ただし、P([][][])は、セグメンテーション[][][]の確率値を表す。
S(A)=((1/8)^4+(1/8)^5+(1/8)^5*2+(1/8)^6*2)/0.000309=0.000343/0.000309=1.11
S([A])=1.11、
S([B])=0.0123、
S([C])=0.111、
S([D])=1、
S([E])=1、
S([AB])=0.0988、
S([BC])=0.0988、および
S([ABC])=0.79
ただし、S([])は、語[]のソフトカウントを表す。ワードソフトカウントがテーブル412内に格納され、次の文、例えば「ABABCDD」が処理されて、別の組のワードソフトカウントが生成される。文書404中のすべての文が同様に処理され、各文について1組のワードソフトカウントが生成される。
S([A])=10、
S([B])=2、
S([C])=3、
S([D])=1、
S([E])=3、
S([AB])=2、
S([BC])=2、および
S([ABC])=1
上記の例では、正規化因子は、(10+2+3+1+3+2+2+1)=24に等しい。したがって、ワード確率値は以下のように正規化される。
P([A])=10/24=0.417
P([B])=2/24=0.083
P([C])=3/24=0.125
P([E])=3/24=0.125
P([D])=1/24=0.0417
P([AB])=2/24=0.0833
P([BC])=2/24=0.0833、および
P([ABC])=1/24=0.0417
語および関連するワード確率値をテーブル414内に格納することができ、したがって、最初の反復が完了する。
P([ABC][D][A][E])=0.0417*0.0417*0.417*0.125=0.0000906、
P([AB][C][D][A][E])=0.0833*0.125*0.0417*0.417*0.125=0.0000226、
P([A][BC][D][A][E])=0.417*0.0833*0.0417*0.417*0.125=0.0000755、および
P([A][B][C][D][A][E])=0.417*0.0833*0.125*0.0417*0.417*0.125=0.00000944
S([A])=(0.0000906+0.0000226+0.0000755*2+0.00000944*2)/0.000198=1.34、
S([B])=0.00000944/0.000198=0.0477、
S([C])=(0.0000226+0.0000755)/0.000198=0.0000981/0.000198=0.495、
S([D])=(0.0000906+0.0000226+0.0000755+0.00000944)/0.000198=1、
S([E])=(0.0000906+0.0000226+0.0000755+0.00000944)/0.000198=1、
S([AB])=0.0000226/0.000198=0.114、
S([BC])=0.0000755/0.000198=0.381、および
S([ABC])=0.0000906/0.000198=0.458
・
・ p(Cj1...Cj2)は、語Cj1...Cj2の確率の現在の推定であり、
・
・ αは、この文のすべての可能なセグメンテーションの尤度の和である正規化定数である。αは
101 インプットメソッドエディタ(IME)コード
102 処理装置
103 インプットメソッドエディタインスタンス
104 第1データストア
105 他のアプリケーションソフトウェア
106 第2データストア
107 アプリケーションインスタンス
108 入力装置
110 出力装置
112 ネットワークインターフェース
114 バスシステム
116 ネットワーク
118 リモートコンピューティングシステム
120 インプットメソッドエディタシステム
122 インプットメソッドエディタエンジン
124 辞書
126 構成入力テーブル
128 エントリ
300 インプットメソッドエディタ環境
302 候補選択項目
304 ピンイン入力
308 選択インジケータ
400 ワード確率決定エンジン
402 ワードコーパス
404 文書コーパス
406 辞書
410 ワードセグメンテーションエンジン
412 テーブル
414 テーブル
Claims (28)
- コンピュータで実施される方法であって、
ワードコーパスを識別する段階と、
ワード確率値を前記ワードコーパス内の各語と関連付ける段階と、
文を識別する段階と、
前記ワードコーパスに基づいて前記文の候補セグメンテーションを求める段階と、
前記ワードコーパス内の各語について、関連する前記ワード確率値と前記候補セグメンテーションとに基づいて、関連する前記ワード確率値を反復的に調節する段階と
を含む方法。 - インプットメソッドエディタ辞書内の関連する最高の前記ワード確率値を有する語によって定義される前記ワードコーパスの一部を格納する段階を含む請求項1に記載の方法。
- 前記ワード確率値が、関連する語が前記文中に出現する確率に対応する請求項1に記載の方法。
- 前記文の候補セグメンテーションを求める段階が、前記ワードコーパスに基づいて、少なくとも1つの文のすべての可能なセグメンテーションを求める段階を含む請求項1に記載の方法。
- 前記文の各候補セグメンテーションについてセグメンテーション確率値を求める段階を含む請求項1に記載の方法。
- 前記文の各候補セグメンテーションについてセグメンテーション確率値を求める段階が、各候補セグメンテーションについて、前記候補セグメンテーション内の前記語に関連する前記ワード確率値に基づいて、前記セグメンテーション確率値を求める段階を含む請求項5に記載の方法。
- 前記ワードコーパス内の各語について、関連する前記ワード確率値および前記候補セグメンテーションに基づいて、関連する前記ワード確率値を反復的に調節する段階が、各語について、前記文の前記候補セグメンテーションに関する前記セグメンテーション確率値に基づいて、関連する前記ワード確率値を反復的に調節する段階を含む請求項5に記載の方法。
- 各語について、関連する前記ワード確率値を反復的に調節する段階が、反復ごとに、
前記文の各候補セグメンテーションについて、前記候補セグメンテーション内の前記語に関連する前記ワード確率値に基づいて、前記セグメンテーション確率値を求める段階と、
各語について、前記語を含む前記候補セグメンテーションに関する前記セグメンテーション確率値に基づいて、関連する前記ワード確率値を調節する段階と
を含む請求項1に記載の方法。 - 前記文中の語の改善された確率値を求める段階が、(a)前記語の前のサブストリングの候補セグメンテーションの前記確率値の和、(b)前記語の前記確率値、および(c)前記語の後のサブストリングの候補セグメンテーションの前記確率値の和を乗算する段階を含む請求項1に記載の方法。
- 前記文の候補セグメンテーションを求める段階が、文書中の複数の文の候補セグメンテーションを求める段階を含む請求項1に記載の方法。
- 複数の文書中の文を識別する段階と、各文について、前記ワードコーパスに基づいて、前記文の候補セグメンテーションを求める段階とを含む請求項1に記載の方法。
- 前記ワード確率値を求める際に、異なるタイプの文書中の文に、異なる重みが与えられる請求項11に記載の方法。
- 前記文書が、公衆ネットワーク、インターネットを介してアクセス可能であり、または複数のサードパーティによって提供される請求項11に記載の方法。
- 前記語が、中国語文字、日本語文字、および韓国語文字のうちの少なくとも1つを含む請求項1に記載の方法。
- 前記語が漢字文字を含む請求項1に記載の方法。
- コンピュータで実施される方法であって、
ワードコーパスの語に関連するワード確率値を求める段階と、
文書コーパス中の文書の文の候補セグメンテーションを求める段階と、
各文の各候補セグメンテーションについて、前記候補セグメンテーション中の前記語に関連する前記ワード確率値に基づいて、セグメンテーション確率値を反復的に求める段階と、
各語について、前記語を含む前記候補セグメンテーションに関する前記セグメンテーション確率値に基づいて、前記ワード確率値を反復的に調節する段階と
を含む方法。 - 前記文書に関する文書タイプを識別する段階と、
識別した前記文書タイプに基づいて、前記文書中の文に重みを割り当てる段階と、
前記重みに基づいて、前記セグメンテーション確率値または前記ワード確率値のうちの1つを求める段階と
を含む請求項16に記載の方法。 - 各語について、前記語を含む前記セグメンテーションの前記セグメンテーション確率値に基づいて、カウントを蓄積する段階を含む請求項16に記載の方法。
- 各語について前記カウントを蓄積する段階は、前記語を含む前記セグメンテーションの前記セグメンテーション確率値の和を求める段階を含む請求項18に記載の方法。
- 正規化因子に基づいて前記語についての前記カウントを正規化することにより、各語について前記ワード確率値を求める段階を含む請求項18に記載の方法。
- すべての前記語の前記カウントの和を求めることによって前記正規化因子を求める段階を含む請求項20に記載の方法。
- 語と、反復プロセスを使用して求められる、関連するワード確率値とを含む辞書を確立する段階であって、前記反復プロセスが、文書の文の候補セグメンテーションに関するセグメンテーション確率値を反復的に求める段階と、前記セグメンテーション確率値に基づいて、前記語に関する前記ワード確率値を反復的に調節する段階とを含む段階と、
前記辞書から語を選択するように構成されたインプットメソッドエディタを提供する段階と
を含む方法。 - ワードコーパスおよび文書コーパスを格納するデータストアと、
コンピュータ可読媒体内に格納され、処理装置で実行可能な命令を含む処理エンジンであって、前記命令が、実行時に、前記処理装置に、
ワード確率値を前記ワードコーパス内の各語と関連付けさせ、
前記ワードコーパスに基づいて、前記文書コーパス内の各文書の各文の候補セグメンテーションを求めさせ、
前記ワードコーパス内の各語について、関連する前記ワード確率値および前記候補セグメンテーションに基づいて、関連する前記ワード確率値を反復的に調節させる処理エンジンと
を備えるシステム。 - ワードコーパスおよび文書コーパスを格納するデータストアと、
ワード確率値を前記ワードコーパス内の各語と関連付け、
前記ワードコーパスに基づいて、前記文書コーパス内の各文書の各文の候補セグメンテーションを求め、
前記ワードコーパス内の各語について、関連する前記ワード確率値および前記候補セグメンテーションに基づいて、関連する前記ワード確率値を反復的に調節する処理装置と
を備えるシステム。 - ワードコーパスおよび文書コーパスを格納するデータストアと、
前記ワードコーパスの語に関連するワード確率値を求め、
前記文書コーパス内の文書の文の候補セグメンテーションを求め、
各文の各候補セグメンテーションについて、前記候補セグメンテーション内の前記語に関連する前記ワード確率値に基づいて、セグメンテーション確率値を反復的に求め、各語について、前記語を含む候補セグメンテーションに関するセグメンテーション確率値に基づいて、ワード確率値を反復的に調節する処理装置と
を備えるシステム。 - 語と、反復プロセスを使用して求められる、関連するワード確率値とを含む辞書を格納するデータストアであって、前記反復プロセスが、文書の文の候補セグメンテーションに関するセグメンテーション確率値を反復的に求めること、および前記セグメンテーション確率値に基づいて、前記語に関する前記ワード確率値を反復的に調節することを含むデータストアと、
前記辞書から語を選択するように構成されたインプットメソッドエディタを提供する処理装置と
を備えるシステム。 - ワード確率値をワードコーパス内の語と関連付ける手段と、
複数の文書中の文を識別する手段と、
前記ワードコーパスに基づいて各文の候補セグメンテーションを求める手段と、
前記ワードコーパス内の各語について、関連する前記ワード確率値および前記候補セグメンテーションに基づいて、関連する前記ワード確率値を反復的に調節する手段と
を備えるシステム。 - ワードコーパスの語に関連するワード確率値を求める手段と、
文書コーパス内の文書の文の候補セグメンテーションを求める手段と、
各文の各候補セグメンテーションについて、前記候補セグメンテーション内の前記語に関連する前記ワード確率値に基づいて、セグメンテーション確率値を反復的に求める手段と、
各語について、前記語を含む前記候補セグメンテーションに関する前記セグメンテーション確率値に基づいて、前記ワード確率値を反復的に調節する手段と
を備えるシステム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2007/001969 WO2009000103A1 (en) | 2007-06-25 | 2007-06-25 | Word probability determination |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010531492A true JP2010531492A (ja) | 2010-09-24 |
Family
ID=40137418
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010513604A Pending JP2010531492A (ja) | 2007-06-25 | 2007-06-25 | ワード確率決定 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8630847B2 (ja) |
JP (1) | JP2010531492A (ja) |
KR (1) | KR101465770B1 (ja) |
CN (1) | CN101785000B (ja) |
WO (1) | WO2009000103A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210042470A1 (en) * | 2018-09-14 | 2021-02-11 | Beijing Bytedance Network Technology Co., Ltd. | Method and device for separating words |
Families Citing this family (140)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60040536D1 (de) | 1999-06-11 | 2008-11-27 | Telstra Corp Ltd | Verfahren zur entwicklung eines interaktiven systems |
AU2002950336A0 (en) * | 2002-07-24 | 2002-09-12 | Telstra New Wave Pty Ltd | System and process for developing a voice application |
AU2002951244A0 (en) | 2002-09-06 | 2002-09-19 | Telstra New Wave Pty Ltd | A development system for a dialog system |
AU2003900584A0 (en) * | 2003-02-11 | 2003-02-27 | Telstra New Wave Pty Ltd | System for predicting speech recognition accuracy and development for a dialog system |
AU2003902020A0 (en) * | 2003-04-29 | 2003-05-15 | Telstra New Wave Pty Ltd | A process for grammatical inference |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
CN101779200B (zh) * | 2007-06-14 | 2013-03-20 | 谷歌股份有限公司 | 词典词和短语确定方法和设备 |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8521516B2 (en) * | 2008-03-26 | 2013-08-27 | Google Inc. | Linguistic key normalization |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8433708B2 (en) * | 2008-09-16 | 2013-04-30 | Kendyl A. Román | Methods and data structures for improved searchable formatted documents including citation and corpus generation |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US20100094831A1 (en) * | 2008-10-14 | 2010-04-15 | Microsoft Corporation | Named entity resolution using multiple text sources |
US8798983B2 (en) * | 2009-03-30 | 2014-08-05 | Microsoft Corporation | Adaptation for statistical language model |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
JP5382651B2 (ja) * | 2009-09-09 | 2014-01-08 | 独立行政法人情報通信研究機構 | 単語対取得装置、単語対取得方法、およびプログラム |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8694304B2 (en) * | 2010-03-26 | 2014-04-08 | Virtuoz Sa | Semantic clustering and user interfaces |
US8676565B2 (en) | 2010-03-26 | 2014-03-18 | Virtuoz Sa | Semantic clustering and conversational agents |
US9378202B2 (en) | 2010-03-26 | 2016-06-28 | Virtuoz Sa | Semantic clustering |
US9600566B2 (en) | 2010-05-14 | 2017-03-21 | Microsoft Technology Licensing, Llc | Identifying entity synonyms |
CN102411563B (zh) * | 2010-09-26 | 2015-06-17 | 阿里巴巴集团控股有限公司 | 一种识别目标词的方法、装置及系统 |
US9524291B2 (en) | 2010-10-06 | 2016-12-20 | Virtuoz Sa | Visual display of semantic information |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
CN103547981A (zh) * | 2011-05-20 | 2014-01-29 | 微软公司 | 显示键拼音 |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
CN102929864B (zh) * | 2011-08-05 | 2016-08-17 | 北京百度网讯科技有限公司 | 一种音字转换方法及装置 |
US9305082B2 (en) * | 2011-09-30 | 2016-04-05 | Thomson Reuters Global Resources | Systems, methods, and interfaces for analyzing conceptually-related portions of text |
US10176168B2 (en) * | 2011-11-15 | 2019-01-08 | Microsoft Technology Licensing, Llc | Statistical machine translation based search query spelling correction |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US20130318075A1 (en) * | 2012-05-25 | 2013-11-28 | International Business Machines Corporation | Dictionary refinement for information extraction |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US10032131B2 (en) | 2012-06-20 | 2018-07-24 | Microsoft Technology Licensing, Llc | Data services for enterprises leveraging search system data assets |
US9594831B2 (en) | 2012-06-22 | 2017-03-14 | Microsoft Technology Licensing, Llc | Targeted disambiguation of named entities |
US9229924B2 (en) * | 2012-08-24 | 2016-01-05 | Microsoft Technology Licensing, Llc | Word detection and domain dictionary recommendation |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
IL224482B (en) * | 2013-01-29 | 2018-08-30 | Verint Systems Ltd | System and method for keyword spotting using representative dictionary |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
KR101922663B1 (ko) | 2013-06-09 | 2018-11-28 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US9934217B2 (en) * | 2013-07-26 | 2018-04-03 | Facebook, Inc. | Index for electronic string of symbols |
WO2015018055A1 (en) * | 2013-08-09 | 2015-02-12 | Microsoft Corporation | Input method editor providing language assistance |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9966065B2 (en) | 2014-05-30 | 2018-05-08 | Apple Inc. | Multi-command single utterance input method |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
CN105334952B (zh) * | 2014-07-11 | 2018-12-18 | 北京搜狗科技发展有限公司 | 一种文本信息的输入方法和装置 |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US9606986B2 (en) * | 2014-09-29 | 2017-03-28 | Apple Inc. | Integrated word N-gram and class M-gram language models |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
EP3062212A1 (en) * | 2015-02-25 | 2016-08-31 | Kyocera Document Solutions Inc. | Text editing apparatus and print data storage apparatus |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10325221B2 (en) * | 2015-06-02 | 2019-06-18 | Microsoft Technology Licensing, Llc | Metadata tag description generation |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
IL242219B (en) | 2015-10-22 | 2020-11-30 | Verint Systems Ltd | System and method for keyword searching using both static and dynamic dictionaries |
IL242218B (en) | 2015-10-22 | 2020-11-30 | Verint Systems Ltd | A system and method for maintaining a dynamic dictionary |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
CN105488209B (zh) * | 2015-12-11 | 2019-06-07 | 北京奇虎科技有限公司 | 一种词权重的分析方法及装置 |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10372714B2 (en) * | 2016-02-05 | 2019-08-06 | International Business Machines Corporation | Automated determination of document utility for a document corpus |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK201770429A1 (en) | 2017-05-12 | 2018-12-14 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
CN108549637A (zh) * | 2018-04-19 | 2018-09-18 | 京东方科技集团股份有限公司 | 基于拼音的语义识别方法、装置以及人机对话系统 |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
CN109325227A (zh) * | 2018-09-14 | 2019-02-12 | 北京字节跳动网络技术有限公司 | 用于生成修正语句的方法和装置 |
US11829716B2 (en) * | 2019-09-06 | 2023-11-28 | International Business Machines Corporation | Suggestion of an output candidate |
CN111259148B (zh) * | 2020-01-19 | 2024-03-26 | 北京小米松果电子有限公司 | 信息处理方法、装置及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10171819A (ja) * | 1996-12-06 | 1998-06-26 | Fuji Xerox Co Ltd | 情報検索装置 |
JP2006216044A (ja) * | 2005-01-31 | 2006-08-17 | Nec (China) Co Ltd | 辞書学習方法、その利用する装置、及び入力方法とその方法を利用するユーザ端末装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6640006B2 (en) * | 1998-02-13 | 2003-10-28 | Microsoft Corporation | Word segmentation in chinese text |
US6356866B1 (en) * | 1998-10-07 | 2002-03-12 | Microsoft Corporation | Method for converting a phonetic character string into the text of an Asian language |
JP2001043221A (ja) * | 1999-07-29 | 2001-02-16 | Matsushita Electric Ind Co Ltd | 中国語単語分割装置 |
FI112978B (fi) * | 1999-09-17 | 2004-02-13 | Nokia Corp | Symbolien syöttö |
JP3573688B2 (ja) * | 2000-06-28 | 2004-10-06 | 松下電器産業株式会社 | 類似文書検索装置及び関連キーワード抽出装置 |
US7315982B2 (en) * | 2003-02-26 | 2008-01-01 | Xerox Corporation | User-tailorable romanized Chinese text input systems and methods |
CN1258725C (zh) * | 2003-04-18 | 2006-06-07 | 清华大学 | 基于语义构词约束的汉语二字词抽取方法 |
US7478033B2 (en) * | 2004-03-16 | 2009-01-13 | Google Inc. | Systems and methods for translating Chinese pinyin to Chinese characters |
US20050289463A1 (en) * | 2004-06-23 | 2005-12-29 | Google Inc., A Delaware Corporation | Systems and methods for spell correction of non-roman characters and words |
JP4652737B2 (ja) * | 2004-07-14 | 2011-03-16 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 単語境界確率推定装置及び方法、確率的言語モデル構築装置及び方法、仮名漢字変換装置及び方法、並びに、未知語モデルの構築方法、 |
US7917355B2 (en) * | 2007-08-23 | 2011-03-29 | Google Inc. | Word detection |
-
2007
- 2007-06-25 JP JP2010513604A patent/JP2010531492A/ja active Pending
- 2007-06-25 KR KR1020107001484A patent/KR101465770B1/ko active IP Right Grant
- 2007-06-25 CN CN2007801003679A patent/CN101785000B/zh active Active
- 2007-06-25 WO PCT/CN2007/001969 patent/WO2009000103A1/en active Application Filing
- 2007-10-10 US US11/870,068 patent/US8630847B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10171819A (ja) * | 1996-12-06 | 1998-06-26 | Fuji Xerox Co Ltd | 情報検索装置 |
JP2006216044A (ja) * | 2005-01-31 | 2006-08-17 | Nec (China) Co Ltd | 辞書学習方法、その利用する装置、及び入力方法とその方法を利用するユーザ端末装置 |
Non-Patent Citations (1)
Title |
---|
JPN7012003056; Xianping Ge , Wanda Pratt , Padhraic Smyth: 'Discovering Chinese Words from Unsegmented Text' SIGIR '99 Proceedings of the 22nd annual international ACM SIGIR conference on Research and developm , 1999, page 271-272, ACM * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210042470A1 (en) * | 2018-09-14 | 2021-02-11 | Beijing Bytedance Network Technology Co., Ltd. | Method and device for separating words |
Also Published As
Publication number | Publication date |
---|---|
US20080319738A1 (en) | 2008-12-25 |
WO2009000103A1 (en) | 2008-12-31 |
CN101785000B (zh) | 2013-04-24 |
US8630847B2 (en) | 2014-01-14 |
CN101785000A (zh) | 2010-07-21 |
KR20100052461A (ko) | 2010-05-19 |
KR101465770B1 (ko) | 2014-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101465770B1 (ko) | 단어 확률 결정 | |
US10402493B2 (en) | System and method for inputting text into electronic devices | |
US8386240B2 (en) | Domain dictionary creation by detection of new topic words using divergence value comparison | |
JP5379138B2 (ja) | 領域辞書の作成 | |
JP5362095B2 (ja) | インプットメソッドエディタ | |
US10558754B2 (en) | Method and system for automating training of named entity recognition in natural language processing | |
Fowler et al. | Effects of language modeling and its personalization on touchscreen typing performance | |
US8688727B1 (en) | Generating query refinements | |
US8046222B2 (en) | Segmenting words using scaled probabilities | |
US8463598B2 (en) | Word detection | |
KR101465769B1 (ko) | 사전 단어 및 어구 판정 | |
US9659002B2 (en) | System and method for inputting text into electronic devices | |
JP5710581B2 (ja) | 質問応答装置、方法、及びプログラム | |
TR201816343T4 (tr) | Farklı bir karakter setinde yazılmış sorguları ve/veya farklı sayfalardan dili kullanarak aramaya yönelik sistemler ve yöntemler. | |
US8423350B1 (en) | Segmenting text for searching | |
Jain et al. | “UTTAM” An Efficient Spelling Correction System for Hindi Language Based on Supervised Learning | |
Sharma et al. | Word prediction system for text entry in Hindi | |
WO2022134824A1 (en) | Tuning query generation patterns | |
KR102341563B1 (ko) | 매개 텍스트 자료 토픽을 이용한 전문 텍스트 자료 추출 방법 | |
Hemmer et al. | Estimating Post-OCR Denoising Complexity on Numerical Texts | |
US20220382753A1 (en) | Narrowing synonym dictionary results using document attributes | |
Dave et al. | A Systematic Review of Stemmers of Indian and Non-Indian Vernacular Languages | |
Shaila et al. | N-grams corpus generation from inverted index for query refinement in information retrieval applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100624 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100624 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120731 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120928 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121106 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130125 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130528 |