JP2011018330A - 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法 - Google Patents

統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法 Download PDF

Info

Publication number
JP2011018330A
JP2011018330A JP2010153827A JP2010153827A JP2011018330A JP 2011018330 A JP2011018330 A JP 2011018330A JP 2010153827 A JP2010153827 A JP 2010153827A JP 2010153827 A JP2010153827 A JP 2010153827A JP 2011018330 A JP2011018330 A JP 2011018330A
Authority
JP
Japan
Prior art keywords
string
native language
kanji
pronunciation
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010153827A
Other languages
English (en)
Other versions
JP5599662B2 (ja
Inventor
Hyunjung Lee
呟 亭 李
Tae Il Kim
泰 壹 金
Hee-Cheol Seo
熙 ▲競▼ 徐
Ji Hye Lee
志 惠 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NHN Corp
Original Assignee
NHN Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NHN Corp filed Critical NHN Corp
Publication of JP2011018330A publication Critical patent/JP2011018330A/ja
Application granted granted Critical
Publication of JP5599662B2 publication Critical patent/JP5599662B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

【課題】漢字−自国語の発音列の変換との関連を特徴つける統計データを用いて漢字文字列を自国語の発音列に変換することによって、最終的に導き出される自国語の発音列の精度を向上するシステムおよび方法を提供する。
【解決手段】統計的な方法を用いた漢字に対する自国語の発音列変換システムおよび方法が開示される。自国語の発音列変換システムは、漢字文字列に対して自国語の発音列を抽出する自国語の発音列抽出部、漢字−自国語の発音列の変換との関連を特徴つける統計データを用いて漢字文字列に対する統計データを決定する統計データ決定部と、抽出された自国語の発音列と決定された統計データとを用いて漢字文字列を最適な自国語の発音列に変換する自国語の発音列変換部と、を含んでもよい。
【選択図】図1

Description

本発明は漢字を自国語の発音列に変換するシステムおよび方法に関し、より詳しくは、漢字から自国語への変換に関連する統計データを用いて漢字を自国語の発音列に変換するシステムおよび方法に関する。
漢字の文化圏であるアジア各国における様々な文書では漢字が用いられる。また、漢字の文化圏でないアメリカなどでも漢字が限定的に用いられる。特に、コンピュータで用いられるプログラムにおいて漢字が含まれたテキスト文書が多く用いられる。ただし、漢字に慣れていないユーザのためにワードプロセスプログラムにおいて漢字を自国語の発音に変換するか、インテリジェントな情報検索で漢字に入力された検索クエリも検索しなければならない場合がある。

Figure 2011018330
日本の場合、韓国よりも文書に漢字の出現する頻度がさらに多い。しかし、日本人は漢字の代わりによみがな(yomigana)を入力して漢字を検索する場合が多い。例えば、「おんがく」というクエリを入力して「音楽」を検索していた。

Figure 2011018330
アメリカのような英語圏の国の場合、文書に漢字が用いられる場合は多くない。しかし、文書に用いられた漢字を英語に変換してクエリを入力すれば、該当文書を簡単に検索することができる。
従来、漢字を自国語に変換する方法は、予め設定した変換テーブルを用いる方式があった。すなわち、特定の漢字に対応する自国語を予め変換テーブルに格納しておき、ユーザから漢字が入力された場合、対応する自国語を単に提示する方式であった。

Figure 2011018330
したがって、少なくとも1つの漢字に対して変換することのできる自国語の発音の数が1つ以上である場合、最終的に変換される自国語の発音も様々であるため、本来の漢字を入力する時の意図とまったく関係のない自国語の発音が導き出される恐れが多かった。したがって、ユーザの本来の意図を反映して文脈および自国語の綴字法に適する自国語の発音列を導き出す必要がある。
また、同形異音の漢字によって文書またはクエリに様々なコード値を有する漢字が存在していて検索できない場合が生じていた。例えば、4つの文書がそれぞれ「楽園」(楽=0xF95C)、「楽園」(楽=0xF914)、「楽園」(楽=0x6A02)、「楽園」(楽=0xF9BF)のみが書かれていたと仮定する。この場合、ユーザが0xF95Cに該当する「楽園」を入力して文書を検索すると、4個の文書のうちの1つの文書のみ検索されるという問題がある。したがって、様々なコード値で表現される同形異音の漢字を1つの正規化された漢字に変換して検索の再現率を高める必要がある。

Figure 2011018330
このような問題を解決するために、漢字から自国語の発音にさらに正確に変換する方法が求められている。
本発明は漢字−自国語の発音列の変換との関連を特徴つける統計データを用いて、漢字の文字列に対して自国語の発音列を変換することによって、最終的に導き出される自国語の発音列の精度を向上させるシステムおよび方法を提供する。
本発明は、従来の変換テーブル方式では処理できない同形異音の漢字に対しても統計データを用いることによって文脈および自国語の綴字法に適した自国語の発音列に変換することができるシステムおよび方法を提供する。
本発明は、漢字コードの正規化によって正確ではないコードの漢字が入力された場合であっても、正確な自国語の発音列に変換することができるシステムおよび方法を提供する。
本発明は、統計データを用いてハングルの頭音法則のような例外的な文法も正確に反映することにより漢字文字列を自国語の発音列に変換することの信頼性を向上させるシステムおよび方法を提供する。
本発明の一実施形態に係る自国語の発音変換システムは、漢字の文字列に対して自国語の発音列を抽出する自国語の発音列抽出部と、漢字文字列と自国語の発音列の変換との関連を特徴つける統計データを用いて前記漢字文字列に対する統計データを決定する統計データ決定部と、前記抽出された自国語の発音列と前記決定した統計データとを用いて前記漢字の文字列に対して最適な自国語の発音列に変換する自国語の発音列変換部と、を含んでもよい。
本発明の一実施形態に係る自国語の発音変換システムは、形態が同一でありコードが異なる同形異音の漢字を含む漢字文字列に対し、前記漢字文字列のコードを正規化するコード正規化部をさらに含んでもよい。
本発明の一実施形態に係る自国語の発音変換方法は、漢字文字列に対して自国語の発音列を抽出するステップと、漢字文字列と自国語の発音列の変換との関連を特徴つける統計データを用いて前記漢字文字列に対する統計データを決定するステップと、前記抽出された自国語の発音列と前記決定した統計データとを用いて前記漢字文字列を最適な自国語の発音列に変換するステップと、を含んでもよい。
本発明の一実施形態に係る自国語の発音変換方法は、形態が同一でありコードが異なる同形異音の漢字を含む漢字文字列に対して前記漢字文字列のコードを正規化するステップをさらに含んでもよい。
本発明によれば、漢字文字列と自国語の発音列の変換との関連を特徴つける統計データを用いて、漢字文字列に対して自国語の発音列を変換することによって、最終的に導き出される自国語の発音列の精度を向上させることができる。
本発明によれば、従来の変換テーブル方式では処理できない同形異音の漢字であっても、統計データを用いることよって文脈および自国語の綴字法に適した自国語の発音列に変換することができる。
本発明によれば、漢字コードの正規化によって正確ではないコードの漢字が入力された場合にも正確な自国語の発音列に変換することができる。
本発明によれば、統計データを用いてハングルの頭音法則のような例外的な文法も正確に反映することによって、漢字文字列を自国語の発音列に変換することの信頼性を向上させることができる。
本発明の一実施形態に係る自国語の発音列変換システムによって漢字文字列に対して自国語の発音列に変換する全過程を示す図である。 本発明の一実施形態に係る自国語の発音列変換システムの全体構成を示すブロックダイヤグラムである。 本発明の一実施形態に係る漢字文字列に対して正規化する過程を説明するための図である。 本発明の一実施形態に係る漢字−自国語の発音列テーブルの一例を示す図である。 本発明の一実施形態に係る漢字文字列に対して自国語の発音列に変換する過程を示す図である。 本発明の一実施形態に係る自国語の発音列の変換方法の全過程を示すフローチャートである。
以下、添付された図面に記載した内容を参照して本発明に係る実施形態を詳細に説明する。ただし、本発明が実施形態によって制限され、限定されることはない。各図面に提示された同一の参照符号は同一の部材を示す。自国語の発音列の変換方法は、自国語の発音列変換システムによって行われてもよい。
図1は、本発明の一実施形態に係る自国語の発音列変換システムによって漢字の文字列に対して自国語の発音列に変換する全過程を示す図である。
ユーザ101−1〜101−nが少なくとも1つの漢字を含む漢字文字列を入力すれば、自国語の発音列変換システム100は、漢字文字列を自国語の発音列102−1〜102−nに変換する。自国語は、自国語の発音列変換システム100が提供する文書に記載された言語に基づいて異なるように決定されてもよい。例えば、自国語の発音列変換システム100がハングル文書を提供する場合、自国語をハングルに決定してもよい。
この場合、漢字文字列は、少なくとも1つの漢字を含んでもよい。コンピュータを用いるプログラム(PC用プログラム、サーバ用プログラム、ウェブ用プログラムなど)に漢字が含まれたテキスト文書に対し、自国語の発音に変換しなければならない場合が度々発生する。

Figure 2011018330

Figure 2011018330
本発明の一実施形態に係る自国語の発音列変換システム100は、与えられた漢字文字列に対して自国語の発音列に変換されるデータを統計的に分析したデータを用いることによって、さらに正確な自国語の発音列を提供することができる。また、自国語の発音列変換システム100は、文脈および自国語の綴字法に適する自国語の発音列を提供することによって、自国語の発音列に変換された結果に対して信頼性を保障することができる。
図2は、本発明の一実施形態に係る自国語の発音列変換システムの全体構成を示すブロックダイヤグラムである。
図2に示すように、自国語の発音列変換システム100は、コード正規化部201、自国語の発音列抽出部202、統計データ決定部203、および自国語の発音列変換部204を含んでよい。
コード正規化部201は、形態が同一であり、コードが異なる同形異音の漢字を含む漢字文字列205に対して漢字文字列205のコードを正規化する。一例として、コード正規化部201は、同形異音の漢字を代表漢字に変換して漢字文字列205のコードを正規化してもよい。この場合、コード正規化部201は、漢字正規化データ207を用いて漢字文字列205のコードを正規化してもよい。
その結果、コード正規化部201によって正規化された漢字文字列210を導き出することができる。ただし、漢字文字列205が同形異音の漢字を含まない場合、コード正規化部201は動作しない。コード正規化部201の具体的な動作は図3を参照して詳しく説明する。
自国語の発音列抽出部202は、漢字−自国語の発音列テーブル208を用いて漢字文字列に対して自国語の発音列を抽出する。この場合、漢字−自国語の発音列テーブル208は、複数の漢字に対する自国語の発音列の組みを含んでもよい。すなわち、漢字−自国語の発音列テーブル208によれば、漢字ごとに自国語の発音列が対応付けられてもよい。
ただし、同一の漢字に対して自国語の発音列が1つ以上である場合がある。この場合、自国語の発音列は、文脈および自国語の綴字法にしたがって変換されなければならない。これに対して、本発明の一実施形態に係る自国語の発音列変換システム100は、漢字から自国語に変換された統計データを用いることによって変換される自国語の発音列の精度を向上させることができる。
統計データ決定部203は、漢字−自国語の発音列の変換との関連を特徴つける統計データを用いて漢字文字列に対する統計データを決定する。
一例として、統計データ決定部203は、漢字と自国語が共に表現されたデータから抽出され、漢字−自国語の変換に対して意味のある特徴に対応する統計データ209を用いて漢字文字列205に対する統計データを決定してもよい。この場合、統計データ決定部203は、漢字文字列205と関連して自国語の発音列206の音節に対して音節確率と転移確率を決定してもよい。
すなわち、本発明の一実施形態によれば、漢字に対して自国語に変換される様々な統計データを用いることによって、それぞれの状況に応じて同一の漢字であっても異なるように発音される自国語を正確に決定することができる。統計データを用いる過程は、図5を参照してさらに具体的に説明する。
自国語の発音列変換部204は、抽出された自国語の発音列と決定された統計データを用いて漢字文字列205を最適な自国語の発音列206に変換する。一例として、自国語の発音列変換部204は、漢字文字列205に対して変換しようとする自国語の発音列の確率が最大になる自国語の発音列206を決定してもよい。
この場合、自国語の発音列変換部204は、隠れマルコフモデル(hidden markov model)に基づいて漢字文字列205を自国語の発音列206を変換してもよい。特に、自国語の発音列変換部204は、繰り返し処理される漢字文字列に対してはビタビ(viterbi)アルゴリズムを適用して、漢字文字列205に対して最適経路を示す自国語の発音列204に変換してもよい。
図3は、本発明の一実施形態に係る漢字文字列を正規化する過程を説明するための図である。
漢字文字列が自国語の発音列に変換されなくても同形異音の漢字によって文書またはクエリに様々なコード値を有する単語が存在して検索が実行できない場合がある。これに対して、自国語の発音列変換システム100は、形態が同一でありコードが異なる同形異音の漢字を含む漢字文字列に対して漢字文字列のコードを正規化してもよい。

Figure 2011018330

Figure 2011018330

Figure 2011018330
本発明の一実施形態に係る自国語の発音列変換システムは、漢字文字列の正規化過程によって統計モデルにおけるデータの稀少性の問題を解決することができる。また、自国語の発音列変換システムは、文脈および自国語の綴字法に適さないコードで用いられた漢字に対しても自国語の変換ができる。
図4は、本発明の一実施形態に係る漢字−自国語の発音列テーブルの一例を示す図である。特に、図4は、漢字−ハングルの発音列テーブルの一例を示す。図4の説明は他の自国語にも類推して適用してもよい。

Figure 2011018330

Figure 2011018330

Figure 2011018330
図5は、本発明の一実施形態に係る漢字文字列に対して自国語の発音列に変換する過程を示す図である。

Figure 2011018330
自国語の発音列変換システムは、漢字−自国語の発音列の変換との関連を特徴つける統計データを用いて漢字文字列に対する統計データを決定してもよい。一例として、自国語の発音列変換システムは、漢字と自国語が共に表現されるデータから抽出され、漢字−自国語の変換に対して意味のある特徴に対応する統計データを用いて漢字文字列に対する統計データを決定してもよい。
本発明の一実施形態によれば、漢字−ハングルの変換に対して意味のある特徴は、以下の通りである。特徴は、各国の文法および綴字法に応じて変更されてもよい。

Figure 2011018330

Figure 2011018330

Figure 2011018330

Figure 2011018330

Figure 2011018330

Figure 2011018330

Figure 2011018330

Figure 2011018330
前述のような特徴に対する確率は、自国語と漢字が共に表現されたブログ、文書、ウェプページなどのデータによって統計的に決定されてもよい。特に、ハングルの発音には様々な頭音法則が存在し、それに対する例外も多く存在する。このため、漢字とハングルが共に表現されたデータから抽出し、漢字−ハングルの変換に対して意味のある特徴に対応する統計データを用いて変換されるハングルの発音列の精度を向上させることができる。また、韓国の頭音法則と共に韓国以外の他の国でも固有の綴字法が存在することから、このような固有の綴字法を反映した特徴を用いて各国の状況に適する統計データが導き出されてもよい。
一例として、ハングルの発音に対する頭音法則とその例外は次のとおりであり、このような事項も本発明の一実施形態に係る統計データに適用される特徴として用いられてもよい。

Figure 2011018330

Figure 2011018330

Figure 2011018330

Figure 2011018330

Figure 2011018330

Figure 2011018330

Figure 2011018330

Figure 2011018330
そして、自国語の発音列変換システムは、抽出された自国語の発音列と決定された統計データとを用いて、漢字文字列を最適な自国語の発音列に変換してもよい。一例として、自国語の発音列変換システムは、統計データである音節確率と転移確率とを用いて、漢字文字列を変換しようとする自国語の発音列の確率が最大になる自国語の発音列を決定してもよい。このとき、自国語の発音列変換システムは、隠れマルコフモデルに基づいて漢字文字列を自国語の発音列に変換してもよい。

Figure 2011018330

Figure 2011018330
一例として、自国語の発音列変換システムは、下記の数式(1)及び(2)による隠れマルコフモデルを用いて漢字文字列を自国語の発音列を変換してもよい。
Figure 2011018330
Figure 2011018330
このとき、Cは漢字文字列、Kは自国語の発音列を意味する。また、下記数式(3)は音節の確率であり、数式(4)は遷移確率を示す。
Figure 2011018330
Figure 2011018330
すると、漢字文字列が最終的に変換される自国語の発音列は下記の数式(5)によって決定してもよい。
Figure 2011018330
すなわち、自国語の発音列変換システムは、与えられた漢字文字列に対して音節確率と遷移確率を組み合わせた結果が最大になる自国語の発音列を決定してもよい。このとき、自国語の発音列変換システムは、繰り返し処理される部分に対してはビタビアルゴリズムを適用して漢字文字列を最適な経路を示す自国語の発音列を変換してもよい。

Figure 2011018330
図6は、本発明の一実施形態に係る自国語の発音列の変換方法の全過程を示すフローチャートである。
自国語の発音列変換システムは、漢字文字列のコードを正規化してもよい(S601)。一例として、自国語の発音列変換システムは、形態が同一であるがコードが異なる同形異音の漢字を含む漢字文字列に対して漢字文字列のコードを正規化してもよい。この場合、自国語の発音列変換システムは、正規化データを用いて同形異音の漢字を代表漢字に変換することにより、漢字文字列のコードを正規化してもよい。ここで、正規化データは、漢字辞書によって自動に構築されてもよい。
自国語の発音列変換システムは、漢字文字列に対して自国語の発音列を抽出してもよい(S602)。一例として、自国語の発音列変換システムは、複数の漢字に対する自国語の発音列の組で構成される漢字−自国語の発音列テーブルを用いて、漢字文字列に対して自国語の発音列を抽出してもよい。このとき、漢字文字列が正規化する過程を経た場合、自国語の発音列変換システムは、正規化された漢字文字列に対して自国語の発音列を抽出してもよい。
自国語の発音列変換システムは、漢字−自国語の発音列の変換との関連を特徴つける統計データを用いて漢字文字列に対する統計データを決定してもよい(S603)。
一例として、自国語の発音列変換システムは、漢字と自国語が共に表現されたデータから抽出され、漢字−自国語の変換に対して意味のある特徴に対応する統計データを用いて漢字文字列に対する統計データを決定してもよい。このとき、自国語の発音列変換システムは、漢字文字列と関連する統計データを用いて自国語の発音列の音節に対して音節確率と転移確率を決定してもよい。
自国語の発音列変換システムは、抽出された自国語の発音列と決定された統計データとを用いて漢字文字列を最適な自国語の発音列に変換してもよい(S604)。一例として、自国語の発音列変換システムは、漢字文字列に対して変換しようとする自国語の発音列の確率が最大になる自国語の発音列を決定してもよい。
このとき、自国語の発音列変換システムは、隠れマルコフモデルに基づいて漢字文字列を自国語の発音列に変換してもよい。特に、自国語の発音列変換システムは、繰り返して処理される部分に対しては、ビタビアルゴリズムを適用して漢字文字列を最適な経路を示す自国語の発音列に変換してもよい。
図6において説明されない事項は、図1〜図5の説明を参照して理解してもよい。
また、本発明の一実施形態に係る漢字に対するハングルの発音列の変換方法は、コンピュータにより実現される多様な動作を実行するためのプログラム命令を含むコンピュータ読取可能な記録媒体を含む。当該記録媒体は、プログラム命令、データファイル、データ構造などを単独または組み合わせて含むこともでき、記録媒体およびプログラム命令は、本発明の目的のために特別に設計されて構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知であり使用可能なものであってもよい。コンピュータ読取可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体、CD−ROM、DVDのような光記録媒体、フロプティカルディスクのような磁気−光媒体、およびROM、RAM、フラッシュメモリなどのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置が含まれる。プログラム命令の例としては、コンパイラによって生成されるような機械語コードだけでなく、インタプリタなどを用いてコンピュータによって実行され得る高級言語コードを含む。
上述したように、本発明の好ましい実施形態を参照して説明したが、特許請求の範囲に記載された本発明の思想および領域から逸脱しない範囲内で、本発明を多様に修正および変更できることは当業者にとって明らかである。すなわち、本発明の技術的範囲は、特許請求の範囲に基づいて定められ、発明を実施するための最良の形態により制限されるものではない。
100:自国語の発音列変換システム
101−1〜101−n:ユーザ
102−1〜102−n:自国語の発音列
103:変換の一例
201:コード正規化部
202:自国語の発音列抽出部
203:統計データ決定部
204:自国語の発音列変換部
208:漢字−自国語の発音列テーブル

Claims (19)

  1. 漢字文字列に対して自国語の発音列を抽出する自国語の発音列抽出部と、
    漢字−自国語の発音列の変換との関連を特徴つける統計データを用いて前記漢字文字列に対する統計データを決定する統計データ決定部と、
    前記抽出された自国語の発音列と前記決定した統計データとを用いて前記漢字文字列を最適な自国語の発音列に変換する自国語の発音列変換部と、
    を含むことを特徴とする自国語の発音列変換システム。
  2. 前記自国語の発音列抽出部は、複数の漢字に対する自国語の発音列の組で構成された漢字−自国語の発音列テーブルを用いて自国語の発音列を抽出することを特徴とする請求項1に記載の自国語の発音列変換システム。
  3. 形態が同一であり、かつコードが異なる同形異音の漢字を含む漢字文字列に対し、前記漢字文字列のコードを正規化するコード正規化部をさらに含み、
    前記自国語の発音列抽出部は、前記コードが正規化された漢字文字列に対し、自国語の発音列を抽出することを特徴とする請求項1に記載の自国語の発音列変換システム。
  4. 前記コード正規化部は、前記同形異音の漢字を代表漢字に変換して前記漢字文字列のコードを正規化することを特徴とする請求項3に記載の自国語の発音列変換システム。
  5. 前記統計データ決定部は、漢字と自国語が共に表現されたデータから抽出され、漢字−自国語の変換に対して意味のある特徴に対応する統計データを用いて、前記漢字文字列に対する統計データを決定することを特徴とする請求項1に記載の自国語の発音列変換システム。
  6. 前記統計データ決定部は、前記漢字文字列と関連する前記自国語の発音列の音節に対して音節確率と転移確率を決定することを特徴とする請求項1に記載の自国語の発音列変換システム。
  7. 前記自国語の発音変換部は、前記漢字文字列に対して変換しようとする自国語の発音列の確率が最大になる自国語の発音列を決定することを特徴とする請求項1に記載の自国語の発音列変換システム。
  8. 前記自国語の発音変換部は、隠れマルコフモデルに基づいて前記漢字文字列を自国語の発音列を変換することを特徴とする請求項7に記載の自国語の発音列変換システム。
  9. 前記自国語の発音変換部は、繰り返して処理される部分に対しては、ビタビアルゴリズムを適用して前記漢字文字列に対して最適な経路を表す自国語の発音列に変換することを特徴とする請求項8に記載の自国語の発音列変換システム。
  10. 漢字文字列に対して自国語の発音列を抽出するステップと、
    漢字−自国語の発音列の変換との関連を特徴つける統計データを用いて前記漢字文字列に対する統計データを決定するステップと、
    前記抽出された自国語の発音列と前記決定した統計データとを用いて前記漢字文字列を最適な自国語の発音列に変換するステップと、
    を含むことを特徴とする自国語の発音列の変換方法。
  11. 前記自国語の発音列を抽出するステップは、複数の漢字に対する自国語の発音列の組で構成された漢字−自国語の発音列テーブルを用いて自国語の発音列を抽出することを特徴とする請求項10に記載の自国語の発音列の変換方法。
  12. 形態が同一であり、かつコードが異なる同形異音の漢字を含む漢字文字列に対して前記漢字文字列のコードを正規化するステップをさらに含み、
    前記漢字文字列に対して自国語の発音列を抽出するステップは、前記コードが正規化された漢字文字列に対して自国語の発音列を抽出することを特徴とする請求項10に記載の自国語の発音列の変換方法。
  13. 前記漢字文字列のコードを正規化するステップは、前記同形異音の漢字を代表漢字に変換して前記漢字文字列のコードを正規化することを特徴とする請求項12に記載の自国語の発音列の変換方法。
  14. 前記漢字文字列に対する統計データを決定するステップは、漢字と自国語が共に表現されたデータから抽出され、漢字−自国語の変換に対して意味のある特徴に対応する統計データを用いて前記漢字文字列に対する統計データを決定することを特徴とする請求項10に記載の自国語の発音列の変換方法。
  15. 前記漢字文字列に対する統計データを決定するステップは、前記漢字文字列と関連する前記自国語の発音列の音節に対して音節確率と転移確率を決定することを特徴とする請求項10に記載の自国語の発音列の変換方法。
  16. 前記漢字文字列を最適な自国語の発音列に変換するステップは、前記漢字文字列に対して変換しようとする自国語の発音列の確率が最大になる自国語の発音列を決定することを特徴とする請求項10に記載の自国語の発音列の変換方法。
  17. 前記漢字文字列を最適な自国語の発音列に変換するステップは、隠れマルコフモデルに基づいて前記漢字文字列を自国語の発音列に変換することを特徴とする請求項16に記載の自国語の発音列の変換方法。
  18. 前記漢字文字列を最適な自国語の発音列に変換するステップは、繰り返して処理される部分に対しては、ビタビアルゴリズムを適用して前記漢字文字列に対して最適な経路を表す自国語の発音列に変換することを特徴とする請求項17に記載の自国語の発音列の変換方法。
  19. 請求項10乃至請求項18のいずれか一項に記載の方法を行うためのプログラムが記録されたコンピュータで読み出し可能な記録媒体。
JP2010153827A 2009-07-08 2010-07-06 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法 Active JP5599662B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2009-0062143 2009-07-08
KR1020090062143A KR101083540B1 (ko) 2009-07-08 2009-07-08 통계적인 방법을 이용한 한자에 대한 자국어 발음열 변환 시스템 및 방법

Publications (2)

Publication Number Publication Date
JP2011018330A true JP2011018330A (ja) 2011-01-27
JP5599662B2 JP5599662B2 (ja) 2014-10-01

Family

ID=43428163

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010153827A Active JP5599662B2 (ja) 2009-07-08 2010-07-06 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法

Country Status (4)

Country Link
US (1) US20110010178A1 (ja)
JP (1) JP5599662B2 (ja)
KR (1) KR101083540B1 (ja)
CN (1) CN101950285A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014081864A (ja) * 2012-10-18 2014-05-08 Zenrin Datacom Co Ltd 音訓漢字対応韓国語翻訳装置、音訓漢字対応韓国語翻訳方法および音訓漢字対応韓国語翻訳プログラム

Families Citing this family (185)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8706472B2 (en) * 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
KR20150104615A (ko) 2013-02-07 2015-09-15 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
CN105027197B (zh) 2013-03-15 2018-12-14 苹果公司 训练至少部分语音命令系统
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
EP3008641A1 (en) 2013-06-09 2016-04-20 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
AU2014278595B2 (en) 2013-06-13 2017-04-06 Apple Inc. System and method for emergency calls initiated by voice command
CN104239289B (zh) * 2013-06-24 2017-08-29 富士通株式会社 音节划分方法和音节划分设备
CN105453026A (zh) 2013-08-06 2016-03-30 苹果公司 基于来自远程设备的活动自动激活智能响应
CN103544274B (zh) * 2013-10-21 2019-11-05 王冠 一种韩语文章汉字显现系统及其方法
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
JP6289950B2 (ja) * 2014-03-19 2018-03-07 株式会社東芝 読み上げ装置、読み上げ方法及びプログラム
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US20160062979A1 (en) * 2014-08-27 2016-03-03 Google Inc. Word classification based on phonetic features
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
US11043220B1 (en) 2020-05-11 2021-06-22 Apple Inc. Digital assistant hardware abstraction
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
WO2023149644A1 (ko) * 2022-02-03 2023-08-10 삼성전자주식회사 전자 장치 및 사용자 언어 모델 생성 방법

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08305698A (ja) * 1995-05-11 1996-11-22 Nippon Telegr & Teleph Corp <Ntt> 自然語解析方法及び装置
JPH10171807A (ja) * 1996-12-13 1998-06-26 Nec Corp 語義曖昧性解消装置及び方法
JP2005092682A (ja) * 2003-09-19 2005-04-07 Nippon Hoso Kyokai <Nhk> 翻字装置、及び翻字プログラム
JP2005258637A (ja) * 2004-03-10 2005-09-22 Nippon Hoso Kyokai <Nhk> 対訳語抽出装置、及び対訳語抽出プログラム
JP2006155213A (ja) * 2004-11-29 2006-06-15 Hitachi Information Systems Ltd 漢字氏名のふりがな取得装置及びその取得方法
JP2007109233A (ja) * 2005-10-09 2007-04-26 Toshiba Corp 音訳モデル及び構文解析統計モデルを訓練するための方法及び装置、及び音訳のための方法及び装置
JP2008504605A (ja) * 2004-06-23 2008-02-14 グーグル、インコーポレイテッド 非ローマ文字および単語のスペル修正のためのシステムおよび方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5257938A (en) * 1992-01-30 1993-11-02 Tien Hsin C Game for encoding of ideographic characters simulating english alphabetic letters
KR100291372B1 (ko) * 1992-05-29 2001-06-01 이데이 노부유끼 전자 사전 장치
US5742838A (en) * 1993-10-13 1998-04-21 International Business Machines Corp Method for conversion mode selection in hangeul to hanja character conversion
US5793381A (en) * 1995-09-13 1998-08-11 Apple Computer, Inc. Unicode converter
US6292768B1 (en) * 1996-12-10 2001-09-18 Kun Chun Chan Method for converting non-phonetic characters into surrogate words for inputting into a computer
KR100202292B1 (ko) 1996-12-14 1999-06-15 윤덕용 한문어 문서 음성 변환 시스템을 위한 문서 분석기
WO2000062193A1 (en) * 1999-04-08 2000-10-19 Kent Ridge Digital Labs System for chinese tokenization and named entity recognition
US8706747B2 (en) * 2000-07-06 2014-04-22 Google Inc. Systems and methods for searching using queries written in a different character-set and/or language from the target pages
JP2002041276A (ja) * 2000-07-24 2002-02-08 Sony Corp 対話型操作支援システム及び対話型操作支援方法、並びに記憶媒体
JP3953772B2 (ja) * 2001-10-19 2007-08-08 日本放送協会 読みがな付与装置およびプログラム
CN100429648C (zh) * 2003-05-28 2008-10-29 洛昆多股份公司 一种文本自动分块的方法、分块器和文本到语言合成系统
US8200865B2 (en) * 2003-09-11 2012-06-12 Eatoni Ergonomics, Inc. Efficient method and apparatus for text entry based on trigger sequences
US7359850B2 (en) * 2003-09-26 2008-04-15 Chai David T Spelling and encoding method for ideographic symbols
US7263658B2 (en) * 2004-10-29 2007-08-28 Charisma Communications, Inc. Multilingual input method editor for ten-key keyboards
US20080046824A1 (en) * 2006-08-16 2008-02-21 Microsoft Corporation Sorting contacts for a mobile computer device
US7885807B2 (en) * 2006-10-18 2011-02-08 Hierodiction Software Gmbh Text analysis, transliteration and translation method and apparatus for hieroglypic, hieratic, and demotic texts from ancient Egyptian
US7823138B2 (en) * 2006-11-14 2010-10-26 Microsoft Corporation Distributed testing for computing features
US7890525B2 (en) * 2007-11-14 2011-02-15 International Business Machines Corporation Foreign language abbreviation translation in an instant messaging system

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08305698A (ja) * 1995-05-11 1996-11-22 Nippon Telegr & Teleph Corp <Ntt> 自然語解析方法及び装置
JPH10171807A (ja) * 1996-12-13 1998-06-26 Nec Corp 語義曖昧性解消装置及び方法
JP2005092682A (ja) * 2003-09-19 2005-04-07 Nippon Hoso Kyokai <Nhk> 翻字装置、及び翻字プログラム
JP2005258637A (ja) * 2004-03-10 2005-09-22 Nippon Hoso Kyokai <Nhk> 対訳語抽出装置、及び対訳語抽出プログラム
JP2008504605A (ja) * 2004-06-23 2008-02-14 グーグル、インコーポレイテッド 非ローマ文字および単語のスペル修正のためのシステムおよび方法
JP2006155213A (ja) * 2004-11-29 2006-06-15 Hitachi Information Systems Ltd 漢字氏名のふりがな取得装置及びその取得方法
JP2007109233A (ja) * 2005-10-09 2007-04-26 Toshiba Corp 音訳モデル及び構文解析統計モデルを訓練するための方法及び装置、及び音訳のための方法及び装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014081864A (ja) * 2012-10-18 2014-05-08 Zenrin Datacom Co Ltd 音訓漢字対応韓国語翻訳装置、音訓漢字対応韓国語翻訳方法および音訓漢字対応韓国語翻訳プログラム

Also Published As

Publication number Publication date
CN101950285A (zh) 2011-01-19
JP5599662B2 (ja) 2014-10-01
KR101083540B1 (ko) 2011-11-14
US20110010178A1 (en) 2011-01-13
KR20110004625A (ko) 2011-01-14

Similar Documents

Publication Publication Date Title
JP5599662B2 (ja) 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法
Azmi et al. A survey of automatic Arabic diacritization techniques
KR20160008480A (ko) 명칭을 강인하게 태깅하는 방법 및 시스템
JP2016516247A (ja) 翻字、翻訳、書記素洞察のキュレーション及び統合による多言語ビジネスの印の向上
Zitouni et al. Arabic diacritic restoration approach based on maximum entropy models
Antony et al. Machine transliteration for indian languages: A literature survey
WO2010044123A1 (ja) 検索装置、検索用索引作成装置、および検索システム
JP4266222B2 (ja) 単語翻訳装置およびそのプログラム並びにコンピュータ読み取り可能な記録媒体
KR20230009564A (ko) 앙상블 스코어를 이용한 학습 데이터 교정 방법 및 그 장치
EP4348603A1 (en) Application-specific optical character recognition customization
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
Abdulmalek et al. Levenstein's Algorithm On English and Arabic: A Survey
JP2013069170A (ja) 検索装置、検索方法およびプログラム
Qafmolla Automatic language identification
JP2008059389A (ja) 語彙候補出力システム、語彙候補出力方法及び語彙候補出力プログラム
Núñez et al. Phonetic normalization for machine translation of user generated content
JP5795302B2 (ja) 形態素解析装置、方法、及びプログラム
JP7135730B2 (ja) 要約生成方法及び要約生成プログラム
JP3952964B2 (ja) 読み情報決定方法及び装置及びプログラム
JP4941495B2 (ja) ユーザ辞書作成システム、方法、及び、プログラム
Celikkaya et al. A mobile assistant for Turkish
JP6451151B2 (ja) 質問応答装置、質問応答方法、プログラム
KR102500106B1 (ko) 약어 사전 구축 장치 및 방법
US20230143110A1 (en) System and metohd of performing data training on morpheme processing rules
US11210337B2 (en) System and method for searching audio data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130529

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131122

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140213

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140318

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140715

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140813

R150 Certificate of patent or registration of utility model

Ref document number: 5599662

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250