JP5851130B2 - 日本語のための音声キー - Google Patents

日本語のための音声キー Download PDF

Info

Publication number
JP5851130B2
JP5851130B2 JP2011145643A JP2011145643A JP5851130B2 JP 5851130 B2 JP5851130 B2 JP 5851130B2 JP 2011145643 A JP2011145643 A JP 2011145643A JP 2011145643 A JP2011145643 A JP 2011145643A JP 5851130 B2 JP5851130 B2 JP 5851130B2
Authority
JP
Japan
Prior art keywords
vowel
character
voice key
kana
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011145643A
Other languages
English (en)
Other versions
JP2012014699A (ja
Inventor
ほづみ 中野
ほづみ 中野
Original Assignee
ビジネス オブジェクツ ソフトウェア リミテッド
ビジネス オブジェクツ ソフトウェア リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ビジネス オブジェクツ ソフトウェア リミテッド, ビジネス オブジェクツ ソフトウェア リミテッド filed Critical ビジネス オブジェクツ ソフトウェア リミテッド
Publication of JP2012014699A publication Critical patent/JP2012014699A/ja
Application granted granted Critical
Publication of JP5851130B2 publication Critical patent/JP5851130B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Input From Keyboards Or The Like (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、一般に言語処理システムに関する。より具体的には、本発明は日本語仮名言語システムのための音声キーに関する。
多くのアプリケーションで、英語のための音声キーが使用されている。コンピュータ関連アプリケーションでは、データ検索およびデータベースレコード検索のために音声キーを使用できる。一般的に、音声キーは1つまたは複数の単語の音をとらえる一連の文字である。音声キーにおける文字は、数字、記号、およびアルファベットの組合せを含むことができる。
英語またはいくつかのラテン語由来の言語における所与の単語について、音声キーを生成するためのいくつかの方法が開発されている。音声キーを生成するために使用されている方法のうちのいくつかに、Soundex、Metaphone、およびDouble Metaphoneなどがある。Soundex技術は、1文字に続いて3つの数字で構成される音声コードを生成する。一般的に、文字は単語の最初の文字であり、数字は残りの子音を符号化する。Metaphone方法は、Soundex方法の固定長キーとは異なり、様々な長さの音声キーを生成する。Metaphone方法では、同様に発音する単語は同じキーを共有する。The Double Metaphone方法は2つの音声キー、すなわち、Metaphone方法同様の様々な長さの第1キー、および別の発音を説明するための様々な長さの第2キーを生成する。
しかし、Soundex、Metaphone、Double Metaphone、および他の同様の方法は、英語およびラテン語由来の言語に適している。これらの方法は、日本語のような複雑な言語には適用できない場合がある。日本語のための音声キーを開発することが望ましい。
本明細書では、日本語のための音声キーの様々な実施形態を説明する。ユーザは、仮名文字をひらがな形式かカタカナ形式で提供できる。仮名文字が受け取られ、その仮名文字に仮名規則セットが適用される。次いで、仮名文字が、仮名文字の音に基づいて英語などのアルファベット言語で定義される。次いで、定義された仮名文字に基づいて、完全な音声キーが生成される。完全な音声キー内の母音を置換することによって置換母音音声キーが生成され、完全な音声キー内の母音を削除することによって無母音音声キーが生成される。同じ仮名文字について別の音がある場合、それぞれの音について完全な音声キー、置換母音音声キー、および無母音音声キーのセットが生成される。次いで、完全な音声キー、置換母音音声キー、無母音音声キーのうちの少なくとも1つと同じ音声キーを有する関連する仮名レコードを決定するために、データベース内の仮名レコードが処理される。次いで、関連する仮名レコードがユーザに提示される。
本発明の実施形態のこれらおよび他の利点ならびに特徴は、添付の図面に関連して提示される本発明の好ましい実施形態の以下の詳細な説明を考慮すれば明らかになるであろう。
特許請求の範囲は、本発明の実施形態を詳細に説明する。本発明を例示の目的で説明するが、添付の図面における図に限定するものではない。図面において、同様の参照番号は類似の要素を指す。以下の詳細な説明を添付の図面と併せて読めば、本発明の実施形態およびその利点が最もよく理解されよう。
一実施形態による、音声キーを生成するための日本語仮名言語処理方法を示す流れ図である。 一実施形態による、音節仮名文字、およびそれぞれの英語での定義の表リストである。 一実施形態による、音節仮名文字、およびそれぞれの英語での定義の表リストである。 一実施形態による、音節仮名文字、およびそれぞれの英語での定義の表リストである。 一実施形態による、音節仮名文字、およびそれぞれの英語での定義の表リストである。 一実施形態による、仮名文字から生成された例示的音声キーである。 一実施形態による、仮名文字から生成された例示的音声キーである。 一実施形態による、仮名文字から生成された例示的音声キーである。 一実施形態による、音声キーを使用して関連する仮名単語を見つけるための手順を示すブロック図である。 一実施形態による、日本語仮名言語を処理するためのシステムのブロック図である。 一実施形態による、例示的コンピュータシステムのブロック図である。
本明細書では、日本語のための音声キーの技術の実施形態を説明する。以下の説明では、本発明の実施形態の完全な理解を提供するために多数の具体的詳細を説明する。しかし、関連分野の当業者は、具体的詳細のうちの1つまたは複数がなくても、あるいは他の方法、コンポーネント、物質などを使用しても、本発明を実施できることが理解できるであろう。本発明の態様を不明瞭にしないように、他の例では、よく知られている構造、物質、または操作は、図示または詳細に説明しない。
本明細書を通じて、「一実施形態」、「この実施形態」、および同様のフレーズへの言及は、実施形態に関連して説明される特定の機能、構造、または特徴は本発明の少なくとも1つの実施形態に含まれることを意味する。したがって、本明細書を通じて様々な箇所で現れるこれらのフレーズは、必ずしもすべてが同じ実施形態を指すわけではない。さらに、特定の機能、構造、または特徴は、1つまたは複数の実施形態において、何らかの適切な方法で組み合わせることもできる。
図1は、音声キーを生成するための日本語仮名言語処理方法100の実施形態を示している。仮名スクリプトは、ひらがな形式またはカタカナ形式を含み、それぞれが独自の文字セットを有する。ユーザは、仮名文字をひらがなかカタカナで提供できる。これらの仮名文字は、仮名単語、仮名単語の一部、仮名音節でもよく、複数の仮名単語でもよい。ユーザによって提供された仮名文字は、102で受け取られる。
104で、仮名文字に仮名規則セットが適用される。仮名規則セットは、仮名文字に適用される規則のセットを含む。仮名文字によって、規則は仮名文字を部分的に修正してよい。ある規則によれば、仮名文字が句読点を含む場合、その句読点は省略される。仮名句読点の例には、[・]、[。]、および[、]がある(角括弧内に示す)。他の規則によれば、仮名文字が文字の間にスペースを含む場合、連続する仮名文字を取得するためにそのスペースは省略される。
仮名文字は、「v」の音を示す特別な文字の組合せ「う゛」、および「ー」または「―」などの長音文字を含むことができる。他の規則によれば、この特別な文字の組合せ「う゛」は単一の文字として認識される。他の規則によれば、長音文字は仮名文字から省略される。
仮名は、小型と大型の両方で書くことができる。他の規則によれば、仮名文字が2つ以上の隣接する同じ小型母音文字を含む場合、小型母音文字のうちの1つだけが保持される。たとえば、次の仮名文字を考察する:きゃぁぁ。この仮名文字のセットは、2つの隣接する同じ小型母音文字、すなわち、ぁぁを含んでいる。したがって、この規則を適用することによって、仮名文字「きゃぁぁ」は「きゃぁ」に変換される。
他の規則によれば、仮名文字が第1の小型文字に続いて第2の小型文字を含む場合、第2の小型文字は大型文字に変換される。たとえば、次の仮名文字を考察する:「きゃぁ」。この仮名文字のセットは第1の小型文字「ゃ」に続いて第2の小型文字「ぁ」を含んでいる。したがって、第2の小型文字「ぁ」はそれ自身の大型文字、すなわち「あ」に変換される。この規則を適用することによって、仮名文字「きゃぁ」は「きゃあ」に変換される。
他の規則によれば、仮名文字が大型文字に続いて同じ文字の小型文字を含む場合、小型文字が省略される。たとえば、次の仮名文字を考察する:「いぃ」。この仮名文字のセットは、大型文字「い」に続いて小型文字「ぃ」を含んでいる。この規則を適用することによって小型文字「ぃ」が省略され、仮名文字「いぃ」は「い」に変換される。
他の規則によれば、仮名文字が「っ」の文字を含む場合、「っ」の文字は非日本語特別文字または記号に変換される。「っ」の文字は撥音を有する。一実施形態では、「っ」の文字は「^」に変換される。他の規則によれば、仮名文字がモーラ鼻音文字「ん」を含む場合、そのモーラ鼻音文字は、他の非日本語特別文字、または「*」などの記号に変換される。文字「ん」はモーラ鼻音を有する。
104で規則セットを適用後、106で、仮名文字がその音に基づいてアルファベット言語で定義される。一実施形態では、仮名文字は英語で定義される。仮名スクリプト(ひらがなおよびカタカナ)は音節スクリプトなので、仮名文字は音節または音節の組合せを含む。音節は、その音に基づいて英語で定義できる。たとえば、ひらがなの仮名音節「な」は、英語の「na」のように発音する。ひらがなの仮名音節「が」は英語の「ga」のように発音し、ひらがなの仮名音節「さ」は英語の「sa」のように発音し、ひらがなの仮名音節「き」は英語の「ki」のように発音する。したがって、ユーザが仮名文字「ながさき」を提供すると、それらの仮名文字は英語で「nagasaki」と定義される。図2A〜2Dは、英語で定義される仮名音節(ひらがなとカタカナの両方)のリストを示している。
108で、定義された仮名文字から第1の完全な音声キーが生成される。一実施形態では、106から定義された仮名文字が2つ以上の隣接する母音を含む場合、母音を1つだけ保持することによって第1の完全な音声キーが生成される。たとえば、定義された仮名文字「ookii」(大きい)から、第1の完全な音声キー「oki」が生成される。また、定義された仮名文字が「ei」または「ou」の母音の組合せを含む場合、それぞれの1つだけの母音「e」または「o」を保持することによって第1の完全な音声キーが生成される。定義された仮名文字が、隣接する母音も「ei」または「ou」の母音の組合せも含まない場合、定義された仮名文字は第1の完全な音声キーを形成する。
いくつかの仮名単語は別の音を有することができる。仮名単語が2つの異なる音を有する場合、108で第1の音について第1の完全な音声キーが生成され、110で第2の音について第2の音声キーが生成される。別の音がない場合、単一の完全な音声キーが生成される。次の仮名文字を考察する:ウォルマート。これらの仮名文字は2つの異なる音を有する。具体的には、「ウォ」は2つの音、すなわち「wo」および「uo」を有する。第1の音について第1の完全な音声キー「worumato」が生成され、第2の音について第2の完全な音声キー「uorumato」が生成される。
第1の“完全な音声キー”が生成された後、112で、第1の“母音が置換された”音声キー(置換母音音声キー)が生成される。第1の完全な音声キー内の全ての母音を、下線記号などの非日本語特別文字に置換することによって、第1の置換母音音声キーが生成される。たとえば、「worumato」には母音「o」、「u」、「a」、および「o」がある。したがって、第1の完全な音声キー「worumato」から生成できる第1の置換母音音声キーは「w_r_m_t_」である。同様に、第2の完全な音声キーがある場合、114で、第2の完全な音声キー内の母音を下線記号に置換することによって、第2の“母音が置換された”音声キー(置換母音音声キー)を生成できる。しかし、第1の完全な音声キー、または第2の完全な音声キーが第1の母音で始まる場合、第1の完全な音声キー、または第2の完全な音声キー内の第1の母音は保持される。たとえば、第2の完全な音声キー「uorumato」には、同じ順序で母音「u」、「o」、「u」、「a」、および「o」がある。第1の、すなわち最初の母音は、最初の「u」である。したがって、第2の置換母音音声キーは「u_ r_ m_ t」である。
116で、第1の完全な音声キーを使用して、第1の無母音音声キーが生成される。第1の無母音音声キーは、第1の完全な音声キー内の母音を削除することによって生成される。たとえば、第1の完全な音声キー「worumato」には、母音「o」、「u」、「a」、および「o」がある。したがって、生成される第1の無母音音声キーは「wrmt」である。同様に、第2の完全な音声キーがある場合、118で、第2の完全な音声キー内の母音を削除することによって第2の無母音音声キーを生成できる。第1の完全な音声キー、または第2の完全な音声キーが第1の母音で始まる場合、第1の完全な音声キー、または第2の完全な音声キー内の第1母音は削除されない。たとえば、第2の完全な音声キー「uorumato」には、母音「u」、「o」、「u」、「a」、および「o」があり、第1の、すなわち最初の母音は「u」である。したがって、生成される第2の無母音音声キーは「urmt」である。
第1の完全な音声キー、第1の置換母音音声キー、および第1の無母音音声キーを、いくつかのアプリケーションで使用できる。一実施形態では、120でデータベースに問い合わせるために、単一の音声キー(完全な音声キー、置換母音音声キー、または無母音音声キー)、あるいはこれらの音声キーの組合せが使用される。別の音が存在する場合、データベースに問い合わせるために、第2の完全な音声キー、第2の置換母音音声キー、および第2の無母音音声キーが生成され使用される。
図2A〜2Dは、英語で定義される音節仮名文字のリストを示している。ひらがなおよびカタカナ文字の両方が示されている。左側の文字がひらがな文字で、右側の文字がカタカナ文字である。たとえば、図2Aで、「か」は英語で「ka」と定義されるひらがな文字であり、「カ」は英語でやはり「ka」と定義されるカタカナ文字である。複数の仮名文字が、英語で定義できる単一の音節を形成できる。たとえば、図2Bで、「にぁ」は英語で「nya」と定義されるひらがな文字であり、「ニァ」は英語で「nya」と定義されるカタカナ文字である。図2Cで、「ぴゃ」は英語で「pya」と定義されるひらがな文字であり、「ピャ」は英語で「pya」と定義されるカタカナ文字である。図2Dで、「てょ」は英語で「to」と定義されるひらがな文字であり、「テョ」は英語で「to」と定義されるカタカナ文字である。この表リストはデータベースで提供できる。このリストは網羅的なものではなく、好みに応じて、および仮名言語の変化に対応するために、編集またはアップデートできる。
図3A〜3Cは、例として、仮名文字から生成される音声キーの例示的なリストを示している。これらの音声キーは、図1を参照して説明した手順に基づいて生成される。一例として、仮名(ひらがな)文字「しんばし」を考察する。仮名規則セットを適用することによって、「ん」は「*」に変換される。その後、図2A〜2Dに示されるリストを参照することによって、「しばし」の音を英語で定義できる。「し」は「si」のように発音し、「ば」は「ba」のように発音する。したがって、仮名文字「しんばし」は「si*basi」と定義される。定義された仮名文字は、隣接する母音、あるいは「ei」または「ou」の母音の組合せを含まない。したがって、完全な音声キーは「si*basi」である。置換母音音声キーは「s_*b_s_」であり、無母音音声キーは「s*bs」である。これらは第1音声キーのみである。「しんばし」における文字のいずれにも別の音がないので、この例について第2音声キーは生成されない。
他の例では、仮名文字「いっこく」を考察する。仮名規則セットを適用することによって、「っ」は「^」に変換される。文字「い」は「i」のように発音し、「こ」は「ko」のように発音し、「く」は「ku」のように発音する。したがって、仮名文字「いっこく」は「i^koku」と定義される。したがって、完全な音声キーは「i^koku」であり、置換母音音声キーは「i^k_k_」であり、無母音音声キーは「i^kk」である。
他の例として、仮名(カタカナ)文字「ウィスキー」を考察する。最後の文字「ー」は長音文字である。この長音文字は、前述した規則セットのうちの1つの規則に従って省略される。次いで、図2A〜2Dを参照することによって、仮名文字「ウィスキ」を英語で定義できる。「ウィ」は2つの音、すなわち「ui」および「wi」を有する。「ス」は「su」のように発音し、「キ」は「ki」のように発音する。したがって仮名文字「ウィスキ」は「uisuki」と定義される。隣接する同じ母音、あるいは「ei」または「ou」の母音の組合せがないので、第1の完全な音声キーは「uisuki」である。第1の置換母音音声キーは「u_s_k_」であり、第1の無母音音声キーは「usk」である。同様に、第2の完全な音声キーは「wisuki」であり、第2の置換母音音声キーは「w_s_k_」であり、第2の無母音音声キーは「wsk」である。図3A〜図3C内の他のキーも同様に生成される。
音声キーは様々な方法および環境で使用できる。図4に示される一実施形態400によれば、音声キーは、データベース内の関連する仮名単語を見つけるために使用できる。ユーザによって提供された仮名文字について、402で、図1で説明した方法に従って完全な音声キー、置換母音音声キー、および無母音音声キーが生成される。一実施形態では、404で、音声キーを所望の、または指定の長さに切り詰めることができる。この長さはシステム構成でよい。たとえば、音声キーの長さが6文字以下と指定される場合、生成された完全な音声キー、置換母音音声キー、および無母音音声キーが有する文字が6文字よりも多い場合は404で切り詰められる。
406で、データベース内の仮名レコードが処理されて、関連する仮名レコードが決定される。仮名レコードは、仮名単語、または仮名におけるあらゆるデータを含む。処理の一部として、データベース内の仮名レコードの音声キーが、完全な音声キー、置換母音音声キー、および無母音音声キーと比較される。次いで、関連する仮名レコードが、完全な音声キー、置換母音音声キー、および無母音音声キーのいずれかと同じ音声キーを有する単語として決定される。図1で説明した手順を使用して(すなわち、規則セットを適用して、英語で定義して、完全な音声キー、置換母音音声キー、および無母音音声キーを生成することによって)、データベース内の仮名レコードの音声キーを決定して、データベース内に格納することができる。次いで、408で、関連する仮名レコードがユーザに提示される。
406で、ユーザが入力した仮名文字とデータベースレコードとの間に必要な類似レベルに基づいて、完全な音声キー、置換母音音声キー、および無母音音声キーを選択的に使用できる。たとえば、最も近い一致、または完全な一致が必要な場合、完全な音声キーを使用して、データベースからレコードを取り出すことができる。類似する一致を見つけることが必要な場合、置換母音音声キーを使用でき、それによりデータベースから取得するレコードの数が増加する。無母音音声キーを使用すれば、さらに低いレベルの類似する一致を取得でき、それによりデータベースから取得するレコードの数がさらに増加する。
処理の一部として、複数のキーを使用して、関連する結果を効率的に見つけることができる。たとえば、データベースからレコードを取り出すために、最初に完全な音声キーを使用できる。結果が満足のいくものであれば、置換母音音声キー、および無母音音声キーでの検索処理を停止できる。完全な音声キーを使用することによってよい結果が返ってこない、または取得されるレコードがない場合は、置換母音音声キーを使用して一致基準を拡大し、より多くの類似する一致を得ることができる。結果が依然として満足のいくものではない場合、無母音音声キーを使用して類似性のより低い一致を見つけることができる。
一例を挙げると、ユーザは音声キーの長さを指定せずに仮名単語「キョウト」を入力できる。その後、完全な音声キー「kyoto」、置換母音音声キー「ky_t_」、および無母音音声キー「kyt」が生成される。データベース内を検索する際に、ほぼ完全な一致見つけるために、完全な音声キー「kyoto」が使用される。完全な音声キーを使用すれば、スペルは異なっていても、同じ音を有する仮名単語またはデータを見つけることができる。たとえば、仮名単語「キョート」は、仮名単語「キョウト」(ユーザによって提供された)とスペルは異なるが、同じ音を有する(Kyotoのように発音する)。仮名単語「キョート」の完全な音声キーは「kyoto」であり、仮名単語「キョウト」(ユーザによって提供された)の完全な音声キーと同じである。したがって、完全な音声キー「kyoto」を使用して、「キョート」を関連する仮名単語またはレコードとして決定できる。
置換母音音声キー「ky_t_」は、類似する音を有する仮名単語またはデータを見つけるために使用できる。たとえば、仮名単語「キョウト」(「kyoto」のように発音する)、「キョート」(「kyoto」のように発音する)、および「キュート」(「cute」のように発音する)は、同じ置換母音キー「ky_t_」を有する。したがって、置換母音音声キー「ky_t_」を使用して、「キョート」および「キュート」を関連する仮名単語として決定できる。
無母音音声キー「kyt」は、より低い類似度で仮名単語またはデータを見つけるための検索を拡大するために使用できる。仮名単語「キョウト」(「kyoto」のように発音する)、「キョート」(「kyoto」のように発音する)、「キュート」(「cute」のように発音する)、および「コヨーテ」(「coyote」のように発音する)は、同じ無母音キー「kyt」を有する。したがって、無母音音声キー「kyt」を使用して、「キョウト」、「キョート」、「キュート」、および「コヨーテ」を関連する仮名単語として決定できる。
図5は、一実施形態による、日本語仮名言語を処理するためのシステム500を示している。システム500は、データベース502、入力装置504、プロセッサ506、音声キージェネレータ508、およびディスプレイ510などの提示装置を含む。データベース502は、日本語仮名言語での仮名レコードまたは何らかの仮名データを含む。データベース502は、仮名レコードに加えて、漢字または他の何らかの言語でのさらなるレコードまたはデータも含むことができる。さらなるレコードは、仮名レコードに関連付けられてよい。ユーザは、入力装置504を使用して仮名文字を入力する。入力装置504はキーボードでもよく、スピーチをテキストに変換する装置でもよい。プロセッサ506は、仮名文字が受け取られた後、音声キージェネレータ508で命令を実行する。次いで、仮名文字に仮名規則セット512が適用される。一実施形態では、仮名規則セット512はデータベース502に格納できる。図2A〜2Dに示された表リストもデータベース502に提供できる。このリストはアップデートおよびカスタマイズできる。リストは、音に基づいて仮名文字を英語で定義するために使用される。その後、完全な音声キー、置換母音音声キー、および無母音音声キーが生成される。
音声キーは、所望の、または指定の長さに切り詰めることができる。この長さはシステム500構成の一部でよい。次いで、プロセッサ506がデータベース502内のデータを処理して、関連する仮名単語を決定する。プロセッサ502は、音声キージェネレータ508を参照して、データベース502内のどの仮名レコードが、生成された音声キーと同じ音声キーを有するかを決定する。一実施形態では、データベース502内の仮名レコードの完全な音声キー、置換母音音声キー、無母音音声キーが生成されて、データベース502に格納される。格納された音声キーは、生成された音声キーと比較するために容易に使用できる。関連する仮名レコードは、生成された音声キーのうちの少なくとも1つと同じ音声キーを有する仮名単語を含む。次いで、関連する仮名レコードがディスプレイ510上でユーザに提示される。関連する仮名レコードに関連付けられるあらゆる追加データ(漢字または他の言語での)も、ディスプレイ510上でユーザに提示できる。プロセッサは、ユーザが入力した仮名文字とデータベース内の仮名レコードとの間で必要な類似レベルに基づいて、生成された音声キー(完全な音声キー、置換母音音声キー、無母音音声キー)のうちのいずれか、または組合せを選択的に使用できる。この類似レベルはシステム500において構成できる。
本発明のいくつかの実施形態は、1つまたは複数のソフトウェアコンポーネントとして書かれた上述の方法を含んでよい。これらのコンポーネント、およびそれぞれに関連付けられる機能は、クライアント、サーバ、分散コンピュータシステム、またはピアコンピュータシステムによって使用されうる。これらのコンポーネントは、関数型言語、宣言型言語、手続き型言語、オブジェクト指向言語、低水準言語などの、1つまたは複数のプログラミング言語に対応するコンピュータ言語で書くことができる。これらのコンポーネントは、様々なアプリケーションプログラミングインターフェースを介して他のコンポーネントにリンクし、次いでサーバまたはクライアントのための1つの完全なアプリケーションにコンパイルできる。あるいは、コンポーネントはサーバまたはクライアントアプリケーションに実装できる。さらに、これらのコンポーネントは様々な分散プログラミングプロトコルを介してリンクできる。本発明のいくつかの例示的実施形態は、分散プログラミング環境にわたって、これらのコンポーネントのうちの1つまたは複数を実装するために使用されている遠隔手続き呼出しを含むことができる。たとえば、論理レベルは、インターフェースレベル(たとえば、グラフィカルユーザインターフェース)を備える第2コンピュータシステムから遠隔に設置された第1コンピュータシステム上に存在できる。これらの第1および第2コンピュータシステムは、サーバ-クライアント、ピアツーピア、または他の何らかの構成において構成できる。クライアントは、モバイルおよびハンドヘルド装置から、シンクライアントおよびシッククライアント、または他のサーバまで、複雑さの点で異なってよい。
上記で説明したソフトウェアコンポーネントは、コンピュータ可読記憶メディア内に命令として有形に格納される。「コンピュータ可読記憶メディア」という用語は、1つまたは複数の命令のセットを格納する単一のメディアまたは複数のメディアを含むものと見なされるべきである。「コンピュータ可読記憶メディア」という用語は、本明細書で説明、提示または図示したあらゆる方法または処理ステップを実行させることになるコンピュータシステムの実行命令セットを物理的に格納、符号化、あるいは搬送するために、一連の物理的変化を受けることができるあらゆる物理的な物を含むものと見なされるべきである。コンピュータ可読記憶メディアの例には、これに限定されないが、ハードディスク、フロッピー(登録商標)ディスク、および磁気テープなどの磁気メディア、CD-ROM、DVD、およびホログラフィック装置などの光メディア、光磁気メディア、ならびに、特定用途向け集積回路(「ASIC」)、プログラム可能論理装置(「PLD」)、およびROM、RAM装置などの、格納および実行するように特に構成されたハードウェア装置がある。コンピュータ可読命令の例には、たとえばコンパイラによって生成された機械コード、およびインタープリタを使用してコンピュータによって実行されるファイルを含むより高レベルのコードがある。たとえば、本発明の実施形態は、Java(登録商標)、C++、または他のオブジェクト指向プログラミング言語および開発ツールを使用して実装できる。本発明の他の実施形態は、機械可読ソフトウェア命令の代わりに、または機械可読ソフトウェア命令とともに、ハードワイヤード回路に実装できる。
図6は、例示的コンピュータシステム600のブロック図である。コンピュータシステム600は、前述の本発明の方法を実行するためにコンピュータ可読記憶メディア655に格納されたソフトウェア命令またはコードを実行するプロセッサ605を含む。コンピュータシステム600は、コンピュータ可読記憶メディア655から命令を読み取って、その命令を記憶装置610またはランダムアクセスメモリ(RAM)615に格納するためのメディアリーダー640を含む。記憶装置610は静的データを維持するための広いスペースを提供し、後で実行するために少なくともいくつかの命令を格納できる。格納された命令は、命令の他の表現を生成して、RAM615に動的に格納するためにさらにコンパイルされうる。プロセッサ605は、RAM615から命令を読み取って、命令通りに動作を実行する。本発明の一実施形態によれば、コンピュータシステム600は、実行の結果のうちの少なくともいくつかを提供するための出力装置625(たとえば、ディスプレイ)であって、出力が、これに限定されないが、ユーザへの視覚情報を含む出力装置と、ユーザまたは他の装置にデータを入力するための、および/またはコンピュータシステム600と対話するための手段を提供するための入力装置630とをさらに含む。これらの出力装置625および入力装置630のそれぞれは、1つまたは複数の追加の周辺装置によって結合して、コンピュータシステム600の機能をさらに拡大できる。コンピュータシステム600をネットワーク650に接続し、次に他のクライアント、サーバ、データストア、およびインターフェースなどを含むネットワーク650に接続された他の装置に接続するために、ネットワークコミュニケータ635が提供されうる。コンピュータシステム600のモジュールは、バス645を介して相互接続されている。コンピュータシステム600は、データソース660にアクセスするためのデータソースインターフェース620を含む。ハードウェアまたはソフトウェアに実装された1つまたは複数の抽象化層を介してデータソース660にアクセスできる。たとえば、データソース660はネットワーク650によってアクセスできる。いくつかの実施形態では、データソース660は意味層などの抽象化層を介してアクセスできる。
データソースは情報リソースである。データソースは、データ記憶および検索ができるデータのソースを含む。データソースは、関係型データベース、トランザクションのデータベース、階層型データベース、多次元データベース(たとえば、OLAP)、オブジェクト指向データベースなどのデータベースを含むことができる。さらなるデータソースは、表データ(たとえば、表計算、区切りテキストファイル)、マークアップ言語でタグ付けされたデータ(たとえば、XMLデータ)、トランザクションのデータ、非構造化データ(たとえば、テキストファイル、スクリーンスクレイピング)、階層型データ(たとえば、ファイルシステム内のデータ、XMLデータ)、ファイル、複数のレポート、および、基本的なソフトウェアシステム(たとえば、ERPシステム)によって生成されたオープン・データベース・コネクティビティ(ODBC)などの、確立されたプロトコルを通じてアクセスできる他の何らかのデータソースなどを含む。データソースは、データが有形に格納されない、あるいは短命である、データストリーム、ブロードキャストデータなどのデータソースも含むことができる。これらのデータソースは、関連するデータ基礎、意味層、管理システム、セキュリティシステムなどを含むことができる。
上記の説明において、本発明の実施形態の完全な理解を提供するために、多数の具体的詳細を説明した。しかし、関連分野の当業者は、具体的詳細のうちの1つまたは複数がなくても、あるいは他の方法、コンポーネント、技術などを使用しても、本発明を実施できることが理解できるであろう。本発明の態様を不明瞭にしないように、他の例では、よく知られている操作または構造は、図示または詳細に説明されていない。
本明細書で図示および説明した処理は一連のステップを含むが、本発明の異なる実施形態は図示されたステップの順序によって限定されず、いくつかのステップは異なる順序で発生する場合があり、いくつかのステップは、本明細書で図示および説明したステップとは別の他のステップと同時であることが理解されよう。さらに、本発明による方法を実装するために、図示したステップの全てが必ずしも必要なわけではない。さらに、本明細書で図示および説明した装置およびシステムと同様、図示されていない他のシステムとともに処理を実装できることが理解されよう。
要約に記載されるものを含む、本発明の実施形態の上記の記述および説明は、網羅的であること、または開示した正確な形式に本発明を限定することを意図するものではない。例示のために、本明細書で本発明の特定の実施形態および例を説明したが、関連分野の当業者なら理解できるように、本発明の範囲内で様々な同等の修正が可能である。上記の詳細な説明を踏まえて、本発明にこれらの修正を行うことができる。むしろ、請求項の解釈の確立された原則にしたがって解釈されるべき、以下の特許請求の範囲によって本発明の範囲が決定されるべきである。
500 システム
502 データベース
504 入力装置
506 プロセッサ
508 音声キージェネレータ
510 ディスプレイ
512 規則セット
600 コンピュータシステム
605 プロセッサ
610 記憶装置
615 ランダムアクセスメモリ(RAM)
620 データソースインターフェース
625 出力装置
630 入力装置
635 ネットワークコミュニケータ
640 メディアリーダー
645 バス
650 ネットワーク
655 コンピュータ可読記憶メディア
660 データソース

Claims (36)

  1. コンピュータによって実行されると、前記コンピュータに、
    ユーザから少なくとも1つの仮名文字を受け取るステップと、
    前記少なくとも1つの仮名文字に仮名規則セットを適用するステップと、
    前記少なくとも1つの仮名文字を、前記少なくとも1つの仮名文字の音に基づいてアルファベット言語で定義するステップと、
    前記定義された少なくとも1つの仮名文字について完全な音声キーを生成するステップと、
    前記完全な音声キー内の母音を置換することによって、置換母音音声キーを生成するステップと、
    前記完全な音声キー内の前記母音を削除することによって無母音音声キーを生成するステップと、
    前記完全な音声キー、前記置換母音音声キー、および前記無母音音声キーのうちの少なくとも1つと同じ音声キーを有する関連する仮名レコードを決定するためにデータベース内の仮名レコードを処理するステップと、
    前記関連する仮名レコードを前記ユーザに提示するステップと
    を行わせる命令を有形に格納するコンピュータ可読記憶メディア。
  2. 前記コンピュータによって実行されると、前記コンピュータに、
    前記完全な音声キー、前記置換母音音声キー、前記無母音音声キー、またはそれらの組合せを指定の長さに切り詰めるステップをさらに行わせる命令をさらに備える、請求項1に記載のコンピュータ可読記憶メディア
  3. 前記完全な音声キーを生成するステップが、第1の完全な音声キーを生成するステップと、別の音が存在する場合は、第2の完全な音声キーを生成するステップとを備え、
    前記置換母音音声キーを生成するステップが、前記第1の完全な音声キー内の母音を置換することによって第1の置換母音音声キーを生成するステップと、別の音が存在する場合は、前記第2の完全な音声キー内の母音を置換することによって第2の置換母音音声キーを生成するステップとを備え、
    前記無母音音声キーを生成するステップが、前記第1の完全な音声キー内の前記母音を削除することによって第1の無母音音声キーを生成するステップと、別の音が存在する場合は、前記第2の完全な音声キー内の前記母音を削除することによって第2の無母音キーを生成するステップとを備える、請求項1に記載のコンピュータ可読記憶メディア
  4. 前記仮名規則セットが、
    前記少なくとも1つの仮名文字が句読点を含む場合、前記句読点を省略することと、
    前記少なくとも1つの仮名文字がスペースを含む場合、前記スペースを省略することと、
    前記少なくとも1つの仮名文字が「v」の音を表す特別な文字の組合せを含む場合、前記特別な文字の組合せを1つの文字として認識することと、
    前記少なくとも1つの仮名文字が長音文字を含む場合、前記長音文字を省略することとを備える、請求項1に記載のコンピュータ可読記憶メディア
  5. 前記仮名規則セットが、
    前記少なくとも1つの仮名文字が2つ以上の隣接する同じ小型母音文字を含む場合、前記小型母音文字のうちの1つだけを保持することと、
    前記少なくとも1つの仮名文字が第1の小型文字に続いて第2の小型文字を含む場合、前記第2の小型文字を大型文字に変換することと、
    前記少なくとも1つの仮名文字が大型文字に続いて連続する同じ文字の小型文字を含む場合、前記小型文字を省略することを備える、請求項1に記載のコンピュータ可読記憶メディア
  6. 前記仮名規則セットが、
    前記少なくとも1つの仮名文字が「っ」の文字を含む場合、前記「っ」の文字を第1の非日本語特別文字または記号に変換することと、
    前記少なくとも1つの仮名文字がモーラ鼻音文字を含む場合、前記モーラ鼻音文字を第2の非日本語特別文字または記号に変換することとを備える、請求項1に記載のコンピュータ可読記憶メディア
  7. 前記完全な音声キーを生成するステップが、
    前記定義された少なくとも1つの仮名文字が2つ以上の同じ隣接する母音を含む場合、前記母音のうちの1つだけを保持するステップを備える、請求項1に記載のコンピュータ可読記憶メディア
  8. 前記完全な音声キーを生成するステップが、
    前記定義された少なくとも1つの仮名文字が第1の母音の組合せ「ei」を含む場合、母音「e」だけを保持するステップと、
    前記定義された少なくとも1つの仮名文字が第2の母音の組合せ「ou」を含む場合、母音「o」だけを保持するステップとを備える、請求項1に記載のコンピュータ可読記憶メディア
  9. 前記置換母音音声キーを生成するステップが、
    前記完全な音声キーが第1の母音で始まる場合は前記第1の母音を除いて、前記完全な音声キー内の全ての母音を非日本語特別文字に置換するステップを備える、請求項1に記載のコンピュータ可読記憶メディア
  10. 前記非日本語特別文字が下線記号である、請求項9に記載のコンピュータ可読記憶メディア
  11. 前記無母音音声キーを生成するステップが、
    前記完全な音声キーが第1の母音で始まる場合は前記第1の母音を除いて、前記完全な音声キー内の全ての母音を削除するステップを備える、請求項1に記載のコンピュータ可読記憶メディア
  12. 前記アルファベット言語が英語である、請求項1に記載のコンピュータ可読記憶メディア
  13. コンピュータ可読記憶メディアに格納された命令がコンピュータによって実行されると、前記コンピュータに以下の動作を行わせる日本語仮名のためのコンピュータ言語処理方法であって、
    ユーザから、少なくとも1つの仮名文字を入力装置から受け取るステップと、
    前記少なくとも1つの仮名文字に仮名規則セットを適用するステップであって、前記仮名規則セットがデータベース内にあるステップと、
    前記少なくとも1つの仮名文字を、前記少なくとも1つの仮名文字の音に基づいてアルファベット言語で定義するステップと、
    前記定義された少なくとも1つの仮名文字について完全な音声キーを生成するステップと、
    前記完全な音声キー内の母音を置換することによって、置換母音音声キーを生成するステップと、
    前記完全な音声キー内の前記母音を削除することによって無母音音声キーを生成するステップと、
    前記完全な音声キー、前記置換母音音声キー、および前記無母音音声キーのうちの少なくとも1つと同じ音声キーを有する関連する仮名レコードを決定するために前記データベース内の仮名レコードを処理するステップと、
    前記関連する仮名レコードを前記ユーザに提示するステップとを備える、方法。
  14. 前記完全な音声キー、前記置換母音音声キー、前記無母音音声キー、またはそれらの組合せを指定の長さに切り詰めるステップをさらに備える、請求項13に記載の方法。
  15. 前記完全な音声キーを生成するステップが、第1の完全な音声キーを生成するステップと、別の音が存在する場合は、第2の完全な音声キーを生成するステップとを備え、
    前記置換母音音声キーを生成するステップが、前記第1の完全な音声キー内の母音を置換することによって第1の置換母音音声キーを生成するステップと、別の音が存在する場合は、前記第2の完全な音声キー内の母音を置換することによって第2の置換母音キーを生成するステップとを備え、
    前記無母音音声キーを生成するステップが、前記第1の完全な音声キー内の前記母音を削除することによって第1の無母音音声キーを生成するステップと、別の音が存在する場合は、前記第2の完全な音声キー内の前記母音を削除することによって第2の無母音キーを生成するステップとを備える、請求項13に記載の方法。
  16. 前記仮名規則セットが、
    前記少なくとも1つの仮名文字が句読点を含む場合、前記句読点を省略することと、
    前記少なくとも1つの仮名文字がスペースを含む場合、前記スペースを省略することと、
    前記少なくとも1つの仮名文字が「v」の音を表す特別な文字の組合せを含む場合、前記特別な文字の組合せを1つの文字として認識することと、
    前記少なくとも1つの仮名文字が長音文字を含む場合、前記長音文字を省略することとを備える、請求項13に記載の方法。
  17. 前記仮名規則セットが、
    前記少なくとも1つの仮名文字が2つ以上の同じ隣接する小型母音文字を含む場合、前記小型母音文字のうちの1つだけを保持することと、
    前記少なくとも1つの仮名文字が第1の小型文字に続いて第2の小型文字を含む場合、前記第2の小型文字を大型文字に変換することと、
    前記少なくとも1つの仮名文字が大型文字に続いて連続する同じ文字の小型文字を含む場合、前記小型文字を省略することとを備える、請求項13に記載の方法。
  18. 前記仮名規則セットが、
    前記少なくとも1つの仮名文字が「っ」の文字を含む場合、前記「っ」の文字を第1の非日本語特別文字または記号に変換することと、
    前記少なくとも1つの仮名文字がモーラ鼻音文字を含む場合、前記モーラ鼻音文字を第2の非日本語特別文字または記号に変換することとを備える、請求項13に記載の方法。
  19. 前記完全な音声キーを生成するステップが、
    前記定義された少なくとも1つの仮名文字が2つ以上の隣接する同じ母音を含む場合、前記母音のうちの1つだけを保持するステップを備える、請求項13に記載の方法。
  20. 前記完全な音声キーを生成するステップが、
    前記定義された少なくとも1つの仮名文字が第1の母音の組合せ「ei」を含む場合、母音「e」だけを保持するステップと、
    前記定義された少なくとも1つの仮名文字が第2の母音の組合せ「ou」を含む場合、母音「o」だけを保持するステップとを備える、請求項13に記載の方法。
  21. 前記置換母音音声キーを生成するステップが、
    前記完全な音声キーが第1の母音で始まる場合は前記第1の母音を除いて、前記完全な音声キー内の全ての母音を非日本語特別文字に置換するステップを備える、請求項13に記載の方法。
  22. 前記非日本語特別文字が下線記号である、請求項21に記載の方法。
  23. 前記無母音音声キーを生成するステップが、
    前記完全な音声キーが第1の母音で始まる場合は前記第1の母音を除いて、前記完全な音声キー内の全ての母音を削除するステップを備える、請求項13に記載の方法。
  24. 前記アルファベット言語が英語である、請求項13に記載の方法。
  25. ユーザから少なくとも1つの仮名文字を受け取るステップと、
    前記少なくとも1つの仮名文字に仮名規則セットを適用するステップと、
    前記少なくとも1つの仮名文字を、前記少なくとも1つの仮名文字の音に基づいてアルファベット言語で定義するステップと、
    前記定義された少なくとも1つの仮名文字について完全な音声キーを生成するステップと、
    前記完全な音声キー内の母音を置換することによって、置換母音音声キーを生成するステップと、
    前記完全な音声キー内の前記母音を削除することによって無母音音声キーを生成するステップと、
    前記完全な音声キー、前記置換母音音声キー、および前記無母音音声キーのうちの少なくとも1つと同じ音声キーを有する関連する仮名レコードを決定するためにデータベース内の仮名レコードを処理するステップと、
    前記関連する仮名レコードを前記ユーザに提示するステップと
    を行うためのプログラムコードを格納するコンピュータメモリと、
    前記プログラムコードを実行するプロセッサとを備える、日本語仮名言語を処理するコンピュータシステム。
  26. 前記プロセッサが、
    前記完全な音声キー、前記置換母音音声キー、前記無母音音声キー、またはそれらの組合せを指定の長さに切り詰めるために、前記プログラムコードをさらに実行する、請求項25に記載のシステム。
  27. 前記完全な音声キーを生成するステップが、第1の完全な音声キーを生成するステップと、別の音が存在する場合は、第2の完全な音声キーを生成するステップとを備え、
    前記置換母音音声キーを生成するステップが、前記第1の完全な音声キー内の母音を置換することによって第1の置換母音音声キーを生成するステップと、別の音が存在する場合は、前記第2の完全な音声キー内の母音を置換することによって第2の置換母音キーを生成するステップとを備え、
    前記無母音音声キーを生成するステップが、前記第1の完全な音声キー内の前記母音を削除することによって第1の無母音音声キーを生成するステップと、別の音が存在する場合は、前記第2の完全な音声キー内の前記母音を削除することによって第2の無母音キーを生成するステップとを備える、請求項25に記載のシステム。
  28. 前記仮名規則セットが、
    前記少なくとも1つの仮名文字が句読点を含む場合、前記句読点を省略することと、
    前記少なくとも1つの仮名文字がスペースを含む場合、前記スペースを省略することと、
    前記少なくとも1つの仮名文字が「v」の音を表す特別な文字の組合せを含む場合、前記特別な文字の組合せを1つの文字として認識することと、
    前記少なくとも1つの仮名文字が長音文字を含む場合、前記長音文字を省略することとを備える、請求項25に記載のシステム。
  29. 前記仮名規則セットが、
    前記少なくとも1つの仮名文字が2つ以上の同じ隣接する小型母音文字を含む場合、前記小型母音文字のうちの1つだけを保持することと、
    前記少なくとも1つの仮名文字が第1の小型文字に続いて第2の小型文字を含む場合、前記第2の小型文字を大型文字に変換することと、
    前記少なくとも1つの仮名文字が大型文字に続いて連続する同じ文字の小型文字を含む場合、前記小型文字を省略することとを備える、請求項25に記載のシステム。
  30. 前記仮名規則セットが、
    前記少なくとも1つの仮名文字が「っ」の文字を含む場合、前記「っ」の文字を第1の非日本語特別文字または記号に変換することと、
    前記少なくとも1つの仮名文字がモーラ鼻音文字を含む場合、前記モーラ鼻音文字を第2の非日本語特別文字または記号に変換することとを備える、請求項25に記載のシステム。
  31. 前記完全な音声キーを生成するステップが、
    前記定義された少なくとも1つの仮名文字が2つ以上の隣接する同じ母音を含む場合、前記母音のうちの1つだけを保持するステップを備える、請求項25に記載のシステム。
  32. 前記完全な音声キーを生成するステップが、
    前記定義された少なくとも1つの仮名文字が第1の母音の組合せ「ei」を含む場合、母音「e」だけを保持するステップと、
    前記定義された少なくとも1つの仮名文字が第2の母音の組合せ「ou」を含む場合、母音「o」だけを保持するステップとを備える、請求項25に記載のシステム。
  33. 前記置換母音音声キーを生成するステップが、
    前記完全な音声キーが第1の母音で始まる場合は前記第1の母音を除いて、前記完全な音声キー内の全ての母音を非日本語特別文字に置換するステップを備える、請求項25に記載のシステム。
  34. 前記非日本語特別文字が下線記号である、請求項33に記載のシステム。
  35. 前記無母音音声キーを生成するステップが、
    前記完全な音声キーが第1の母音で始まる場合は前記第1の母音を除いて、前記完全な音声キー内の全ての母音を削除するステップを備える、請求項25に記載のシステム。
  36. 前記アルファベット言語が英語である、請求項25に記載のシステム。
JP2011145643A 2010-06-30 2011-06-30 日本語のための音声キー Active JP5851130B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/826,697 2010-06-30
US12/826,697 US8315851B2 (en) 2010-06-30 2010-06-30 Phonetic keys for the Japanese language

Publications (2)

Publication Number Publication Date
JP2012014699A JP2012014699A (ja) 2012-01-19
JP5851130B2 true JP5851130B2 (ja) 2016-02-03

Family

ID=45400336

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011145643A Active JP5851130B2 (ja) 2010-06-30 2011-06-30 日本語のための音声キー

Country Status (2)

Country Link
US (1) US8315851B2 (ja)
JP (1) JP5851130B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7110742B2 (ja) * 2018-06-12 2022-08-02 日本電信電話株式会社 書籍検索インタフェース装置、書籍検索方法、およびプログラム
US11250221B2 (en) 2019-03-14 2022-02-15 Sap Se Learning system for contextual interpretation of Japanese words
US11509738B2 (en) * 2019-07-18 2022-11-22 Dell Products L.P. System for migration of data from legacy computer system using wireless peer-to-peer connection

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1261167A (en) 1917-10-25 1918-04-02 Robert C Russell Index.
JPS55128146U (ja) * 1979-02-28 1980-09-10
US4484305A (en) * 1981-12-14 1984-11-20 Paul Ho Phonetic multilingual word processor
US4951202A (en) 1986-05-19 1990-08-21 Yan Miin J Oriental language processing system
JPH08166964A (ja) * 1994-12-14 1996-06-25 Nippon Telegr & Teleph Corp <Ntt> 長音読み照合方法
JPH1115584A (ja) * 1997-06-25 1999-01-22 Chubu Nippon Denki Software Kk キーボードによる文字入力方式および電子機器
JPH11250063A (ja) * 1998-02-27 1999-09-17 Toshiba Corp 検索装置及び検索方法
US7328211B2 (en) * 2000-09-21 2008-02-05 Jpmorgan Chase Bank, N.A. System and methods for improved linguistic pattern matching
US20030088398A1 (en) * 2001-11-08 2003-05-08 Jin Guo User interface of a keypad entry system for korean text input
WO2003102808A1 (en) * 2002-06-04 2003-12-11 The Oasis Group, Ltd. Remotely invoked metaphonic database searching capability
EP1515524A4 (en) * 2002-06-14 2008-09-24 Mitoku Yamane ELECTRONIC DEVICE
JP3677016B2 (ja) * 2002-10-21 2005-07-27 富士ゼロックス株式会社 外国語電子辞書検索装置
US7523102B2 (en) 2004-06-12 2009-04-21 Getty Images, Inc. Content search in complex language, such as Japanese
US20060106769A1 (en) * 2004-11-12 2006-05-18 Gibbs Kevin A Method and system for autocompletion for languages having ideographs and phonetic characters
JP2008059389A (ja) * 2006-08-31 2008-03-13 Mizuho Information & Research Institute Inc 語彙候補出力システム、語彙候補出力方法及び語彙候補出力プログラム
EP1975807B1 (en) * 2007-03-30 2011-08-17 Research In Motion Limited Use of a suffix-removing spell check algorithm for a spell check function, and associated handheld electronic device
JP2009048348A (ja) * 2007-08-17 2009-03-05 Sony Corp 情報処理装置、文字情報の候補の検索方法および文字情報の候補の検索プログラム
JP4900158B2 (ja) * 2007-09-25 2012-03-21 富士通株式会社 検索システム、方法およびプログラム
US20110102206A1 (en) * 2009-10-29 2011-05-05 Kun Shan University Keyboard arrangement for a phonetic symbol inputting method for chinese characters

Also Published As

Publication number Publication date
JP2012014699A (ja) 2012-01-19
US8315851B2 (en) 2012-11-20
US20120004901A1 (en) 2012-01-05

Similar Documents

Publication Publication Date Title
JP6678764B1 (ja) 多言語での自動化されたアシスタントを用いたエンドツーエンドコミュニケーションの促進
US8731901B2 (en) Context aware back-transliteration and translation of names and common phrases using web resources
US9471566B1 (en) Method and apparatus for converting phonetic language input to written language output
US20080052262A1 (en) Method for personalized named entity recognition
JP2001519043A (ja) コンテキスト・フリー・グラマーを使用するテキスト正規化
JP2003015803A (ja) 小型キーパッド用日本語入力メカニズム
US10235363B2 (en) Instant translation of user interfaces of a web application
Rathod et al. Hindi and Marathi to English machine transliteration using SVM
Satapathy et al. A review of shorthand systems: From brachygraphy to microtext and beyond
US20090307183A1 (en) System and Method for Transmission of Communications by Unique Definition Identifiers
JP2009140466A (ja) 使用者製作問答データに基づいた会話辞書サービスの提供方法及びシステム
JP2006331329A (ja) 言語処理装置、言語処理方法、言語処理プログラム及び記録媒体
Prabhakar et al. Machine transliteration and transliterated text retrieval: a survey
US10120843B2 (en) Generation of parsable data for deep parsing
Liberman et al. Human language technology
JP5851130B2 (ja) 日本語のための音声キー
JP4845523B2 (ja) 文字処理装置、方法、プログラムおよび記録媒体
JP6619932B2 (ja) 形態素解析装置およびプログラム
JP3691773B2 (ja) 文章解析方法とその方法を利用可能な文章解析装置
RU2610585C2 (ru) Способ и система для модификации текста в документе
Karanikolas et al. Towards a unified exploitation of electronic dialectal corpora: Problems and perspectives
Allauzen et al. Voice query refinement
Chandra An intelligent natural language query processor for a relational database
JP5337575B2 (ja) 候補語抽出装置、候補語抽出方法及び候補語抽出プログラム
JP2004118461A (ja) 言語モデルのトレーニング方法、かな漢字変換方法、言語モデルのトレーニング装置、かな漢字変換装置、コンピュータプログラムおよびコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140604

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150522

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150713

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151013

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151102

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151202

R150 Certificate of patent or registration of utility model

Ref document number: 5851130

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250