TW409237B - Chinese approximate pronunciation searching method - Google Patents
Chinese approximate pronunciation searching method Download PDFInfo
- Publication number
- TW409237B TW409237B TW88109296A TW88109296A TW409237B TW 409237 B TW409237 B TW 409237B TW 88109296 A TW88109296 A TW 88109296A TW 88109296 A TW88109296 A TW 88109296A TW 409237 B TW409237 B TW 409237B
- Authority
- TW
- Taiwan
- Prior art keywords
- phonetic
- pinyin
- approximate
- vocabulary
- sequence
- Prior art date
Links
Landscapes
- Document Processing Apparatus (AREA)
Description
409237 五、發明說明(1) 本發明係提供一種近似語音搜尋方法,尤指一種可利 用近似s吾音來搜尋詞彙之近似語音搜尋方法。 當使用者利用注音符號或羅馬拼音來輸入一中文詞彙 晴,如果使用者所輸入的語音拼音不正確時,就無法輸入 该中文詞彙。例如,使用者可能會混淆zh(史)、ch( 4 )、 (尸)、z(卩)、c(亏)、s(厶),而將詞彙广造成」的拼 會序列「卩幺\彳厶〆」輸入為「虫幺\方厶/」’而無 法輸入詞彙「造成」° 因此,本發明之主要目的在於提供一種近似語音搜尋 方法,其可利用近似語音來搜尋儲存在電腦的詞彙’即使 夜用耆所輸入的拼音序列不正確,本發明近似語音搜尋方 .玄會將使用者所欲輸入的所有可能詞彙找出’供使用者選 擇以輸入該詞彙。 圖亦之簡單說明 滅〆為一用來執行本發明近似語音搜尋方法的電腦之示意 圖 圖。 —么太發明近似語音搜尋方法之流程圖。
流程圖 @四為本發明近似語音搜尋方法之一實施例。 ^及為本發明近似語音搜尋方法之另一實施例。 圖五 五、發明說明(2) 14記憶體 18顯示器 2 2詞彙表 26詞索 32 近似語音字母集 圖示之符號說明 12 電腦 1 6處理器 20 輸入裝置 2 4詞彙語音表 30近似語音字母表 34有效語音拼音表 μ有效語音拼音 本發明是提供一種近似語音搜尋方法,其可利用—近 似語音來搜尋一儲存於一電腦的詞彙。請參考圖—。圖^ 為一用來執行本發明近似語音搜尋方法丨〇的電腦丨2之示音 圖。電腦12包含有一記憶體14用來儲存程式與資料,—處 理器1 6用來執行記憶體1 4内的程式’一顯示器1 8電連接於 處理器1G,用來顯示一影像晝面’以及一輸入裝置2〇電連 接於處理器1 6,用來供一使用者輸入文字或語音字母。記 憶體14内存有一詞彙表22,一詞彙語音表24,一近似語音 字母表3 〇 ’以及一有效語音拼音表3 4。詞彙表2 2内存有複 數個詞彙2 6,每一詞彙2 6是複數個文字所組成的文字序 列。詞素語音表2 4内含有詞彙表2 2内每一詞彙2 6相對應的 轿音序列2 8 ’每一詞彙2 6的拚音序列2 8依序含有詞彙2 6的 各個文字的語音拼音,而每一文字的語音拼音包含有複數 個依排列的語音字母。近似語音字母表30内含有複數個近 似語音字母集3 2。每一近似語音字母集3 2内含有至少一個 _jd092S7 __ 五、發明說明(3) 語音字母,每一近似語音字母集32内的所有語音 音均近似。例如’zh(虫)、ch( -<)、sh(尸)、z( C(亏)、S(厶)是屬於同一個近似語音字母集32。 拼音表34包含複數個有效語音拼音36,每一個有 音36可對應於詞彙表22中的广或多個詞彙26。 其中’每一中文文字的s吾音拼音所使用的語 為注音符號字母或羅馬拼音字母。 字母的發卩)、 有效語音 效語音拼 音字母可 。#參考圖二。圖二為本發明近似語音搜尋 程圖。近似語音搜尋方法10包含有下列步驟: 步驟4〇 :使用者利用輸入裝置20來輸入一預定 或是輸入一預定詞彙,並將該預定詞 預定拼音序列; ,闬近似語音字母表3〇來產生複數個 序列的近似拼音序列,其中每一 各個語音拼音的各個語音 的各個相對應的注立想立=了 /、该預 母均屬於同一:::;音的各個相對 近似f4及詞囊表以來找出 汗:序列相對應的詞彙2 丁$18上以供該使用者 步驟42 步驟4 4 法1 0之流 音序列, 轉換成一 預定拼音 音序列的 掛音序列 的語音字 該複數個 顯示於.顯 請參考圖三 圖二為產生圖
列的複數
_— 4092g7 五、發明說明(4) - --—---一· 個近似拼音序列之法敍阁 止M。Λ L紅圖。其包含有下列步驟: 步驟7 〇 :利用近似古五立玄± . 现似ffcr a予母表3 0來產生該預定拼音 各個語音拼音的所有近似語音拼音,其中 似語音拼音的各個語音字母與該預定拼音 相對應的語音拼音的各個相對應的語音字 於同一近似語音字母集32 ; 步驟72 :利用有.效語音拼音表以來找出該預定拼音 各個語音拼音的所有近似語音拼音中的有 拼音以產生該預定拼音序列的各個語音拼 有有效的近似語音拼音; 步驟7 4 .利用該預定拼音序列的各個語音拼音的所 的近似語音拼音來做排列組合產生該預定 列的所有近似排音序列。 「舉例而言,當使用者使用.注音符號想要輸入— 「城市」,卻錯誤地將其拼音序列輸入為「今厶/ 而無法產生正確的詞彙「城市」時,近似語音搜尋 會利用近似語音字母表3〇來產生拼音序列「今 白各個語音拼音的所有近似語音拼音◊例如,與語 /「今」屬於同一個近似語音字母集32的語音字母 彳、尸、卩、厶」。再利用有效語音拼音表3 4來產 序列「今厶/尸、」的各個語音拼音的所有有效的 音拼音。例如,「今厶/」有效的近似語音拼音有 〆」、虫人」、「厶卜」、「卩厶裳莖。 序列的 每一近 序列的 母均屬 序列的 效語音 音的所 有有效 拼音序 詞彙 尸、」 方法10 尸、J 音字母 「虫、 生軿音 近似言吾 「彳厶 接箸’ Λ〇9237 五、發明說明(5) _ 再利用對拼音;^ Sil 序列的「亏厶/尸、」各個語音拼立w邮女 有效的近似组立相 曰妍θ的所有 曰拼音進行排列組合以產生拼音序 「 /尸、」的所右w ^ yj ^ L~ 「 有近似拼音序列。例如,近似拼音序列可為 、 ,二)Λ ' 「"PAP」、「“ / 尸 )ί二等等。最後,再利用詞彙語音表24及詞彙表22爽蔣 戶,似拼音序列所對應的詞彙26顯示在顯示器丨8上。例 : 绅士」、「身世」、「沈思」、「增資」、「城 ^ 耘式」..·等等。因此,使用者可以選擇並且輸入 祠彙「城市」。 一 請參考圖四。圖四為本發明近似語音搜尋方法丨〇之一 實施例。當使用者使用注音符號想要輸入一詞彙「里約熱 内盧」,但是卻只知道「里」與「熱」的發音時,使用者 可以輪入拼音序列「灼一 v * g亡\ *」。近似語音搜尋方 法1 0會利用近似語音字母表3 〇來產生拼音序列「力一 v * θ亡\ *」的第一及第三個語音拼音的所有近似語音拼 音。再利用有效語音拼音表34來產生拼音序列「力一 ν* 0亡\*」的第一及第三個語音拼音的所有有效的近似語 曰拼音。接著,再利用對拼音序列的r力一 ν *日亡Ν *」 的第—及第三語音拼音的所有有效的近似語音拼音進行排 =組合以產生拼音序列「为一 v * Q古、*」的所有近似拼 曰序列。最後,再利用詞彙語音表24及詞彙表22來將所有 近似拼音序列所對應的詞彙2 6顯示在顯示器1 8上。因此, 使同者可以選擇並且輸入詞彙「里約熱内盧」。 五、發明說明(6) 40923^
〇 請參考圖五。圖五為本發明近似語音搜尋方法〗〇之另 一實施例。當使用者使用注音符號想要輸入一詞彙 「胰」,但是卻不知道「胰」的正確發音時,使用者圩以 輸入拼音序列「一」。近似語音搜尋方法1 〇會利用近似語 音字母表3 0來產生拼音序列「一」的語音拼音的所有近似 語音拼音。再利用有效語音拼音表3 4來產生拼音序列 「一」的語音拼音的所有有效的近似語音拼音。接著,再 利用對拼音序列的「一」的語音拼音的所有有效的近似語 音拼音進行排列組合以產生拼音序列「一」的所有近似拼 音序列。最後’再利用詞彙語音表24及詞彙表22來將所有 近似拼音序列所對應的詞彙2 6顯示在顯示器1 8上。因此, 使用者可以選擇並且輸入詞彙r胰」。 由於本發明近似語音搜尋方法丨0具有近似語音字母表 3 〇可2用來產生一預定拼音序列的所有近似拼音序列,因 ,,當使用者所輸入的語音拼音不正確而無法輪入一預定 d囊時’近似語音搜尋方法丨〇會將相對應於該近似拼音序 歹i的所有㈣彙顯示在顯示器1 8上以供使用者選擇,使得使, 用者可以順利輸入該預定詞彙。 ^上所述僅為本發明之較佳實施例,凡依本發明申請 f =範圍所做之均等變化與修飾,皆應屬本發明專利之涵
笫U)页
Claims (1)
- 409237 六、申請專利範園 1. 一種近似語音搜尋方法’其可利用一近似語音來搜尋一 儲存於一電腦之詞彙,該電腦包含有一記憶體用來儲存程 式與資料,一處理器用來執行該記憶體内之程式,一顯示 器電連接於該處理器,用來顯示一影像晝面,以及一輸入 裝置電連接於該處理器,用來供一使用者輸入文字或語音 〇 字母,該記憶體内存有一詞彙表,一詞彙語音表,以及一 近似語音字母表,該詞彙表内存有複數個詞彙,每一詞彙 為複數個文字所組成之文字序列,該詞彙語音表内含有該 詞彙表内每一詞彙相對應之拼音序列,每一詞彙之拼音序 列依序含有該詞彙之各個文字的語音拼音,每—文字的語 音拼音包含有複數個依排列的語音字母,該近似語音字母 表内含有複數個近似語音字母集,每一近似語音字母集内 含有至少一個語音字母,每一近似語音字母集内之所有語 音字母之發音均近似,該方法包含有下列步驟:利用該輪入裝置來輸入一預定拼音序列,或是輸入一預 疋祠彙並將該預定詞彙轉換成一預定拼音序列; 利用該近似語音字母表來產生複數個該預定拼音序列之 2似拼音序列,其中每一近似拼音序列之各個語音拼 曰之各個語音字母與該預定拼音序列之各個相對應之 =音拼音之各個相對應之語音字母均屬同—近似ς 子母集;以及 利,該詞彙語音表及詞彙表來我出與該複數個近似拼音 $ =對應之詞彙並將其顯示於該顯示器上以供該使 用香選擇。第Π I 409237 六、申請專利範圍 2.如申 憶體内 所有有 的語音 以下列 利用 音 之 音 集 利用 音 該 音 利用 語 似 請專利範圍第1項之近似語音搜尋方法,1中嗜庀 存有一有效語音拼音表,該有效語音内存° 效之語音拼音,每一有效之語音拚音為至d ::產:該預定掛音序列之複數個近似拼音序列係 〇 表來產生該預定拼音序列之各猶語 近似语音拼音,其中每一近似語音拼音 ^語音字母與該預定拼音序列之相對應之語音拼 之個相對應之語音字母均屬同一近似語音字母 9 效語音拼音表來找出該預定拼音序列之各個語 胃二,2 ΐ近似語音拼音中之有效語音拼音以產生 J =并s列之各個語音拼音之所有有效之近似語 拚音;以及 *亥預定拼音序列之各偏往立4、, , 音拼音來做排列組合音之所有有效之近似 拼音序列。產生邊預定拼音序列之所有近 3·如申請專利範圍第i項之近似扭立 詞彙係由至少一個中文文字戶=°口/拽尋方法’其令每一 立H 所版成,而畚一中文文字之狂 曰拼S所使用之語音字母可為立从 ° 母。 ’Ί主曰付號字母或羅馬拼音字
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW88109296A TW409237B (en) | 1999-06-04 | 1999-06-04 | Chinese approximate pronunciation searching method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW88109296A TW409237B (en) | 1999-06-04 | 1999-06-04 | Chinese approximate pronunciation searching method |
Publications (1)
Publication Number | Publication Date |
---|---|
TW409237B true TW409237B (en) | 2000-10-21 |
Family
ID=21640983
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW88109296A TW409237B (en) | 1999-06-04 | 1999-06-04 | Chinese approximate pronunciation searching method |
Country Status (1)
Country | Link |
---|---|
TW (1) | TW409237B (zh) |
-
1999
- 1999-06-04 TW TW88109296A patent/TW409237B/zh not_active IP Right Cessation
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI539441B (zh) | 語音辨識方法及電子裝置 | |
US20110184723A1 (en) | Phonetic suggestion engine | |
US9965045B2 (en) | Chinese input method using pinyin plus tones | |
Chetail et al. | InfoSyll: A syllabary providing statistical information on phonological and orthographic syllables | |
Welmers et al. | Igbo: A Learner's Dictionary. | |
Bugert et al. | Generalizing cross-document event coreference resolution across multiple corpora | |
US9384191B2 (en) | Written language learning using an enhanced input method editor (IME) | |
JP2000298667A (ja) | 構文情報による漢字変換装置 | |
CN110555091A (zh) | 一种基于词向量的联想词生成方法及装置 | |
Teshome et al. | Phoneme-based English-Amharic statistical machine translation | |
TW409237B (en) | Chinese approximate pronunciation searching method | |
JP2008009507A (ja) | 外国語の発音のカタカナ表記方法 | |
JP6879521B1 (ja) | 多言語音声認識およびテーマ−意義素解析方法および装置 | |
TW201104643A (en) | Language teaching system | |
Jansche et al. | Named entity transcription with pair n-gram models | |
CN104615269B (zh) | 一种藏文拉丁全简双拼编码方法及其智能输入系统 | |
US8408914B2 (en) | System and method for learning Chinese character script and Chinese character-based scripts of other languages | |
CN111381687A (zh) | 汉字形、音形两用码及音、形和音形码同台交叉输入汉字的平台 | |
JPH0969109A (ja) | 文書検索方法及び文書検索装置 | |
KR102016805B1 (ko) | 평면 배열 기반 중국어 사전 제공 방법 및 그 장치 | |
TW201222329A (en) | Automatic hyphenation and segmentation method of Chinese full sentence input | |
KR20150076587A (ko) | 다언어로 찾는 중국어 사전 | |
Svantesson | Tradition and reform in China's minority languages | |
GB2573529A (en) | A method and apparatus for determining a spelling correction candidate | |
JPS5848131A (ja) | 文字処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent | ||
MM4A | Annulment or lapse of patent due to non-payment of fees |