TW409237B - Chinese approximate pronunciation searching method - Google Patents

Chinese approximate pronunciation searching method Download PDF

Info

Publication number
TW409237B
TW409237B TW88109296A TW88109296A TW409237B TW 409237 B TW409237 B TW 409237B TW 88109296 A TW88109296 A TW 88109296A TW 88109296 A TW88109296 A TW 88109296A TW 409237 B TW409237 B TW 409237B
Authority
TW
Taiwan
Prior art keywords
phonetic
pinyin
approximate
vocabulary
sequence
Prior art date
Application number
TW88109296A
Other languages
English (en)
Inventor
Huai-Yan Chen
Wang-He He
Original Assignee
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Corp filed Critical Inventec Corp
Priority to TW88109296A priority Critical patent/TW409237B/zh
Application granted granted Critical
Publication of TW409237B publication Critical patent/TW409237B/zh

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

409237 五、發明說明(1) 本發明係提供一種近似語音搜尋方法,尤指一種可利 用近似s吾音來搜尋詞彙之近似語音搜尋方法。 當使用者利用注音符號或羅馬拼音來輸入一中文詞彙 晴,如果使用者所輸入的語音拼音不正確時,就無法輸入 该中文詞彙。例如,使用者可能會混淆zh(史)、ch( 4 )、 (尸)、z(卩)、c(亏)、s(厶),而將詞彙广造成」的拼 會序列「卩幺\彳厶〆」輸入為「虫幺\方厶/」’而無 法輸入詞彙「造成」° 因此,本發明之主要目的在於提供一種近似語音搜尋 方法,其可利用近似語音來搜尋儲存在電腦的詞彙’即使 夜用耆所輸入的拼音序列不正確,本發明近似語音搜尋方 .玄會將使用者所欲輸入的所有可能詞彙找出’供使用者選 擇以輸入該詞彙。 圖亦之簡單說明 滅〆為一用來執行本發明近似語音搜尋方法的電腦之示意 圖 圖。 —么太發明近似語音搜尋方法之流程圖。
流程圖 @四為本發明近似語音搜尋方法之一實施例。 ^及為本發明近似語音搜尋方法之另一實施例。 圖五 五、發明說明(2) 14記憶體 18顯示器 2 2詞彙表 26詞索 32 近似語音字母集 圖示之符號說明 12 電腦 1 6處理器 20 輸入裝置 2 4詞彙語音表 30近似語音字母表 34有效語音拼音表 μ有效語音拼音 本發明是提供一種近似語音搜尋方法,其可利用—近 似語音來搜尋一儲存於一電腦的詞彙。請參考圖—。圖^ 為一用來執行本發明近似語音搜尋方法丨〇的電腦丨2之示音 圖。電腦12包含有一記憶體14用來儲存程式與資料,—處 理器1 6用來執行記憶體1 4内的程式’一顯示器1 8電連接於 處理器1G,用來顯示一影像晝面’以及一輸入裝置2〇電連 接於處理器1 6,用來供一使用者輸入文字或語音字母。記 憶體14内存有一詞彙表22,一詞彙語音表24,一近似語音 字母表3 〇 ’以及一有效語音拼音表3 4。詞彙表2 2内存有複 數個詞彙2 6,每一詞彙2 6是複數個文字所組成的文字序 列。詞素語音表2 4内含有詞彙表2 2内每一詞彙2 6相對應的 轿音序列2 8 ’每一詞彙2 6的拚音序列2 8依序含有詞彙2 6的 各個文字的語音拼音,而每一文字的語音拼音包含有複數 個依排列的語音字母。近似語音字母表30内含有複數個近 似語音字母集3 2。每一近似語音字母集3 2内含有至少一個 _jd092S7 __ 五、發明說明(3) 語音字母,每一近似語音字母集32内的所有語音 音均近似。例如’zh(虫)、ch( -<)、sh(尸)、z( C(亏)、S(厶)是屬於同一個近似語音字母集32。 拼音表34包含複數個有效語音拼音36,每一個有 音36可對應於詞彙表22中的广或多個詞彙26。 其中’每一中文文字的s吾音拼音所使用的語 為注音符號字母或羅馬拼音字母。 字母的發卩)、 有效語音 效語音拼 音字母可 。#參考圖二。圖二為本發明近似語音搜尋 程圖。近似語音搜尋方法10包含有下列步驟: 步驟4〇 :使用者利用輸入裝置20來輸入一預定 或是輸入一預定詞彙,並將該預定詞 預定拼音序列; ,闬近似語音字母表3〇來產生複數個 序列的近似拼音序列,其中每一 各個語音拼音的各個語音 的各個相對應的注立想立=了 /、该預 母均屬於同一:::;音的各個相對 近似f4及詞囊表以來找出 汗:序列相對應的詞彙2 丁$18上以供該使用者 步驟42 步驟4 4 法1 0之流 音序列, 轉換成一 預定拼音 音序列的 掛音序列 的語音字 該複數個 顯示於.顯 請參考圖三 圖二為產生圖
列的複數
_— 4092g7 五、發明說明(4) - --—---一· 個近似拼音序列之法敍阁 止M。Λ L紅圖。其包含有下列步驟: 步驟7 〇 :利用近似古五立玄± . 现似ffcr a予母表3 0來產生該預定拼音 各個語音拼音的所有近似語音拼音,其中 似語音拼音的各個語音字母與該預定拼音 相對應的語音拼音的各個相對應的語音字 於同一近似語音字母集32 ; 步驟72 :利用有.效語音拼音表以來找出該預定拼音 各個語音拼音的所有近似語音拼音中的有 拼音以產生該預定拼音序列的各個語音拼 有有效的近似語音拼音; 步驟7 4 .利用該預定拼音序列的各個語音拼音的所 的近似語音拼音來做排列組合產生該預定 列的所有近似排音序列。 「舉例而言,當使用者使用.注音符號想要輸入— 「城市」,卻錯誤地將其拼音序列輸入為「今厶/ 而無法產生正確的詞彙「城市」時,近似語音搜尋 會利用近似語音字母表3〇來產生拼音序列「今 白各個語音拼音的所有近似語音拼音◊例如,與語 /「今」屬於同一個近似語音字母集32的語音字母 彳、尸、卩、厶」。再利用有效語音拼音表3 4來產 序列「今厶/尸、」的各個語音拼音的所有有效的 音拼音。例如,「今厶/」有效的近似語音拼音有 〆」、虫人」、「厶卜」、「卩厶裳莖。 序列的 每一近 序列的 母均屬 序列的 效語音 音的所 有有效 拼音序 詞彙 尸、」 方法10 尸、J 音字母 「虫、 生軿音 近似言吾 「彳厶 接箸’ Λ〇9237 五、發明說明(5) _ 再利用對拼音;^ Sil 序列的「亏厶/尸、」各個語音拼立w邮女 有效的近似组立相 曰妍θ的所有 曰拼音進行排列組合以產生拼音序 「 /尸、」的所右w ^ yj ^ L~ 「 有近似拼音序列。例如,近似拼音序列可為 、 ,二)Λ ' 「"PAP」、「“ / 尸 )ί二等等。最後,再利用詞彙語音表24及詞彙表22爽蔣 戶,似拼音序列所對應的詞彙26顯示在顯示器丨8上。例 : 绅士」、「身世」、「沈思」、「增資」、「城 ^ 耘式」..·等等。因此,使用者可以選擇並且輸入 祠彙「城市」。 一 請參考圖四。圖四為本發明近似語音搜尋方法丨〇之一 實施例。當使用者使用注音符號想要輸入一詞彙「里約熱 内盧」,但是卻只知道「里」與「熱」的發音時,使用者 可以輪入拼音序列「灼一 v * g亡\ *」。近似語音搜尋方 法1 0會利用近似語音字母表3 〇來產生拼音序列「力一 v * θ亡\ *」的第一及第三個語音拼音的所有近似語音拼 音。再利用有效語音拼音表34來產生拼音序列「力一 ν* 0亡\*」的第一及第三個語音拼音的所有有效的近似語 曰拼音。接著,再利用對拼音序列的r力一 ν *日亡Ν *」 的第—及第三語音拼音的所有有效的近似語音拼音進行排 =組合以產生拼音序列「为一 v * Q古、*」的所有近似拼 曰序列。最後,再利用詞彙語音表24及詞彙表22來將所有 近似拼音序列所對應的詞彙2 6顯示在顯示器1 8上。因此, 使同者可以選擇並且輸入詞彙「里約熱内盧」。 五、發明說明(6) 40923^
〇 請參考圖五。圖五為本發明近似語音搜尋方法〗〇之另 一實施例。當使用者使用注音符號想要輸入一詞彙 「胰」,但是卻不知道「胰」的正確發音時,使用者圩以 輸入拼音序列「一」。近似語音搜尋方法1 〇會利用近似語 音字母表3 0來產生拼音序列「一」的語音拼音的所有近似 語音拼音。再利用有效語音拼音表3 4來產生拼音序列 「一」的語音拼音的所有有效的近似語音拼音。接著,再 利用對拼音序列的「一」的語音拼音的所有有效的近似語 音拼音進行排列組合以產生拼音序列「一」的所有近似拼 音序列。最後’再利用詞彙語音表24及詞彙表22來將所有 近似拼音序列所對應的詞彙2 6顯示在顯示器1 8上。因此, 使用者可以選擇並且輸入詞彙r胰」。 由於本發明近似語音搜尋方法丨0具有近似語音字母表 3 〇可2用來產生一預定拼音序列的所有近似拼音序列,因 ,,當使用者所輸入的語音拼音不正確而無法輪入一預定 d囊時’近似語音搜尋方法丨〇會將相對應於該近似拼音序 歹i的所有㈣彙顯示在顯示器1 8上以供使用者選擇,使得使, 用者可以順利輸入該預定詞彙。 ^上所述僅為本發明之較佳實施例,凡依本發明申請 f =範圍所做之均等變化與修飾,皆應屬本發明專利之涵
笫U)页

Claims (1)

  1. 409237 六、申請專利範園 1. 一種近似語音搜尋方法’其可利用一近似語音來搜尋一 儲存於一電腦之詞彙,該電腦包含有一記憶體用來儲存程 式與資料,一處理器用來執行該記憶體内之程式,一顯示 器電連接於該處理器,用來顯示一影像晝面,以及一輸入 裝置電連接於該處理器,用來供一使用者輸入文字或語音 〇 字母,該記憶體内存有一詞彙表,一詞彙語音表,以及一 近似語音字母表,該詞彙表内存有複數個詞彙,每一詞彙 為複數個文字所組成之文字序列,該詞彙語音表内含有該 詞彙表内每一詞彙相對應之拼音序列,每一詞彙之拼音序 列依序含有該詞彙之各個文字的語音拼音,每—文字的語 音拼音包含有複數個依排列的語音字母,該近似語音字母 表内含有複數個近似語音字母集,每一近似語音字母集内 含有至少一個語音字母,每一近似語音字母集内之所有語 音字母之發音均近似,該方法包含有下列步驟:
    利用該輪入裝置來輸入一預定拼音序列,或是輸入一預 疋祠彙並將該預定詞彙轉換成一預定拼音序列; 利用該近似語音字母表來產生複數個該預定拼音序列之 2似拼音序列,其中每一近似拼音序列之各個語音拼 曰之各個語音字母與該預定拼音序列之各個相對應之 =音拼音之各個相對應之語音字母均屬同—近似ς 子母集;以及 利,該詞彙語音表及詞彙表來我出與該複數個近似拼音 $ =對應之詞彙並將其顯示於該顯示器上以供該使 用香選擇。
    第Π I 409237 六、申請專利範圍 2.如申 憶體内 所有有 的語音 以下列 利用 音 之 音 集 利用 音 該 音 利用 語 似 請專利範圍第1項之近似語音搜尋方法,1中嗜庀 存有一有效語音拼音表,該有效語音内存° 效之語音拼音,每一有效之語音拚音為至d ::產:該預定掛音序列之複數個近似拼音序列係 〇 表來產生該預定拼音序列之各猶語 近似语音拼音,其中每一近似語音拼音 ^語音字母與該預定拼音序列之相對應之語音拼 之個相對應之語音字母均屬同一近似語音字母 9 效語音拼音表來找出該預定拼音序列之各個語 胃二,2 ΐ近似語音拼音中之有效語音拼音以產生 J =并s列之各個語音拼音之所有有效之近似語 拚音;以及 *亥預定拼音序列之各偏往立4、, , 音拼音來做排列組合音之所有有效之近似 拼音序列。產生邊預定拼音序列之所有近 3·如申請專利範圍第i項之近似扭立 詞彙係由至少一個中文文字戶=°口/拽尋方法’其令每一 立H 所版成,而畚一中文文字之狂 曰拼S所使用之語音字母可為立从 ° 母。 ’Ί主曰付號字母或羅馬拼音字
TW88109296A 1999-06-04 1999-06-04 Chinese approximate pronunciation searching method TW409237B (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW88109296A TW409237B (en) 1999-06-04 1999-06-04 Chinese approximate pronunciation searching method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW88109296A TW409237B (en) 1999-06-04 1999-06-04 Chinese approximate pronunciation searching method

Publications (1)

Publication Number Publication Date
TW409237B true TW409237B (en) 2000-10-21

Family

ID=21640983

Family Applications (1)

Application Number Title Priority Date Filing Date
TW88109296A TW409237B (en) 1999-06-04 1999-06-04 Chinese approximate pronunciation searching method

Country Status (1)

Country Link
TW (1) TW409237B (zh)

Similar Documents

Publication Publication Date Title
TWI539441B (zh) 語音辨識方法及電子裝置
US20110184723A1 (en) Phonetic suggestion engine
US9965045B2 (en) Chinese input method using pinyin plus tones
Chetail et al. InfoSyll: A syllabary providing statistical information on phonological and orthographic syllables
Welmers et al. Igbo: A Learner's Dictionary.
Bugert et al. Generalizing cross-document event coreference resolution across multiple corpora
US9384191B2 (en) Written language learning using an enhanced input method editor (IME)
JP2000298667A (ja) 構文情報による漢字変換装置
CN110555091A (zh) 一种基于词向量的联想词生成方法及装置
Teshome et al. Phoneme-based English-Amharic statistical machine translation
TW409237B (en) Chinese approximate pronunciation searching method
JP2008009507A (ja) 外国語の発音のカタカナ表記方法
JP6879521B1 (ja) 多言語音声認識およびテーマ−意義素解析方法および装置
TW201104643A (en) Language teaching system
Jansche et al. Named entity transcription with pair n-gram models
CN104615269B (zh) 一种藏文拉丁全简双拼编码方法及其智能输入系统
US8408914B2 (en) System and method for learning Chinese character script and Chinese character-based scripts of other languages
CN111381687A (zh) 汉字形、音形两用码及音、形和音形码同台交叉输入汉字的平台
JPH0969109A (ja) 文書検索方法及び文書検索装置
KR102016805B1 (ko) 평면 배열 기반 중국어 사전 제공 방법 및 그 장치
TW201222329A (en) Automatic hyphenation and segmentation method of Chinese full sentence input
KR20150076587A (ko) 다언어로 찾는 중국어 사전
Svantesson Tradition and reform in China's minority languages
GB2573529A (en) A method and apparatus for determining a spelling correction candidate
JPS5848131A (ja) 文字処理装置

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent
MM4A Annulment or lapse of patent due to non-payment of fees