TW308659B - - Google Patents
Download PDFInfo
- Publication number
- TW308659B TW308659B TW082106458A TW82106458A TW308659B TW 308659 B TW308659 B TW 308659B TW 082106458 A TW082106458 A TW 082106458A TW 82106458 A TW82106458 A TW 82106458A TW 308659 B TW308659 B TW 308659B
- Authority
- TW
- Taiwan
- Prior art keywords
- group
- grammar
- grammatical
- primitive
- special
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18162—Extraction of features or characteristics of the image related to a structural representation of the pattern
- G06V30/18171—Syntactic representation, e.g. using a grammatical approach
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/196—Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
- G06V30/1983—Syntactic or structural pattern recognition, e.g. symbolic string recognition
- G06V30/1985—Syntactic analysis, e.g. using a grammatical approach
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Character Discrimination (AREA)
- Machine Translation (AREA)
Description
306G59 A6 B6
經濟部中央標準局W工消费合忭.vitl'. J 五、發明説明() 發明背景 發明之領域 本發明僳槪略有闋用於語法信號分析之裝置,包括有 :一轉換單元供將一输入信號轉換成基元(primitives) ---------- 以及轉換成對應於此等基元的常態化基元(nor aalized P r i b i t i v e s); —圖形(p a 11 e r η)辨雜單元被連至該轉 、----------'-------- 換單元,供藉由參照一文法(granaiar)提供第猫化基元 之字串(string)在每一情況下的語法分析;以及記憶 體單元供儲存該文法,該文法包括有被以重寫規則(in -----—~- -------- rewriting rules)所排序(ordered)並且亦包含對應於 常態化基元之詞語(terminals)的語辭(terms);本發 明亦有問於一種用於語法信號分析之方法、有關於一種用 於编碼(c 〇 d i n g)特戲(f e a t u r e s )之方法、以及有關於 一種用於將一代表了藉由光學掃描器所獲得文字行( lines of text)的影像元素圖形(pixel pattern )轉 換成適合於作圖形辨識之基元和特戧的字串。 前技說明 信號在許多種的技術領域中被處理。然而,這些信號 時常因為各種原因而受得不完整或損毀。在大多&的情況 下,有完整或未損毀的信號是較為有利的。如果事先#道 完整或未損毀的信號必須滿足某些規則.那麼就可以檢査 - 一·- 是否所得到的信號確實滿足這些規則,並且如果不滿足的 逯用中國國家榨準(CNS)甲4規烙(21U X 297公货) 82.6. 40 000 (請先閲讀背面之注意?項再項寫本頁) —裝‘ 訂. ...¾丨. 308659 a6
五、發明説明() 話,就捨棄或是修正這些信號。 經濟部中央標準局WK工消"合作.^tl,,」 $ 一種習知於此項技藝中用於檢查是否信號滿足某些規 則的技術為語法分析法或語法解析技術。對於此語法分析 法或語法解析技術之介紹諳分別參看"數位圖形辨識〃( Digital Pattern Recognition) , Springer-Ver 1 ag 於 1 9 8 0年出販,K . S . F u编著,第9 5 - 1 3 4頁,以及*數 位影像處理〃 (Digital inage processing) , John Wiley & Sons 於 1978 年出販,W. K. Pratt 编著,第 574-578 頁。 於此法中,信號首先被分段單元( primitive e 1 e m e η.υ.。這些基#元(其後將表示為基 元)然後被分類並由一常態化基取代。一此暖類型的 常態化基兀偽某一類別(class)或類項(category)的 原型。然後檢査是否以此方式所獾得的常態化基元之字串 棋足一文法〇 —文法包括了一些規則,熟知為重寫( rewriting)或生産(production)規則,各文法由一些 語辭(t e r m s)、詞語(t e r i n a 1 s)或非詞語( non-terainals )所组成,並且每一文法預先決定出一種 方式其中一组語辭可被重寫以形成一非詞語。該文法亦定 義了一啓始符號(starting symbol)。該啓始符號像一 非詞語。所定義的頚別或類項以及因而該等常態化基元係 一對一地(one by 〇ne)對塍於來自該文法的詞語。 一倒反的語法解析程序係由恶用適當的重寫規則至常 尽兔用中圉國择半(CN'S)甲4 )見格(21〇 X 297 '广贫) 82.6. 40,000 (請先閲讀背面之注意事項再項寫本頁> _裝· 訂· A6 B6 3 G 8 6 5 9 JL、發明説明( 態化基元的字串以及至中間所獲得的重寫結果,直到該啓 始符號係被獲致所組成。重寫規則之應用在每一情況中偽 意謂將較簡單的語辭接在一起以形成更為後雜的語辭,並 最後造成信號呈樹狀結構之層次结構组成,亦熟知為一語 法解析樹(parsing t r β β)、解法樹(s ο 1 u t i ο n t re β) 或分析(analysis),具有啓始符號在根部位置、該等常 態化基元位在枝葉部位置、以及所應用重寫規則之非詞語 位在中間節點位置。該文法定義了所有這樣可允許的層次 結構組成。 若在某一時間下,當該啓始符號尚未被找到時,於語 法解析程序中不可能睡用任何進一步的重寫規則,則該信 號就不符合該文法並且該信號將被否绝。然後,可能可以 調整一或多傾基元或常菔化基元,以使得該文法中的規則 可符合:該信號然後就被修正了。此類型之一修正法係示 於 # 數位彩像處理 〃 (Digital Iiaage Processing)中, 由》. Pratt 出販,第 571 頁,圖 20.2-3。 若該語法解析程序確實傳送了啓始符號,則該信號符 合了所預先決定的規則,並且其有所允許的層次結 f组成 之一者《若該信號之驗證為唯一所擗者,則該啓始符號已 到達此項事實就足以證明該信號係符合該等規則。萬一信 號之辨識亦為裝置之目的,則辨識之標的物可由所提供的 分析直接導出:辨識之一標的物偽由非詞語符號來表示, 而非詞語符號為一對應於供辨識標的物之次樹狀結搆組成 (請先閲讀背面之注意事項再填寫本頁)
T % 經濟部中央標準局貝工消"合作:^.印- 卜呔^又通用中國国家桴準(CNS)甲4現格(210 X 297公货) Α, ά(\ ΩΠΠ A6 B6 3 G 8 6 5 9 五、發明説明() 的根部。若一信號已被以此方式轉換成被辨識符號之一字 串,則讓最後所得到的符號(經過一些中間操作之後(若 有需要的話))受到下一個語法解析步驟是可能的,其中 是否所辨識符號之字串符合其他的規則条统之檢査傺被作 出。此然後可導致該等符號之適配(adaptation),以及 此然後可導致該信號之適配。此語法解析步驟將再次産生 一结構化描述,而以此結構化描述進一步的處理係予實施 亦為可能。 各式類型的語法解析程式偽已知。一種亦處理不符合 文法中規則之信號的語法解析程式,以及一與此語法解析 程式相互配合的修正機制偽描述於 EP-A-0361570號案中 在"對自然語言之有效語法解析Efficient Parsing for natura 1 1 anguage)中,K1uwer Acadβic Publisher (1986), H. Tomita 描述了一種 * 一般化 LR 語法解析程式〃 (generalized LR parser)。此語法解 析技術傜依據LR (左到右最又· Left-to-right KUhhost)語法解析技術,一種熟知於此項技运中由 Knuth 於1965年所引入的技術。Toaiita擴展了此LR •藉由使其適用於含混的輸入:在此情況下語法解析 程式:傜可對此一輸入給出多於一個的結構化描述。在自然 語言中含混输入之一實例偽此輸入句子:"He saw a Ban a telescope"(可解為#他以一副望遠鏡看到一個 ----------------------裝------ir------線 (請先閱讀背面之注意事項再塡寫本頁) 經濟部中央標準局员工消CH合汴:-..u',-
82.6. 40,000 A6 B6 308659 五、發明説明() 人"或#他看到一個人帶有一副望速鏡"),其中子句v with a telescope”可為一副詞子句修飾動詞"saw” , 或是為一形容詞子句修飾名詞〃 nan”。G L R語法解析 程式為目前最快速並且最有效語法解析技術之一者。 應用領域 有許多技術領域其中語法解析技術傜可用以檢査並修 正信號。 光學字元辨識糸統係欲藉由一光學捅描器黷入文字( text),並將之轉換成一種可由一電腦做處理之形式的条 统。由該光學掃描器所傳送的電子信號係被取入( thresholding)並以一影像元素圖形儲存於一記億體中。 該影像元素圖形並非原始文字之一精確影像,例如由於光 學条統之不精確、明暗不均(uneven illunination)、 或是於取入中的捨人誤差(rounding error)。亦可能供 掃描的原始文件品質差,字元殘缺、損壞、或是為手寫字 元。然而,所獲得到的信號必須代表字元是眾所周知的。 此認知可藉由令一語法解析程式檢査是否該影像元素圖形 確實有代表字元的結構而加以利用。為達此目的,該影像 元素圖形必須予轉換成一条列的基元或常態化基元,而此 常態化基元係直接對應於來自該文法的詞語,籍此,該等 詞語係相對於該文法的重寫規則被加以檢視。在K . S · Fu (编著者)的"數位圔形辨識#第 1 0 3頁給出了對於手 寫英文字元的基元,以及第 110及以下的頁次給出了一 -----------------J -----裝------TT------線 (請先《讀背面之注意事項再塡寫本頁) 經濟部中央標準局貝工消泛合作::一印^ 又边用中國国家悻芈(CNS)甲4規格(210 X 297公:Ϊ ) 82.6. 40,000 經濟部中夹標準局貝工消费合作江印; A6 _B6_ 五、發明説明() 些描述特定圖形的文法。 下一踱用領域為物體辨識之領域。若僅一小數目的物 髏須加以辨識,則可比較源自於一偵側機構之输入信號與 所有可容許的物體,並決定出何物饈最符合該输入信號。 然而,若涉及到一大量數目的物體,則將每一物體描述為 一组基元偽較為有利。這些描述規則就形成了文法。一输 入信號係被分段成該等基元,並且然後一語法解析程式檢 査是否該文法之規則被符合,以及結果該語法解析程序送 出何物體對睡於所找到的結構組成。在 K.S. Fu (编著 者)的#數位函形辨識",尤其是第 113頁描述了一用 於染色體之辨識的文法。 語法分析方法亦可被較有利地使用於語音辨識。在 K.S. Fu (编著者)的"數位圖形辨識〃第177頁給出了 一語音辨識糸统之一實例。在此裝置中,一磬波處理器( acoustic processor)係緊接著一語音處理器( linguistic pracessor)。經過一些處理操作之後,該聲 波處理器傳送出一串音素(a s t r i n g 〇 f p h ο n e b e s)。此 串音素偽被餒至該語音處理器,其(特別是依據語法分析 規則)將該串音素轉換成一串字(a string of words) ο 語法解析技術可應用於檢査並修正信號之技術領域的 另一例子為#自然語言界面〃 (natural language interface)条统的領域。此類型之一条统偽著重在協助 ------------------一-----裝------.玎------線 (請先閲讀背面之注意事項再塡寫本頁) 通甩中a國家漂準(CNS)甲4現格(210 X 297父货〉 82.6. 40,000 A6 B6_ 五、發明説明() (請先閲讀背面之注意事項再填寫本頁) 人類於其與一電腦条統之交互作甩。此對於例如使得門外 漢可查詢一資料庫偽為非常重要。此類型之一"自然語言 界面"必須容許使用者可以自然語言設想出複雜的問題》 由使用者以自然語言所输入的句子僳由一語法解析程式作 分析,並然後以一適合於餓入該資料庫的形態傳送出一些 問題。此類型之一糸统係在由Wallace所著:〃 以自然語言與資料庫溝通〃 (CoBBunicating with databases in Natural Language),由 Wiley & Sons Inc. (1984年)出販的教科番中被討論。 歐洲專利申請案ΕΡ-Α-0 5 1 3 9 18描述了一種拼音檢 査条统。一語法解析程式之使用於此應用中使得此拼音檢 査条统更具多樣性以幾更精確:被檢査的不僅僅是一描離 的字組(》〇rd),宇組的詞形受化(inflection)以及句 子的語法亦被檢査。結果是對於一錯誤拼字之許多可能的 變化選擇偽大為減少。此外,一語法解析程式(因事物之 本質)亦偽一適當的工具供使用作為對於一自然語言之一 文法檢査器。 經濟部中央標準局貝工消贷合作:α印^ 在機器翻譯条统中,語法解析程式偽適用於分析要® 譯的句子,以及適用於以其文法作用(功能)自所晒譯& 字組合成(synthesise) —被翻譯的句子。 在此一應用中一語法解析程式之利用將可在EP_卜〇 3 5 7 3 4 4號菜中找到。 利用一語法解析程式亦可能重組源自於一受損的# 3 -10- 82.6. 40,000 本用中國國家I?準(CNS)甲4規格(210 X 297公货) A6 B6 30S659 五、發明説明() 記憶髏条統或一差的通訊頻道之不完整或損毀的信號,因 為該等信號偽遵循事先已知的規則。 一語法解析程式亦可較有利地被使用於索引条統。此 類型糸統之目的煤在對一组文字製作索引字之表列。為達 此目的,被減至一常態化形態之名詞和動詞(例如分別為 單數形和不定詞)係藉由一語法解析程式自文韋中被取出 。此類型之一条統係描述於由 C. Berrut和 P. Palmer 所著文聿:〃在一用於自動化索引之表面語法解析程式内 解決文法上不確定性〃 (Solving grannatical asbiquities within a surface syntactical parser for automatic indexing) , ACM Conference on Research and Development in Infornation REtrieval (1 98 6 ) 0 由上述可清楚得知語法解析技術係可適用於許多種的 技術領域中。 特街[整合(feature unificatian) ,___ 語法㈣技J中之一重要進展偽利用^徽整合>獲致 。為達此目的,建立起輸入信號的基元偽被提供^徽。 這些持徴更加詳细地給定出一基元。為此之故,來自文 規則的語辭亦係被提供以持戡。於語法解析處理中,基元 ·—— 一~^ --- 的持^偽相較於該i文法規則中對應語辭的持徽被測試。 3等持戡亦可被傳換至語辭,其接著於語法解析程序中被 ..... - ______ 進一步相對於下一可應用的文法規則作測試。特徴整合使 -1 1 - --------------------U -----裝------.玎------線 (請先閱讀背面之注意事項再蜞寫本頁) 經濟部中央標準局3工消货合诈fxtr):v: i这甲中國國家懔準(CNS)甲4規洛(210 X 297公釐) 82.6. 40,000 五、發明説明( A6 B6 經濟部中央標準局3工消?'/--,riis:fi 得更為複雜的結構組成可以語法解析技術予處理。 特戡整合之一實例係描述於文章〃一般化LR語法解 析程式/编譯程式V8—4:實用NL計《之套裝軟腰" (The generalized L R Parser/conpiler V8-4: A software package for practical HI projects),由 M. Toiaita 出版於 Proceedings of the Coling-90, Helsinki 1990。然而,其中所描述用於實施待戡轚合之 方法之一缺點在於特戡處理之理雜度。雖然一語法解析程 式可以此方式被設計成適用於處理更為複雜的結構组成, 但其對於該語法解析方法用於實際目的之實用性傺棰為不 利,這是因為一大堆額外的步琛被須被加至該語法解析方 法。 本發明之概要 本發明之目的係在於藉由加入一增進功效的並更為多 樣的整合機制,以改菩適用於上述懕用領域之用於信號分 析之裝置。 本發明之原理主要偽奠基於認知到特徴之整合可藉由 成组群地纳入特徴於文法中,並然後對該等待戡组群實施 整合而有效地受到影堪。 依據本發明,在一種於申請專利範圍之前言中所提到 類型的裝置,為達本發明之目的,該轉換單元偽包括有待 (請先閲讀背面之注意事項再填寫本頁> t
T %
Pdf ΐϋ用中國國家棵苹(CNS)甲4规格(210 X 297公釐) 82.6. 40,000 經濟部中央標準局貝工消·nlrii印V-: A6 B6_ 五、發明説明() 徵析取機構(feature extraction means)用於自每一基 元導出特徴、兩於將自毎一基元所導出的特戡聯接在一起 以形成目前的(current)特徵组群、以及用於將目前的 特徴組群指賦予對應於該基元的常態化基元,該文法係包 括有隨附於該等語辭之所宣示的(declared)持擞組群, 以及該圖形辨識單元傜包括有用於目前的和所宣示的持擻 組群之整合的機構。 用於整合之特徵的處理現在可柑當快速地做到,因為 該等待擻不再必須被分別地處理。 依據本發明之另一有利的實施例,其特戡在於該圖形 辨識單元包括有機構用以依據目前的和所宣示的特徴組群 之整合,賦予一違反計數(violation score)至該語法 分析。 以此方式,特擻之族群處理係為一記錄了特獻之違反 的違反機制所延展。若該語法解析程式傳送出一分析,以 此方式則可以在該分析中指示出何(等)基元不符合所要 求的特徵。 依據本發明另一增進访效的簧施例其持徵偽在於裝置 包括有機構用於在假若該違反計數超過一臨界值時中斷語 法解析,以及有機構用於在假若該違反計數超過該臨界值 時提高該臨界值和機構用於重新啓始語法解析。 若該違反計數超過了一给定的臨界值時語法解析係被 中斷。該臨界值然後被增加至一由該違反計數加上一固定 -13- 82.6. 40,000 --------------------* -----裝------ΤΓ------線 (請先Μ讀背面之注意事項再填寫本頁) 經濟部中央標準局貝工消货合作.'1印^ A6 _B6_ 五、發明説明() 值所決定出的值。語法分析然後重新開始。因此,在一些 語法分析執行中,一或多項分析係最後在被提供以一違反 計數下被傳送出。所傳送的分析正好就是那些在一給定的 範圔内有最低可能的違反計數之分析。造些步驟産生了一 適配的臨界機制,致使該用於信號分析之語法解析機制的 應用性係大為提高。該等特擞之違反係可被容許到一額外 可調整的程度。為該装置所可容許之變異的程度偽可依據 該裝置之目的而調整。由於這些步驟,該語法解析機制( 其原本因其待性的問係而為固定不妥的)已變得非常具彈 性。 依據本發明裝置之另一項改進偽由下述事簧而獲致: 該裝置包括有修正機構,若該違反計數不等於零時,其供 被致動。 此修正步驟可較有利地利用分析中所指示出的遠反。 依據本發明装置之又一項改進係藉由將待徴組群以一 二進位數字來表示而獲致。 附圖之簡略說明 本發明現將參照一些圖式予詳細說明,其中·· _1為一依據本發明之装置的方塊概示圖; 圆2為一語法解析單元之一主要常式之流程圖; 圔3為一語法解析常式之一流程圖; 圖4為一動作常式(actor routine)之一流程圖; -1 4 - 通用中國國家作準(CNS)予4規格(2i0 x 297公货) 82.6. 40 000 --------------------,-,>-----裝------ΤΓ------線 (請先W讀背面之注意事項再«寫本頁) 308659 t6 B6 _ 五、發明説明() 圖5為一移轉常式(shift routine)之一流程圖; 圖6為一減降常式(reducing routine)之一流程圜 圖7為一整合常式(unification routine)之一流 程圖; 圖8係一用於將元素_形轉換成一串基元之方法的流 程圔程圖; 圖9 a到9 d顯示出適合於應用在字元辨識領域之詞 語和待徴之定義,以及一串基元; 圖1 0顯示出一串基元;以及 圖11偽一種推導出持戡指示器之架構之方法的流程 圖。 較佳實施例之詳細說明 圖1顯示出依據本發明之一装置。一供分析的信號S 偽被頡至一轉換單元1 0 1。該轉換單元將該信號S轉換 成為一基元流P和一常態化基元流L以及目前的特徴族组 。此詞彙流L,結合於該基元流P (若有需要的話),係 被饋至該語法解析單元102。該語法解析單元102在 各情況下讀入該常態化基元流L之一部分,並驗證是否此 已被讀入且包含一串常態化基元和目前的待徵族组的部分 符合一文法。此文法偽呈一些列表(table)的方式被儲 存在記億體1 0 3中。若該串常態化基元符合該文法,則 一或多痼分析A偽由該語法解析單元所傳送。一分析偽給 -15- --------------------------裝------,玎------M (請先閱讀背面之注意事項存蜞寫本頁) 衣紙Kt逯用中BB家棵準(CNS>甲4規格(21U X 297 〉 82.6. 40,000 A6 ___B6_ 五、發明説明() 定出該對應於所謓入常態化基元串之輸人信號之所述部分 之一結構化描述(為該文法所允許者)i在驗證顯示出所 描述的特徴被遠反的情況下,該語法解析單元便增加一違 反計數。在此情況下,所找到的分析係連同有闋的違反分 數被該語法解析單元所傳送。由該語法解析單元所傳送的 該等分析然後可供作進一步之處理,連同該原始的信號s 、該等基元流P以及該常態化基元流L。 此裝置之一受化設計俱藉由提供一修正單元104 ( 以斷線表示於_1中)於其上而獲致。若該語法解析單元 並未傳送一解答,或是若該語法解析單元僅傅送出該違反 計數不等於零並且因而已發現到持撖已被違反之解答時, 該修正單元係被ώ用,致使一修正機制被啓動。該修正機 制可以各種方式來建構。依據一第一S施例,修正係藉由 該更改由該語法解析單元所傳送的分析而為之。依據一第 二實施例,該等基元偽依據該語法解析單元所給定有鼷於 所違反的特擻之資訊而修正。若裔要的話,所修正的基元 流Ρ’然後被餵至該語法解析單元。 經濟部中央標準局貝工消ί合作;"ι,,.<- 在接下來之一變化設計中,該裝置亦被提供以一聱告 裝置105被由該語法解析單元所致動。若該語法解析單 元發現到該輸入信號S過度偏離該文法中所給定的規則時 ,該警告裝置便傳送出信號W。 若該装置被建構為一光學字元辨識糸統,則轉換單元 101亦包括有一光電轉換器,以藉由一掃描機制將光學 -1 6 _ 82.6. 40,000 (請先Μ讀背面之注意事項再填寫本頁) 本用中國國家彳S半(CNS)甲4说格(210 X 297公货〉 A6 B6 308659 五、發明説明() 翰入信號轉換成為一電子信號,此電子信號然後被分段成 為基元流P。該等基元偽被映射在常態化基元上並且(提 供以目前的恃徽組群)偽被餓至該語法解析單元。參照該 文法,該語法解析單元決定出何基元圖形代表一特定的字 元並送出連績被辨識的字元。 若該裝置被建構為一文法檢査和修正糸統,則該修正 信號偽一文聿資料流。轉換單元101將此資料流分段成 為字组並然後決定出常態化基元(詞棠類項)和目前的特 徴組群(詞彙待質)。該語法解析單元然後一句一句地讀 入該詞彙流並檢査是否每一句子皆滿足該文法中所給定的 語法。若有任何違反的話,該修正單元便依據所偵測到持 徴之違反更改該等基元。所修正的基元流P’然後被送出 〇 藉由將所辨識的字元餓至一較有利地配備有所述文法 檢査和修正糸统之拼字檢査器,可改進先前所描述的光學 字元辨識条統。 必須注意的是,該裝置之利用並非侷限於以上所描述 的恶用領域。該装置可有利地應用至信號必須被加以分析 供作辨識或供作驗證以及一先決要件為這些信號遵守特定 規則的所有領域。該裝置之方法現將參照圖1至8詳细加 以說明。 一供分析的信號S係被饋至圖1的轉換單元1 0 1 , 其將此信號轉換成為一基元流P和一常態化基元流L以及 -1 7 - ------------------j· ------裝------訂------線, (請先閲讀背面之注意事項再埔寫本頁) 經濟部中央標準局貝工消IfH合作:aM)t 用中國gj家f?':_MCNS)甲4現恪(21ϋ X 297公货) 82.6. 40, 經濟部中央標準局貝工消费合汴汪印公 A6 B6 五、發明説明()
目前的持徵組群。在該轉換單元1 0 1中要被實施的方法 依據應用領域將有不同的實施例。用於光學字元辨識之一 實施例稍後將詳細討論。該語法解析單元之方法現將參照 圖2至7說明之。依據本發明該語法解析單元之主常式係 參照圔2之流程圖詳偽苗述。由啓始位置201開始,在 步驟 202,變數:result, threshold 和 new-threshuld傺被啓始化為零並且變數 delta-threshold偽被啓始化為D E L T A。在步® 2 0 3,該詞*流L之部分係被讀入,包括一糸列被提供以目 前的持徵組群之常態化基元,以及一結束符號$係被加入 該宇串。然後在步K204,該語法解析常式被叫用。該 語法解析常式驗證是否所讀入的宇串谋足以一些列表形態 儲存在記®β中之文法。如果滿足的話,呈一樹狀結構形 態之一或多個分析(其中毎一分析有一分離的根節點)係 被傳送,並且變數result含有指到該等根節點的指標。 若該語法解析未發現到一分析,則該變數result含有值 0。在步驟205,一檢査然後被作出,以決定是否該受 數result有一值不等於0。若為否(N)的話,該方法 藉實施步驟206而逛續,其中一檢査然後被作出,以決 定是否該愛數 threshold有一值大於一預先決定的數值 MAX。若是(Y)的話,該主常式到達结束狀態207 。在此狀態,該語法解析單元未能找到一分析,並且該輸 入信號必須被以不符合所給定的規則(至少不落於該Μ A -1 8 - —---------------J-----裝------,玎------線— (請先閲讀背面之注意事項再塡寫本頁) 氏伥火‘又边用中國國家丨f苹(CNS)甲4規烙(21ϋ X 297公货) 82.6. 40,000 經濟部中央標準局員工消φ-ί^ΙΓίίΜ.-ν A6 B6 五、發明説明() X值所許可之違反數目之範圍内)而否決。該驗證不成功 之事實可予加以利用•例如,用以致動一警告裝置。若變 數threshold並未超過該值M A X ( N ),則 new-threshold.和 delta-threshold 之和係在步琢 20 8被賦予妥數threshold。在該語法解析常式之執行中, 違反計數已被指定予 new-threshold。Delta-threshold 有一重置值。因此,相對於該變數 threshold被由相同 的步驟增加的情況下,在少許步驟中,就該情況而言分析 係被發現到具有一最小數目的違反,並在違反之數目方面 有一些分布,該分布偽由 delta-threshold之值所決定 。實施步驟208之後,該語法解析常式偽再次被叫用。 若在步缀20 5該變數result有一值不等於零(Y). 一檢査傜在步驟209被作出,以決定是否該違反計數為 零。若為否(N)的話,一修正常式係在步驟2 10被叫 用。該修正常式之簧施例偽依據應用領域而定。較有利地 ,該修正常式可利用由該語法解析常式所傳送的分析,所 述分析指示出那些在該處規則之違反已被發現到的減降步 驟。該語法解析單元之主常式然後到達結束狀態2 1 1 , 其後,所獲得之分析以及所修正之信號係可供作進一步之 處理。若在步驟209所述違反之數目係等於零(Y), 則該結束狀態2 1 1偽立卽達到。 圖3顯示出該語法解析常式之一實施例。由啓始位置 30 1開始,在步驟302該基元計數器i、計數器識別 -1 9- -----------------i -----裝------1T------痒.- (請先閲讀背面之注意事項再填寫本頁) 闱中國国家作準(CNS)甲4規格(210 X 297公釐) 82.6. 40,000 經濟部中夬標準局3工消5·合作;fi印^ A6 _B6_ 五、發明説明() 號id、違反計數器、圖形結構化堆叠G以及分析樹T係 被啓始化,並且元素 vO傜被加至該集合U0,0:U0,(Uv0} 。此元素vO傜被賦予狀態s = G。而且,在此步驟,該被 提供以詞彙資料(常態化基元、目前的待徴組群)之第一 基元係被讀出該字串。在步驟303,計數器 j然後被 啓始化為0,該等集合R, Re和Q被啓始化為空集合並 且集合 A被令為等於U0,0:A={vO}。在步思3 0 4 —檢 査然後被作出,以決定是否 A為一空集合。若為否(N ),則動作常式在步驟305被叫用。若為是(Y)的話 ,一檢査偽在步S306被作出,以決定是否 R為一空 集合。若為否(N),則滅降常式在步留307被叫用。 若為是(Y)的^,一檢査偽在步驟308被作出,以決 定是否Re為一空集合。若不是的話,e-減降常式被叫用 。若是的話,步驟3 1 0達到。同樣的,步驟3 1 0在實 施步驟305、 307和309之一者後達到。該等步驟 305和307偽分別詳細顯示在圖4和6中。步驟30 9,該 0-減降常式,未詳細導出惟相對於前技作必要修 改以使得此常式可適用於本發明中之作法偽類似於對詳细 導出在圖6中之減降常式的改變。在步驟310,—檢査 傜被作出,以決定是否該等集合A, R, Re皆為空集合。 若為否(N),則該方法回返到步驟304。若為是(Y )的話,該移轉常式在步驟311被叫用。像詳示於圔5 中並將於後述中詳細描述。實施了移轉常式之後,該方法 -2 0 - 本呔:7^’~沒通用中a国家挖苹(CNS)甲4規格(210 X 297公货) 82.6. 40,000 ------------------;-----裝------.玎-----—線 f (請先閲讀背面之注意事項再填寫本頁} 3086M :: 3086M :: 經濟部中央橒準局員工消 五、發明説明() 逛缥步驟3 1 2,其中基元計敦器 i傜加1。一檢査然 後在步駿3 1 3被作出,以決定是否Ui,J為空的。若為 是(Y),值0在步驟3 14被置入受數 result ,並且 此表示無分析可被找到,之後,結束位置3 1 5達到。若 Ui,J非為空的,一檢査在步驟3 1 6被作出,以決定是 否存在下一個基元或是结束符號。若是(Y)的話,其在 步驟3 1 8被讀入。若不是(N)的話,所獲得的分析在 步驟317被寫走。該語法解析常式然後到達結束位置3 15,之後.該方法继缅實施語法解析常式。 圔4顯示出該動作常式之一實施例。由啓始位置40 1開始,在步驟402 —目前的最高黏 vc被藉由自用於 此目的之該集合‘ A取出而決定。一動作列表然後在步驟 403披詢用。該動作列表偽由所定莪的文法所導出並對 一給定狀態 S以及定義於該文法中之語辭指定出動作。 該動作列表之登錄形式決定了何動作係有關於該目前的最 高點 vc。在步驟404,對此登錄所給定的第一動作然 後被讀入。一檢査然後在步驟405被作出,以決定是否 〃接受"動作被给定。如果是(Y )的話,vc 偽在步驟 40 6被指定予變數r並且變數result被加上值id。 若為否(N)的話,一檢査係在步驟407被作出,以決 定是否動作#移轉 s"被指定。若是(Y)的話,元素 < v c , s, category, primitive〉被加至集合 £1。若不是 (N)的話,一撿査在步驟409被作出,以決定是否動 -2 1- —----------------------裝------.玎------線- (請先閲讀背面之注意事項再填寫本頁) A6 B6 五、發明説明( 作〃減降p"被指定。若為是(Y)的話,一檢査係在步 驟4 1 0被作出,以決定是否規則 P為一空的産生規則 。若事實上規則 P是(Y) —空的産生規則的話,元素 <vc, P, category, priBitive〉供被加至集合 Re。若規 則P不是(N) —空的産生規則的話,步驟4 12係被執 行,其中對於 G 中vc之毎一直接後缠者X, —元素 <vc, X, P, category, prinitive〉係被加至集合 R。若 在步驟409發現到動作#減降P"並未被指定(N), 則步驟4 1 3被執行。步斑4 1 3在步S406、408 、4 1 1和4 1 2之後亦偽被執行。在步铤4 1 3 —檢査 偽被作出,以決定是否對於在步驟403中所決定的登錄 ,下一動作亦傈被指定在動作列表中。若為是(Y)的話 ,該動作係在步琛414被讀入,之後,該方法偽雄鑛步 驟405。若為否(N)的話,一檢査係在步驟415被 作出,以決定是否下一宿詞語,亦即下一锢常態化基元適 用於目前基元的情況。若為是(Y)的話,此下一傾詞語 係在步驟416被讀人並且該方法雄績再次執行步驟40 3。此作法之效果為使得可處理不明確的輸入,亦即多於 一艏類項可被指定予基元並且這些基元因而可被映射在多 於一値常態化基元或詞語上。若在步驟415發現到在目 前的基元之情況下無後钃的詞語,則該動作常式到逹其结 束位置417並且所述方法回返到該語法解析常式之步驟 3 0 5 〇 82.6. 40,000 (請先W讀背面之注意事項再填寫本頁)
T ‘‘ 戈逯甩中a因家悻半(CNS)甲4規烙(210 X 297公货)
經濟部中央標準局員工消费合作社印製 五、發明説明() 圖5顯示出該移轉常式之一實拖例:.由啟始位置5 0 1開始,集合U i + 1 , Q係在步驟5 0 2被敗始ib到空集合 元素然後在步驟5 0 3被取自Q :該元素有一狀態其 稍後將被指定為s。在步驟5 0 4 ,該計數器i d然後被 加 1 ,並且一具辨識i d之最高點係被加至兮析樹T。 兩最高點 w和X然後依據在步.驟5 0 3中自集合Q所 選取的元素,在步驟5 0 5被加至圖形结搆it堆叠 G,最 高點 w具有標記 s以及最高點 X具有標記1 d,一邊框 自《到X以及一邊框自s到最高點(在自集合Q所選 取的元素中所涉及者):在步驟5 0 6 ,被提供以標記s 的 w然後被加至集合U i + 1 , Q 。在步驟5 0 7 ,一檢查 然後被作出,Μ決定是否 Q仍然有下一個元素。若為是 (Υ )的話,此元素係在步驟5 0 8被選取,並且據此, 步驟5 0 5和5 ◦ 6然後被執行。若步驟5 0 7顯示出無 下一個元素存在·則該移轉常式到達结束位置5 0 9並且 所述方法回返到該語法解析常式之步驟3 1 1 。 由啟始位置6 0 1開始,一元素除在步驟6 0 2自集 合 R被取出。該規則之左手邊部分(其披在步驟6 ◦ 2 所取出的元素所參照到)然後在步驟6 0 3被指定予變數 Ν。一檢查然後在步驟6 0 4被作出,Μ決定是否所參照 到的規則含有特徴。此係涇由參照一被儲存在該記憶體中 並自該文法中所推導出的特徵列表而為之。若為是(Υ ) 的話,該整合常式係在步锶6 0 5被叫用。執行該整合 -2 3 - 本紙張尺度適用中國國家標隼(CNS ) Α4規格(21〇Χ 297公釐) . 裝I 訂 Μ (請先閱讀背面之注意事砀再填寫本頁) A6 _B6_ 五、發明説明() 常式之後(其中一違反計數器係被更新),一檢査傺在步 驟606被作出,以決定是否該違反計數器超過了臨界值 threshold。若為是(Y)的話,一檢査僳在步*607 被作出,以決定是否變數 threshold和 new-threshold 為相等。若為是(Y)的話,該埋反計數器之值係在步® 6 0 9被指定予受數new-thireshold,然後,结束位置6 10達到。若為否(N)的話,一檢査偽在步® 608被 作出,以決定是否受數超過了違反計數器。若為是(Y) 的話,步驟609亦被執行,然後,結束位置6 10達到 。若在步想6 0 8發現到變數 new-threshold並未超過 違反計數器,該減降常式之結束位置610則直接達到。 一到達該減降常式之結束位置610時,所述方法回返到 該語法解析常式之步骐3 0 7。既然事實上無任何減降, 該語法解析常式亦將到達其结束位置315,值零被指定 予變數 result (因為集合Uid為空的)。此導致臨界 值在主常式中被提高並且語法解析被再度叫用。
若在步驟604發現到該規則不含待戡,或者是若步 驟6 0 6顯示出該違反計數器並未超過妥數threshold, 則該減降常式繼缅執行步驟6 1 1。步思6 1 1決定出在 該圖形结構化堆叠 G中之所有的節點,而對於此堆叠有 一路徑自 xc到y長度為2|p|-2,其中p為規則p 之右手邊部分之語辭的數目。第一個 y然後在步驟6 1 2被取出並被指定予變數 yc。在步驟6 1 3, —向量 L -24- ------------------_ ----裝------"-----—線 (請先聞讀背面之注意事項再埙寫本頁) 逯用中國國家作半(CNS)甲4规烙(210 X 297 ) 82.6. 40,000 垣濟部中夬桴準局筠工消贷合汴;:'1|)·:.: A6 B6 五、發明説明() 然後藉由自供減降之規則之右手邊部分取有關於語辭之 id被決定出。步驟6 14然後決定出所有的狀態s ,對 此有一節點 w在G中致使該》係yc之一直接後趄者 .以及對此該狀態 s亦可在一 goto列表之登錄(此登 錄你由有關於 w狀態和與目前規則之左手邊部分符合的 語辭所決定出)中被找到。該goto列表傜儲存在記憶鼸 中並且係自文法所推導出。第一狀態 s然後在步思6 1 5被取出並指定予該愛數 sc。在步驟6 1 6, —集合W 然後被産生,其具有所有在步驟614所決定出的節點 作為元素。一檢査然後在步驟617被作出,以決定是否 該集合Ui,j含有一元素u具狀態sce若為是(Y)的 話,步驟6 1 9 &査是否在該圃形结構化堆β G中已經 有一邊框致使來自《之元素偽為ζ的直接後龃者。若為 是(Υ)的話,ζ所指到的id然後在步驟620中被加 至向量L。若在步驟6 19中所加諸的條件不諶足,則步 越621被執行。在步驟621,計數器id係被加1; —被提供以在步驟6 0 5所決定的違反計數器以及被提供 S照到直接後繼節點之節點偽被加至該分析樹 T :兩節 點,一節點U具標記SC以及一節點Z具標記id傺被 加至G ;以及一邊框自U到ζ和邊框自ζ到所有在W 中被提及的節點w亦被加至G。步驊622然後檢査是 否具標記sc的u在集合A中被提到。若為否(N)的 話,步驟623被執行,其中對每一 q, —元素<u, ζ, -裝------訂------線., (請先閱讀背面之注意事項再塡寫本頁) -25-
甲4現格(210 X 297公货) 82.6. 40,000 絰濟部中央標準局員工消s,合作社印.- 306659 A6 B6 五、發明説明() <3 , c a t e r 〇 r y , p r i π i t i v e >傜被加至集合 r ,對該 q現 存的規朗並未有一空的右手邊部分以及對該 q —減降動 作你被賦予在該動作列表之登錄中(對有関於 U的狀態 和有間於該類項的詞語)。若為是(Y)的話,所述方法 组鑛執行步驟6 24。此步思執行步揉6 2 0之後以及在 執行步驟6 2 3之後亦偽被執行。 若在步驟617所加諸的條件並未被淇足,則執行步 驟6 1 8。在步驟6 1 8中,計數器id你被加1 ; 一被 提供以在步驟6 0 5所決定的違反計數器以及被提供參照 到直接後姐節黏之節點係被加至該分析樹 T ;兩節點, 一節點u具檩記sc以及一節黏z具揉記id偽被加至 G ;以及一邊框自u到z和邊框自z到所有在W中被 提及的節點η亦被加至G;u亦係披加至 A和Ui,j。 所述方法然後趄鑲執行步驟624,其中一檢査係被 作出,以決定是否在步琛6 14中有下一掴狀態s。若為 是(Y)的話,此狀態傜在步想625被指定予sc並且 所述方法雄績執行步親6 16。若為否(N)的話,步揉 626檢査是否有下一値 y在步驟6 1 1中被決定出。 若為是(Y)的話,步驟627將此下一艇y指定予yc 並且所述方法趄續執行步驟6 13。若為杏(N)的話, 該減降常式到達結束位置6 2 8並且所述方法回返到該語 法解析常式之步驟307。 圖7顯示出依據本發明該整合常式之一實施例。此常 -2 6 - ------------------^-----裝------、玎------線! (請先閲讀背面之注意事項再填寫本頁) 尽呔張々1边用t國國家«半(CNS)甲4現烙(210 X 297公货) 82.6. 40,000 A6 B6 五、發明説明() 式傜在該減降常式之步驟605被叫用。此常式同樣的可 由該 e -減降常式所叫用(該語法解析常式之步揉3 09 ),但是在此將不作詳細描述。該整合常式利用了儲存在 該記億體中以及由該文法所導出之待撖列表。二進位制解 碼的特戡组群在後述中將稱為"特擻指示"(feature indicator) 〇 由啓始位置701開始,步驟702藉由對右手邊部 分之所宣告的特徵指示決定出後者特撳指示之邐輯交集與 對應之目前的特欺指示,而決定了有效的特戡指示。步驟 7 0 3然後檢査是否在先前步驟中所獲得的每一有效的特 戡指示偽不等於零。若為否(N)的話,則其指示出有所 供給基元之字串、詞語和特擞中所沒有的待戡。在此情況 下,步驟704係被執行,其中若一有效的持欲指示係為 零的話該違反計數器傜被增加某一數目。此步S之後以及 若步驟7 0 3顯示出所有的.有效特戡指示係不等於零的話 •步驟705則被執行。步驟706然後檢査是否所有所 獲得被整合的特戡指示係不等於零。若為否(N)的話, 則其指示出在輸入字串中持擻之間無共通的協定,雖然該 等規則確實要求此點。在此情況下,該違反計數器偽在步 驟707被增加某一數目(對毎一傾等於零之被整合的持 徴指示)。在此情況下亦可以利用加椹數目。步驟707 之後以及若步驟7 0 6顯示出所有所獲得有效的特徵指示 偽不等於零的話,步驟708偽被執行。步驟708藉由 -27- ------------------^-----裝 -------,玎------線 J , (請先閲讀背面之注意事項再填寫本頁) 張、χϋ用中围国家饽半(CNS)甲4觇烙(210 X 29?公;ί ) 82.6. 40,000 A6 B6 經濟部中央標準局員工消5·合作,fl印\ 五、發明説明() 決定出在步驟706中所獲得所有特徽指示,以及對匾於 在右手邊出現乙次所宣告恃激指示之有效待徴指示之組合 ,而決定了一特戡指示Fteapl。步驟709然後藉由取 右手邊部分所有所宣告特徽指示之組合的相反者,而決定 了一特擻指示Ftei»p2。若在左手邊部分所宣告的特擞指 示亦係被宣告在右手邊部分的話,對應之目前的待徴指示 偽藉由區分而決定出 Ftempl和Fteisp2之組合與所宣告 的特徴指示而被決定。若在左手邊部分所宣告的特徴指示 未在右手邊部分中被宣告的話,則目前的特擻指示偽由取 出所宣告的待徴指示之值而獲得。步驟711然後檢査是 否所有在步驟710中所獲得的特徵指示係不等於零。若 為否(N)的話,’其顯示出該等特戡無法依據該等規則而 交遞。在此情況下,在步驟712該違反計數器對每一個 所獲得等於零之目前的特徴指示係增加。該整合常式然後 到達结束位置7 1 3。若步驟7 1 1顯示出所有所獲得的 持徽指示係不等於零的話,則結束位置7 1 3係直接逹到 ,所述方法回返到該減降常式之步驟605。 必須注意的是,依據本發明之整合機制(在先前自整 合機制一可能的實施作法已被給定)係亦可適用在一語法 解析程式,此語法解析程式不一定霈要是為一GLR—語 法解析程式。 此方法和裝置之多樣化現將參照一些實例詳細描述之 〇 -2 8 _ I-- 一 (請先閲讀背面之注意項再填寫本頁) —裝. 訂. —線7 4¾¾、.戈通用中國國家找苹(CNS)甲·!現烙(21U X 297公:^ ) 82.6. 40,000 A6 B6 308659 五、發明説明() 在第一例子中,所述方法和裝置偽用於字元辨識。 假設一光學信號s傜由一行一行地藉著一掃描裝置掃 描一載有影像的介質而得。信號S係由一光電轉換器(含 於圔1之轉換單元101中)轉換成為一電子信號。此信 號係被分辨並以一影像元素圖形之形態鍺存在一頁次缓衝 器中。此影像元素圖形然後被讀出並轉換成一基元流P和 一被提供以特擻组群之常態化基元流L。 一種被執行來轉換此一影像元素圖形成為一条列基元 並對這些基元作語法解析之方法之一可行較佳實施例係顯 示在圖8中。 由啓始位置8 0 1開始,被饋至轉換器之影像元素圖 形偽在步驟802被區分成為線條。在步驟803,每一 線條然後被分隔成一些位元映射行(bit nap colutn), 毎一行為一個影像元素寬。每一位元映射行將包含零或多 屆影像元素蕞集(Pixel c luster)。步駿ί 8 0 4然後決 定出影像元素遘集的數目、其長度以及對於每一影像元素 蕞集其位置。在步驟8 0 5,該等位元映射行然後依據在 先前步驟所獲得之資料被標記以一類項,以及相同類項之 鄰接的位元映射行傑被結合。在此同時,移除無法被结合 的位元映射行是較為有利的,除非該等位元映射行係為其 中無影像元素叢集者。在步驟806·毎一最後所得到的 位元映射行(下述中稱為一基元)然後被賦予一常態化基 元,此常態化基元依據該基元所被標記的類項偽為一類項 -29- 用中aa家揉準(CNS)甲 4 現恪(210 X 297 公货) 82.6. 40.000 ---------------------;-----裝------,玎------線' , (請先閲讀背面之注意事項再瑣寫本頁) 經濟部中央標準局貝工消"合作:"*1'、,': 經濟部中央標準局貝工消*13:-',ίί,''-: A6 B6 五、發明説明() 之一原型。而且,每一位元映射行偽藉由賦予持徴而依據 該等由每一基元所含的影像元素裘集而詳細地被給出,所 述特戡亦傜含於該文法中。在步驟8 0 7,被提供以特撤 之常態化基元(此等特激係被结合以形成然後被二進位制 方式解碼的特戡組群)然後被結合成為字串,並且此等字 串被接績地饋至該語法解析單元,之後,該結束位置80 8係達到。 必須注意的是,所述用於將一影像元素圈形轉換成為 一糸列基元之方法係可廣泛適用,而非侷限於使用在此處 所描述的組合。常態化基元和特徴以及該文法之一適酋蘧 取,極有肋於此方法之成功«施。此類型之一適當選擇係 顯示在圖9a—9b中。六種基元類項偽被B分出,對應 於下列顯示在圖9 a中的常態化基元:blank (空白)、 vertical bar (垂直條)、horizontal bar (水平條)、 double (雙條)、triple (三條)以及endaark(結束符 號)。被賦予一基元之待歡係由含於該基元中彩像元素叢 集之幾何形態所決定。在賦予該等特徴中,係利用一假想 的體線(bodylins )和基線(baseline )(參見圖9 c )。最後,一字组空間你假想成位在詞語結束符號上, 並且此完成了欲被餓至該語法解析單元的字串。 必須注意的是,上述類項和對應常態化基元之應用並 非侷限於在此應用中所描述之組合,而是此等類項和常態 化基元偽可更廣泛地應用。一適用於處理一些顯示在圖9 -30- 逯用中國国家棵苹(CNS)甲4规烙(210 X 297公釐〉 82.6. 40,000 ------------------《------裝------,玎------! (請先閲讀背面之注意事項再項寫本頁) Α6 Β6 五、發明説明() a—9b中詞語和持徵之簡單文法之一實例,偽給出在表 1中。目前的偽適用於辨識字元” a ”、” h ”和” η ” ,並且亦可決定出是否這些字元為揉準的或粗醱的。所示 的文法有其非為被傳送之分離的字元,而是整個字组的特 性。與稍後對修正機制之討論有藺者,其將顯示出此為特 別有利。 必須注意的是,由該語法解析程式所作完整的字组( 而非分離的字元)之傳送並非侷限於此處所描述之组態, 而是其亦可睡用於此。 〔表1〕 (請先閲讀背面之注意事項再填寫本頁) •裝 ΤΓ
經濟部中央標準局貝工消ίΗ合作;J //Ftrs = CENTER HIGH-CENTER BOLD NORMAL VIOL LONG-UP LONG-DOWN //Weight = BOLD NORMAL 0 Character(Weight) : a(Weight). 1 Character(Weight) :h(Veight). 2 Character(Weight) :n(Weight). 3 Characters(Weight) :Character(Weight). A Characters(Weight) :Characters(Weight),Character(Weight). 5 START :WORD. 6 WORD :Characters(Weight),*endmark· 7a(Weight):*double(CENTER),^triple(CENTER),^vbar(CENTER,Weight),*blank. 8 h(Weight) :*vbar(LONG-UP,Weight),*hbar(HIGH-CENTER), *vbar(CENTER,Weight),*blank. 9 n(Weight) :*vbar(CENTER,Weight),*hbar(HIGH-CENTER), *vbar(CENTER,Weight),*blank. -3 1 線 通用中a国家桴半 (CNS) r 4说烙(210 X 297公货) 82.6. 40.000 A6 _B6_ 五、發明説明() 七項待徵被定義於此文法中。與該文法之語辭有两的 特徴组群係在對睡的語辭之後以括弧指示出。一項待徽偽 被明示地定義,含有僅一項特擻的特徴组群亦傜被明示地 定義。此文法係以分別被顯示在表2、3以及4之動作列 表、goto列表以及持戡列表之形態被鍺存在記憧β中。 〔表2〕 (請先閲讀背面之注意事項再項寫本頁) 經濟部中央標準局S工消費合作杜印\
State $ *blank ^double *endmark *hbar -triple *vbar @ALL 0 sh7 sh8 1 acc 2 sh7 shlO shS 3 re3 4 reO 5 rel 6 re2 7 shll 8 shl2 9 re 4 10 re6 11 shl3 12 shl4 13 shl5 14 sh!6 15 re7 16 re8/re9 〔表3〕 -32- 裝· 訂· .線· 82.0. 40,000 边用中as家悌竿(CNS)甲4現丨各(21D X 297公» ) 308659 五、發明説明( A6 B6
State Character Characters WORD a h n 0 3 1 2 1 4 5 6 2 9 4 5 6 [表, 4〕 0 ((0011000) (001100)) 1 ((0011000) (001100)) 2 ((0011000) (001100)) 3 ((0011000) (001100)) k ((0011000) (001100) (0011000)) 5 (()()) 6 (()(0011000)()) 7 ((0011000) (1000000) (1000000) (1000000 , 0011000)()) 8 ((0011000) (0000010 , 0011000) (0100000) (1000000 , 0011000) ()) 9 ((0011000) (1000000 , 0011000) (0100000) (1000000 , 0011000) ()) (請先閱讀背面之注意事項再填寫本頁) 經濟部中央標準局貝工"·"合作:^印V: 在表4中,行數偽直接對應於來自顯示在表1中該文 法之規則。一對括®係對睡於來自一文法上規則之語辭。 在一對括弧之間,有零値、一個或多個二進位制编碼的持 戡组群隨附於(有閎於)對睡的語辭。定義在文法中之特 擞被轉換成二進位制编碼的持戡组群之方式稍後將描述。 在現將詳細說明之方法的例子中,係假設轉換單元把 下一串的常態化基元饋至該語法解析單元,此常態化基元 字串偽被提供以目前的特徵组群: -3 3 - 文通用中國國家桴'半(CNS)甲4巩格(21U X 297公货) 82.6. 40,000 A6 B6 五、發明説明() double (CENTER) tripe (CENTER) vbar (CENTER, BOLD) b1 vbar (CENTER, BOLD) hbar (Η IGH-CENTER) v b a r ( C E N T E R , B 0 L D ) b 1 e n d π a r k 〇 對應的基元字串偽顯示在圖9d中。為淸楚起見,特 徴组群並未被以二進位制编碼形態顯示出。在整合常式之 討論中,此二進位制编碼將被利用到。 變數” result ”,” threshold”,"delta-threshold”, ” new-threshold”在步琛2 0 2 (圖2)被啓始化之後, 由語法解析單元所傳送的字串僳披讀入並在步思2 0 3以 一结束符號$作結束。 result = 0 threshold = 0 delta-threshold = 0 ne«--threshold = 0 該語法解析常式然後在步驟2 0 5被BM用。 由啓始位置30 1 (圔3)開始,計數器、i、id、違反 計數器、圖形結構化堆叠G以及樹T係在步® 302被 啓始化,並且元素vO被加至集合U〇,〇 i = 0 i d = 0 違反計數器=〇 G = 0 Τ = 0 -34- 表呔怅遇用中國国家棵苹(CNS)甲4規格(210 X 297 乂釐) 82.6. 40,000 —---------------_-----裝------.玎------線,' (請先《讀背面之注意事項再塡寫本頁) A6 B6 五、發明説明() U 0,0 = { vO} 一詞語和與第一基元ai有關的特徽亦在步驟3 0 2被讀 入。 目前的基元aO, 目前的詞語和待擻:double (CENTER) 計數器然後在步驟303被啓始化為0,該等集合R, Re 和 Q被啓始化為空集合,以及集合 A被令為等於U0,0 <請先閲讀背面之注意事项再填寫本頁) —裝. 訂. 經濟部中央標準局8工消费合作社印¾ R = Re = Q = { } A = { v Ο } 一檢査然後在步驟304被作出,以決定是否 Α為一空 集合。由於A並非一空集合,致使該動作常式被叫用。 該動作常式偽詳示於圖4中。由啓始位置4 0 1開始 ,一元素傺在步驟402中被自 A移除,並且此元素變 -35- 各纸張尺度國S家樣準(CNS)甲4规格(210 X 297公;?!·> 82.6. 40,000
嫌濟部中夹棣準為ΛΧ消费合诈:i-J, V 308659 A6 _B6__ 五、發明説明() 成為目前的節點 vc。在步缀403,動作列表然後對詞 語” dQuble”和狀態 〇被謓取。該動作列表(其係由該 文法導出)傜顯示在表2中。此傳送了動作"shift 7〃 (移轉7)。在步琛405, —檢査係被作出,以決定是 否該動作為"accept"(接受)。由於此為否(N)的話 ,致使步驟407檢査是否該動作為"shift (移轉 s )。由於為是,致使在步揉4 0 8, <v0,7,double,a0> 係作為一元素被加至該集合Q。 Q = Q{ < v 0 , 7 , d 〇 u b 1 e , a 0 > } 步驟413然後裣査是否下一動作出現在於步S403中 所決定的登錄中。由於為否(N),之後,一檢査然後在 步思415被作出,以決定是否下一詞語已披指定予目前 的基元。由於為否(N),致使該動作常式到達结束位置 4 1 7並且所述方法回返到該語法解析常式之步驟3 0 5 〇 既然步驟305 (圖3)已經被處理,所述方法组績步驟 3 10。在此,一檢査然後被作出,以決定是否集合 A, R和Re皆為空集合。由於為是(Y),致使步驟31 1 叫用該移轉常式。 該移轉常式係詳細顯示在圖5中。由啓始位置501開始 ,在步驟502,集合U1,0偽被啓始化成空集合。 -3 6 - --------------------U-----裝------.玎------尊 (請先閲讀背面之注意事項再填寫本頁) 々I通拜]中國國家桴準(CNS)甲4規格(21〇 X 297公釐) 82.6. 40,000 經濟部中央標準局8工消?合作:::^\ A6 B6 五、發明説明() U 1, 0 = { } 在步驟503, —狀態偽被取自Q。 s = 7 froia elenent < v 0 , 7 , d o u b 1 e , a 0 > 在步驟504,計數器 id然後被增加1 ,並且在T 一 節點係被産生為具標記i d並被提供以有關於a i的語法 解析資料。 i d = 1 T: 1 0 (*double [CENTER] aO)
在步摄[505,然後下列者偽被加至G : —節點Η具標 記 s = 7、一節點X具標記id = 1、一邊框自η到X 、以及一邊框自X到 V 0。 G: vO xl w7 在步驟506,具標記s的w然後被加至集合U1,0。 -3 7 - —--------------------裝------ir------線~ - (請先W讀背面之注意事項再塡寫本頁} 尽4氏:'UliS用中國凶孓丨戈半(CNS)甲)规丨各(21U X 29Γ公,货) 82.6. 40,000 經濟部中央標準局貝工消費合作fi印,乂 A6 B6 五、發明説明() U 1,0 = { »7 } 在步驟507,—檢査傜被作出,以決定是否仍有更多傾 元素存在於 Q中。由於為否(N> ,致使所述方法回返 到該語法解析常式自此繼績步驟3 12 (圔3),其中該 計數器像被增加1。 步琢3 1 3然後檢査是否U 1,0為空的。由於為否(N) ,致使步驟316檢査是否有下一緬基元存在。由於為是 (Y),致使在步183 18·詞語和特擻被讀入。 目前的基元:a 1 目前的詞語和特擞:(《triple 【CENTER]) 然後,j, A, R, Re以及Q在步铤303被啓始化。 U 1,0 = { «7 } -38- u氏mi用中囷因家桴羋(CNS) f 4規格(210 x 297公货) 装------Tr------線 r - (請先閲讀背面之注意事項再塡寫本頁) 308659 A6 B6 經濟部中央標準局3工消*ΓΗ合泎.^-.l'^- 五、發明説明() R = R e = Q = { } 步驟304然後檢査是否該 A為空的。由於為否(N) ,A當然含有該元素W7 ,致使該動作常式在步駿305 被叫用。 由啓始位置401開始,此元素偽在步揉402被自 A中取出並且其變成為目前的節點vc。 在步驟403,有囫於目前的詞語之動作列表的登錄 以及有闋於vc之狀態然後被決定出,並且第一動作自此 被讀出。此産生了 shift 11 (移轉11)。步驟405然 後檢査是否該動作被"接受#。由於為否(N),所以步 驟407檢査是苔該動作為一移轉動作。是的,s具有值 11。該 tuple <»7 , 11, triple , al> 然後在步驟 4 0 8 被 加至Q〇 s - 1 1 -39- 通用中國国家桴準(CNS) T 4规丨各(2iu X 297公,货) 82.6. 40,000 ------------------_-----裝------.灯-----|亨 (請先閲讀背面之注意事項再填寫本頁) 五、發明説明() A6 B6 經濟部中央標準局貝工消"合作;1^·-'一 Q = { <w7,11,triple,al> } 一檢査然後在步驟413被作出,以決定是否另有下 一傾動作在由步驟4 0 3所決定的登錄中。由於為否(N ),所以一檢査然後在步思415被作出,以決定是否下 一個詞語已被指定予目前的基元。由於此為否(N),所 以該動作常式到達結束位置417,並且所述方法回返到 該語法解析常式之步驟305 (圖3)。 自此进缅,步驟3 10檢査是否該等集合A, R以及 Re 為空的。由於是的(Y),所以該移轉常式你在步费ί 3 1 1被叫用。 由啓始位置50 1 (圔5)開始,步驟502將集合 U2,0啓始化為空集合。 U 2 , 0 = { } 步驟5 0 3然後自Q之一 tuPl8取一狀態。 s = 11 .自 t u p 1 e < w 7,11, t r i p 1 e,a 1 > 在步驟5〇4, id 然後被增加1並且一節點偽被加 至T0 '纸张~*週用中g國家標準(CN.S) ί 4规烙(210 x 297公货) 82.6. 40,000 (請先閲讀背面之注意事項再塡寫本頁) t 丁 "Γ 五、發明説明() id T: 1 Ο («double 2 0 («triple A6 B6 [CENTER] aO) [CENTER] al) 經濟部中央標準局員工消泞合作:fiM,k 下列者然後在步驟505被加至G ·. —節點w具標 記 s=ll, —節點X具標記id=2, —邊框自w到X以 及一邊框自X到 w 7。 G: vO xl »7 <r- x2 «11 在步驟506,具標記s的w然後被加至集合U2,0。 U 2 , Ο = { w 11 } 步驟507檢査是否有多傾元素存在於 Q中。由於為否 (N),因此所述方法回返到該語法解析常式。 所述方法趄續步驟3 1 2,其中該計數器 i俗被增加1 -4 1 -------------------^ -----裝------訂------線 (請先閲讀背面之注意事項再填寫本頁) •卜適用中國国家摻準(CNS)甲4規格(21ϋ X 297公Ϊ ) 82.6. 40,000 A6 B6 五、發明説明() 步驟3 1 3然後檢査是否該集合U2,0為空的。由於 為否(N),因此步驟3 16檢査是否有下一値基元存在 。由於為是(Y),因此在步驟3 18此具有詞語和特徵 的基元被讀入。 目前的基元:a2 目前的詞語和特徵:(* V b a r [ C E N T E R】) (請先閱讀背面之注意事項再瑣寫本頁) 裝 然後在步驟303, j, A, R, Re和Q被啓始化 U 2 , 0 = { w 11 訂 線 經濟部+喪*♦屬工消f#tt_a 步驟3 04然後檢査是否該集合 A為空的。由於為 否(N),因此該動作常式在步驟305被叫用。 由啓始位置401開始,一元素在步驟402自 丨 中被取出:vc = Hll。在步驟40 3.該登錄在有關於目 -42- 本紙张又廑邊明国家捸率(CNS)甲4说格(210 X 297公笔) 82.6. 40,000 經濟*中夹樣攀屬麄工消»合伸ti印1 A6 B6 五、發明説明() 前的詞語(亦卽v b a r)和v c (亦卽11)之狀態的動作 列表中被決定出,此時,一存在於此處的第一動作偽被讀 入。此産生出動作〃 shift 13〃 (移轉13)。步驟40 5然後檢査是否該動作為被〃接受〃。由於為否(N), 此時,步驟4 0 7檢査是否該動作為〃 s h i f t s "(移轉 s )。由於是如此,因此tuple <wll,13,vbar,a2>偽作 為元素被加至集合Q。 Q = { <Hll,13,vbar,a2> } 步驟413然後檢査是否有下一傾動作在由步驟40 3所決定的登錄中。由於為否(N),此時,步费[4 15 然後檢査是否下一個詞語已被指定予目前的基元。由於為 否(N),所以該動作常式到達該結束位置4 17並且所 述方法回返至該語法解析常式之步驟3 0 5。 自此繼绩,步驟3 10檢査是否該等集合 A, R以及 Re 為空的。由於是的(Y),所以該移轉常式像在步驟 3 1 1被叫用。 由啓始位置501開始,步驟502將集合U3,0啓 始化為空集合。 U 3, 0 = { } -43- -袈------訂------線 (請先閲讀背面之注意W-項再填寫本頁) ( ♦紙Λ尺中a国家樣準(CNS)甲4規I各(210 X 297 82.6. 40 000 經濟部+典«攀爲β工消f鳕钍印a A6 B6_ 五、發明説明() 在步驟503,由關於一元素之S偽被取自Q。 s = 13,自元素 <wll,13,vbar,a2> 在步驟5 0 4, id 然後被增加1並且一節點係被加 至 T : i d = 3 T: 1 0 («double [CENTER] aO) 2 0 (^triple [CENTER] al) 3 0 Ovbar [CENTER, BOLD] a2) 步驟505然後將下列者加至G : —節點 w具標記 s = 1 3 . —節點X具標記i d = 3 , —邊框自w到X以及一 邊框自X到 w 11。 G: vO xl w7 <r x2 wll x3 <- wl3
在步驟506,具標記 s 的w然後被加至集合U 3,0 〇 -4 4- 本紙張尺·度逡用中國國家標準(CN_S)甲4規格(210 X 297公釐) 82.6. 40,000 ----------------------------裝------tr------ (請先閲讀背面之注意事項再填寫本頁) 一 經濟部中喪«♦局β工消费合作杜印3 A6 B6 五、發明説明() U 3,0 = { W13 } 步驟507檢査是否有多値元素存在於 Q中。由於為否 (N),因此所述方法回返到該語法解析常式。 在該語法解析常式中,所述方法繼績步驟3 1 2,其 中該計數器i係被增加1。 步驟3 1 3然後檢査是否該集合U2,0為空的。由於 為否(N),因此步驟3 16檢査是否有下一®基元存在 。由於為是(Y ),因此在步驟3 1 8此具有詞語和特徵 的基元被讀入。 目前的基元:a3 目前的詞語和持徵:Oblank) 在步驟303, j, A, R, Re和Q然後被啓始化。 -45- --------------------------裝------.玎------^ ~ (請先Μ讀背面之注意事項再填寫本頁) 本紙诔又廋適用中國国家ίί準(CNS)甲4規丨各(210 X 297公釐) 82.6. 40,000 經濟部中典«攀«<*工;«»合作社印a A6 B6 五、發明説明() A=U3,0={h13} R—Re=Q- {} 步驟304然後檢査是否該集合 A為空的。由於為 否(N),因此該動作常式在步思305被叫用。 由啓始位置401開始,一元素在步驟402自A 中被取出:vc = »13。在步揉403,該登錄在有鼷於目 前的詞語(亦即 b 1 a n k)和v c (亦即13)之狀態的動 作列表中被決定出,此時,一存在於此處的第一動作係被 謓入。此産生出動作〃 shift 15"(移轉15)。步驟4 05然後檢查是否該動作為被"接受"。由於為否(N) ,此時,步驟407檢査是否該動作為〃 shift, s"(移 轉 s )。由於是如此,因此在步驟408 tuple <wl3,15,*blank,a3>係作為元素被加至集合Q。 Q = { <w 1 3, 15,*b 1 ank , a3> } 步驟413然後檢査是否有下一傾動作在由步驟40 3所決定的登錄中。由於為否(N),此時,步驟41 5 撿査是否下一個類項已被指定予目前的基元。由於為否( -4 6 - —----------------------裝------.玎------線 (請先閲讀背面之注意事項再填寫本頁) 本紙ft尺廋通用中國国家.樣準(CNS)甲4規烙(210 X 297公藿) 82.6. 40,000 A6 B6 經濟部中典標婆局β工消#合作杜印3 五、發明説明() N),所以該動作常式到達該結束位置4 17並且所述方 法回返至該語法解析常式之步驟3 0 5。 自此繼續,步驟3 10檢査是否該等集合 A, R以及 Re 為空的。由於是的(Y),所以該移轉常式傜在步驟 3 1 1被叫用。 由啓始位置501開始,步驟5 02將集合U4,0啓 始化為空集合。 U 4 , 0 = { } 在步驟503, —狀態自偽被取自Q: s = 15 ,自 t u p 1 e < w 13 , 1· 5,b 1 a π k , a 3 > 在步驟504, id 然後被增加1並且一節點傜被加 至T : id = 4 T: 1 0 («double [CENTER] aO) -47- (請先閲讀背面之注意事項再堉寫本頁) .裝· 訂. *線 本紙ft尺度通用t國国家標準(CNS)甲4规格(210 X 297公货) 82.6. 40 000 A6 B6 五、發明説明() 2 0 («triple [CENTER] al) [CENTER , BOLD] a2) 4 0 (*blank a3) (請先閲讀背面之注意事項再填寫本頁} 步驟505然後將下列者加至G : —節點w具標記 s = 15, —節點x具標記id = 4, —邊框自η到x以及一 邊框自X到Vi 13。 裝 G: vO xl w7 f- x2 wll x 3 »13 f- x 4 f- h 1 5 訂
在步驟506,具標記 s 的w然後被加至集合U Μ 經濟部中央標準局S工消·ΓΗ合作:<t.‘UJ't': -- ο 法 ο 5 ) 方 4, 驟 N 述 U 步 ί 所。 否 1 為 加 値返 , 多回 2 有法 1 否方 3 是述 驟 査所 步 檢此 鑕 7因 繼 於 增 由 被 〇 0 係 中式 i Q 常 析 器 於解 數 在法 計 存語 該 素該 中 元到 其 用中SS家彳柔芈(CNS>甲4規格(210 X 297公it > 82.6. 40,000 經濟部中央標準局3工消"合诈;^.πν: A6 B6 五、發明説明() i = 4 步驟3 1 3然後檢査是否該集合U2,0為空的。由於 為否(N),因此步驟3 16檢査是否有下一傾基元存在 D由於為是(Y),因此在步驟3 18此具有詞語和特徵 的基元被讀入。 目前的基元:a4 目前的詞語和特徴:(*vbar) [CENTER BOLD] 在步驟303, j, A, R, Re和Q然後被啓始化。 j = 〇 A=U4,0= {wl5} R = R e = Q = { } 步驟3 0 4然後檢査是否該集合 A為空的。由於為 否(N),因此該動作常式在步驟305被叫用。 -4 9 - ------------------^-----裝------.玎------線,ί (請先閲讀背面之注意事項再堉寫本頁) 尽呔HUP]中國國家挖準(CNS)甲4規格(21ϋ X 297公釐) 82.6. 40,000 經濟部中央標準局貝工消赍合作江印1/: A6 B6 五、發明説明() 由啓始位置401開始,一元素在步驟402自A 中被取出:vc = wl5。在步驟40 3,該登錄在有關於目 前的詞語(亦邸vbar)和vc (亦邸15)之狀態的動作 列表中被決定出,之後,一存在於此處的第一動作係被讀 入。此産生出動作〃 reduce 15 "(減降7)。步驟4 0 5然後檢査是否該動作為被〃接受#。由於為否(N), 因此步驟4 0 7檢査是否該動作為"reduce p 〃(減降 P )。確實是如此(Y)。步驟410檢査是否規則 7 為一具有一空的右手邊部分之産生規則。由於為否(N) ,之後,在步驟412,對於 G中vc之每一直接後雔 者X, —形態為<vc,x,p,category,ai>之元素偽被加至 集合 R =丨 <wl5,x4,7, vbar, a4> } 步驟413然後檢査是否有下一锢動作在由步駿40 3所決定的登錄中。由於為否(N),此時,步顏1415 檢査是否下一健詞語已披指定予目前的基元。由於為否( N),所以該動作常式到達該結束位置4 17並且所述方 法回返至該語法解析常式之步驟3 0 7。 由步驟307開始,步驟310然後決定出是否該等 集合 A, R以及Re為空的。此為否(N),因為R不 -5 0- 11.--------------,-----裝------ir------I (諝先閲讀背面之注意事項再塡寫本頁) 本呔】’^又度通用中國國家桴準(CNS)甲4规格(210 X 297公货) 82.6. 40,000 A6 B6 五、發明説明() 是空的。步驟307然後經由步驟304和306達到。 該減降常式傜在步驟307被叫用。 由啓始位置60 1開始,一元素係自 R中被取出並 在步驟602被讀入。在步琛603,規則 7之左手邊 部分然後偽被指定予箩數N。 H = a(Weight) 步驟6 04然後檢査是否有特擻被宣告於規則 7中 由於為是(Y),因此該整合常式偽在步驟605被叫 用 (請先聞讀背面之注意事項再填寫本頁) 裝 訂 緩濟部中央棣準局^合作."3" 自啓始位置701趄續,步驟702藉由決定在右手 邊部分的毎一個所宣告的待擻指示與對應之目前的特擻指 示的交集,而決定出有效的特徵指示。有闋的所宣告的特 徴指示係由整合常式自顯示在表4中特歡列表之規則 7 中讀出。目前的待徵指示係以二進位制形態顯示於此處以 示出所述方法。 a(Weight): «double(CHNTER), *triple(CENTER), ”BAR(center,Weight),《blank 0 -5 1- 〔这3) tSIS;榨準(CNS)甲4現格(210 X 297公货) 82.6. 40,000 經濟部中央標準局员工消ίΗ合汴:if.t'lV.: A6 _ B6 五、發明説明()
Fdec1 0011000 1000000 1000000 1000000,0011000
Fact 1 0 0 0 0 0 0 1 0 0 0 0 0 0 10 0 0 0 0 0 , 00 1 1 0 0 0 ^validated 1000000 1000000 1000000,0011000 步驟7 Ο 3然後檢査是否所獲得的交集皆非空的。由 於為是(Υ),因此關於特擞之未出現,無發現到違反。 在步驟705,藉由決定出所有屬於該組群之有效的的特 戡指示之交集,一整合的待徴指示然後偽對在右手邊部分 之每一個被宣告乙次以上的特戡組群被決定出。在目前的 例子中,有兩個组群,即組群〃 CENTER 〃和組群# «eight 〃,而且必須注意的是,該組群"C ΕΝ T ER 〃僅含有一項特 徴。在右手邊部分中,有三項待徽指示屬於該組群〃 - CENTER"以及有一項特徵指示屬於該組群〃 Weight"。此 産生出 卩111^【16<1(0£!^£[〇 = 1000000。步揉 7 0 6 然後 檢査是否在先前步驟中所獲得整合的持徵指示並非空的。 由於為是(Y),因此關於該等特戡指示之間的一致性並 無發現到違反。所述方法然後趄續步驟7 0 8。在步驟7 0 8 , Ftenipl 係藉由在所有於先前步驟中所獲得整合的 特戡指示以及存在於右手邊部分之獨特的有效特徴指示上 執行一邏輯OR蓮算而決定出。此産生出 Fteapl = -5 2 - 这用中國国家ίί準(CNS)甲4規格(2ΐϋ X 297 乂釐) 82.6. 40,000 -----------------^ -----裝------1T------身 (請先Η讀背面之注意事項再塡寫本頁) 經濟部中央標準局貝工消e^itiiMJ.';.: A6 __ B6_ 五、發明説明() ?0£1^£{?01?卩\^1$111 = 1010000。步驟 7 0 9 然後被執行 ,其中該特徴指示Ft βιπρ2偽藉由對所有來自右手邊部分 之所宣告的特徵指示之組合取負號而決定出。
Ftemp2 = HON (1000000 OR 0011000) = 0100111 步驟7 1 0然後對左收邊部分決定出目前的特戡指示 。亦宣告在右手邊部分中屬於一組群之目前的待擻指示俱 決定自: F(Group)act = (Ftenpl OR FTemp2) AND F(Group)decl F〇leight)act = (1010000 OR 0100111) AND 0011000 =1110111 AND 0011000 = 0010000 步驟7 1 1然後檢査是否對右手邊部分語辭所獲得的 所有目前的特徵指示偽非空的。由於為是(Y),因此關 於待激之傳送無發現到違反。結束位置7 1 3然後達到並 且所述方法回返到該減降常式之步驟5 0 5。
所述方法繼續執行步驟606,其中一檢査係被作出 ,以決定是否該違反計數器有一超過該荽數 THRESHOLD -53- iHiii用中國國家疗準(CNS)甲4現格(21U X 297公釐) 82.6. 40,000 ---------------------^-----裝------.玎------線- (請先聞讀背面之注意事項再填寫本頁) 經濟部中央桴準局員工消费合作;1,印公 A6 B6 _ 五、發明説明() 之計數。由於為否(N),因此步驟6 16被執行。在步 驟616,那些為是(Y)者偽被決定出,對此在 G中 有一自 xc (亦即x4)到y長度2*4-2之路徑。此産 生出y = xl。第一値y然後在步琛6 1 2被取出並被指定 予愛數yc。 y c = x 1 〇 步驟613然後藉由自所減降規則之右手邊部分取屬 於該等語辭的id而決定了 L。 L = (1,2,3,4) 在步驟6 1 6,所有的中態 s偽被決定出,對此有 一 w致使該w係yc之一直接後逝者,以及亦致使該狀 -態s偽在goto列表(其偽由鼷於該w之狀態和對應於 目前規則之左收邊部分的語辭所決定出)之登錄中找到。 査詢G將顯示出有yc之一直接後繼者,亦即VO。所隨 附的狀態傜 s = 〇。對狀態S = 0 (有關於W的狀態)和語 辭#在”査詢 goto列表得出s = 4。此狀態在步驟6 15 被令為目前的狀態sc。 s c = 4 -54- —--------------4-----裝------.玎------M (請先聞讀背面之注意事項再填寫本頁) 遇用中國国家桴半(CNS)子4現格(21U X 297公* ) 82.6. 40,000 308659 五、發明説明( 步驟6 16然後指定w = vO作為一元素予集合W。 {Vi 步驟6 1 7然後檢査是杏有一 u為集合U4,0之一 元素以及是否有關於u的狀態偽等於sc。由於為否(N ),因此步駿[618偽被執行。在步驟618, id 俱被 增加1,並且在 T中一節點偽被産生具一標記id,左 手邊部分之語辭具待徽以及一指到其他id之指檫(在步 驟6 13中所決定)。 i d = 5 T : 1 0 (^double [CENTER] aO] —---------------一-----裝------,玎------線、 (請先閲讀背面之注意事項再塡寫本頁) («triple [CENTER] al] 經濟部中央標準局3工消CT合作:x'tMv: 0 (# v b a r 4 0 («blank [CENTER , BOLD] a2] a3) 5 0 (a [BOLD] (1,2,3,4)) -5 5 - 82.6. 40,000 氏峒中aa家作準(CNS)甲4规丨5· (210 X 297公釐) A6 B6 308659 五、發明説明() (請先閲讀背面之注意事項再填寫本買> 在步驟618,亦自G移除在步驟611中對yc所 決定的路徑,並且有一具樺記sc::4之節點u、一具標記 id = 5之節點z、一自(!到z之邊框、自2到w之邊 框、W中所有*被加至G,以及具標記sc = 4之u係被 加至集合 A和U 4 , 0。 G:v〇4- z54- u4 A = { u4 } U4,0 = { «15 u4 } 步驟624然後檢査是否多個狀態 s在步驟6 1 4 中被找到。由於為否(N),因此所述常式績行步驟6 2 6,在此處一檢査偽被作出,以決定是否步驟6 1 1找到 了多個y。此亦為否(N> ,因此结束位置628達到, 其中所述方法回返到該語法解析常式之步驟3 0 7。 烴濟部中央標準局w工消Ir'^itktll'u 査並查 檢 A 檢 1 。的 中的作 其空所 , 為中 到 β 4 達R ο 細及 3 0以驟 1 R 步 3 , 作 駿Λ缠 步合繼 , 集 5 缠否 ο 逛是 3 7 定驟 ο 決步 3 以此 驟 ,因 步出 , 自作的 披空 係非ο 82.6· 40,000 衣紙通用中國國;桴準(CNS)甲4現格(210 X 297公货) 308659 A6 經濟部中央標準居貝工消1τ-<ί^'.Γ·.ί-'-Ν^ B6 五、發明説明() 該動作常式係在此步缀被ΠΜ用。由啓始位置401繼 續,一元素偽自 A披移除並且此元素偽被令為目前的節 ,黏 vc〇 vc = u4 步驟403然後對有関於目前的基元(亦即 *vbar [CENTER, BOLD】))和對由闋於 vc (亦ΕΠ 4 )之狀 態決定出登錄,並且第一指定的動作係自此被讀入。此得 出動作〃 reduce 0# (減降0)。在步驟405, —檢査 然後被作出,以決定是否該動作為被''接受w。由於為S (N),因此步驟407檢査是否該動作為〃 shift s 〃 (移轉s)。確實是如此(Y)。一檢査然後被作出,以 決定是否規則 〇為一具有一空的右手邊部分之産生規則 。由於為否(N ),之後,步驟4 1 2對於G中v c 之每一直接後繼者X ·將一形態為<vc,x,p,cat,ai>之 元素傜被加至集合R。 R = { <u4,z5,0,*vbar,a4> } -57- ϋ乂Hi通用中國国家掊半(CNS)甲4規格(210 X 297公坌) 82.6. 40,000 —---------------_ ------裝------tr-----—線 (請先閲讀背面之注意事項再填寫本頁) 經濟部中央標準局貝工消费合作.'^54.>- 3G8659 A6 _B6_ 五、發明説明() 步驟413然後檢査是否有下一艏動作在由步驟40 3所決定的登錄中。由於為否(N),此時,步驟415 檢査是否下一健詞語己被指定予目前的基元。由於為否( N ),所以該動作常式到達該結束位置4 17並且所述方 法回返至該語法解析常式之步驟3 0 7。 由步驟307開始,步缀310然後決定出是否該等 集合 A, R以及Re為空的。此為否(N) ·因為R不 是空的。步驟307然後經由步揉304和306達到。 該減降常式係在步驟3 0 7被叫用。 由啓始位置έ〇 1開始,一元紫偽自 R中被取出並 在步驟602被讀入。在步驟603,規則 〇之左手邊 部分然後偽被指定予變數Ν。 N = Character(Weight) 步驟604然後檢査是否有特徵被宣告於規則 7中 。由於為是(Y).因此該整合常式係在步驟605被叫 用0 自啓始位置701繼績,步驟7〇2藉由決定在右手 邊部分的每一個所宣告的持徴指示與對應之目前的待徴指 -58- (請先閲讀背面之注意事項再項寫本頁) -丨裝· 訂· 通甩中國国家).?羊(CN-S)甲4現烙(21U X 297公货) 82.6. 40,000 308659 經濟部中央標準局3工消费vii-triit'lv: A6 B6 五、發明説明() 示的交集,而決定出有效的恃徴指示。 C h a r a c t e r (W e i g h t) : a (W e i g h t)。
Fdec 1 0 0 1 1 0 0 0 0 0 1 1 0 0 0
Fact 0011000
Fvalidated 0011000 步駿7 0 3然後檢査是否所獲得的交集皆非空的。由 於為是(Y),因此問於待戡之未出現,無發現到違反。 在步®[7 0 5 ,藉由決定出所有屬於該组群之有效的的特 擻指示之交集,一整合的待徴指示然後係對在右手邊部分 之每一値披宣告乙次以上的持擞組群被決定出。在目前的 例子中,其不存在。步铤706然後檢査是否在先前步驟 中所獲得整合的特擞指示並非空的。在無此等特擻指示之 情況下,此問題之答案是肯定的,因此關於該等持歡指示 之間的一致性並無發現到違反。所述方法然後繼績步驟7 0 8。在步驟7 0 8, Ftempl係藉由在所有於先前步缀 中所獲得整合的特徵指示以及存在於右手邊部分之獨特的 有效特徵指示上執行一逯輯OR蓮算而決定出。此得出 Ftempl =卩〇1$111 = 00100(]0。步驟 7 0 9然後被執行 -59- — I.--------------1 -----裝-------玎------Μ (請先閲讀背面之注意Ϋ項再埸寫本頁> 边甲中國國孓槔毕(CNS)甲4現格(21ϋ X 297公:^ > 82.6. 40,000 經濟部中央標準局員工消費合作枝印.;, 308659 A6 _ B6__ 五、發明説明() ,其中該特擻指示Ftemp2偽藉由對所有來·自右手邊部分 之所宣告的特徽指示之組合取負號而決定出。
Fteop2 = NON (0011000) = 1100111 步驟710然後對左收邊部分決定出目前的待擞指示 。亦宣告在右手邊部分中颶於一組群之目前的特徴指示係 決定自: F(Group)act = (Ftempl OR FTenp2) AMD F(Group)decl F(Weight)act = (0010000 OR 1100111) AND 0011000 =1110111 AND 0011000 = 0010000 步驟711然後檢査是否對右手邊部分語辭所獲得的 所有目前的特徵指示偽非空的。由於為是(Y),因此翻 於持戲之傳送無發現到違反。结束位置7 1 3然後達到並 且所述方法回返到該減降常式之步琛5 0 5。 所述方法繼續執行步缀606,其中一檢査偽被作出 ,以決定是否該違反計數器有一超過該變數 THRESHOLD 之計數。由於為否(N),因此步驟6 16被執行。在步 -60* --------------------- -----裝------,玎------M (請先閲讀背面之注意事項再壎寫本頁) ☆ dUii用中國国家悻芈(CNS)甲4現格(210 X 297公货) 82.6. 40,000 308659 A6 B6 經濟部中央標準局W工消#合作拄S V: 五、發明説明() 驟616,那些為是(Y)者係被決定出,對此在 G中 有一自 xc (亦卽z5)到 y長度 2*卜2之路徑。此産 生出y = z5。第一個y然後在步驟6 1 2被取出並被指定 予愛數yc。 y c = z 5 〇 步驟6 1 3然後藉由自所減降規則之右手邊部分取屬 於該等語辭的id而決定了 L。 L = (5) 在步驟616,所有的中態 s係被決定出,對此有 一 w致使該 w偽yc之一直接後繼者,以及亦致使該狀 態s偽在goto列表(其偽由屬於該w之狀態和對應於 目前規則之左收邊部分的語辭所決定出)之登錄中找到。 査詢G將顯示出有yc之一直接後繼者,亦卽v0。所隨 附的狀態偽 s = 0。對跃態s = 0 (有闋於《的狀態)和語 辭"Character”査詢 goto列表得出s = 3。此狀態在步 驟6 15被令為目前的狀態sc。 s c = 3 -6 1 - ------------------f-----裝------ΤΓ------後】 (請先閏讀背面之注意事項再堉寫本頁) 边用中SS家丨?芈(CNS)甲4規格(21ϋ X 297公釐) 82.6. 40 000 A6 B6 五、發明説明( 步驟6 16然後指定 w = vO作為一元素予集合 W。 vO } 步驟6 1 7然後檢査是否有一 u為集合U4,0之一 元素以及是否有關於u的狀態係等於sc。由於為否(N ),因此步驟618僳被執行。在步驟618, id 係被 增加1 ,並且在 T中一節點偽被産生具一標記id ,左 手邊部分之語辭具特徴以及一指到其他id之指標(在步 铤6 1 3中所決定)。 id T: 1 0 («double [CENTER] aO] -裝------tr------線' (請先閲讀背面之注意事項再塡寫本頁) 2 0 («triple [CENTER] al] [CENTER,BOLD] a2] 經濟部中央標準局貝工消^合作仏印.;'': 4 0 («blank 5 0 (a -6 2 - a 3 ) [BOLD] (1,2,3,4)) 用中國国家桴半(CN-S)甲4规烙(210 x 297公货) 82.6. 40,000 308659 A6 B6 五、發明説明() (Character [BOLD] (5)) 在步驟6 18,亦自G移除在步驟6 1 1中辑yC所 決定的路徑,並且有一具標記sc = 3之節點u、一具標12 id = 6 之節點z、一自u到z之邊框、自z到《之邊 框、W中所有《被加至G,以及具標記sc = 3之u傷被 加至集合A和U4.0。 G: vO 26 u3 u3 (請先《讀背面之注意事項再璜寫本頁) —裝· 訂.
U { w 1 5 u 4 u 3 經濟部中央橒準局*3:工消費合作;1印^ 步驟624然後檢査是否多饀狀態 s在步驟6 1 4 中被找到。由於為否(N) •因此所述常式續行步驟62 6,在此處一檢査係被作出,以決定是否步驟6 1 1找到 了多個y。此亦為否(N),因此結束位置628達到, 其中所述方法回返到該語法解析常式之步驟3 0 7。 自步驟307繼續,步驟310細達到,其中一檢査 偽被作出.以決定是否集合A, R以及Re為空的。A並 非空的,因此步驟305盌續作步驟304中所作的檢査 通用中國國家桴半 (CNS)甲4現烙(210 X 297公釐) 82.6. 40,000 經濟部中央標準局3工消費合作fi印k A6 ____B6 五、發明説明() 該動作常式偽在此步驟被叫用。由啓始位置4 0 1繼 縯,一元素偽自 A被移除並且此元素係被令為目前的節 點。 v c = u 3 步驟403然後對有朗於目前的基元(亦即 *vbar [CENTER, BOLD]))和對由闋於 vc (亦 01 3 )之狀 態決定出登錄,並且第一指定的動作偽自此被譎入。此得 出動作〃 reduce 3 Λ (減降3)。在步驟405, —檢査 然後被作出,以決定是否該動作為被#接受〃。由於為否 (Ν) ·因此步驟407檢査是否該動作為"shift s # (移轉s)。確實是如此(Y)。一檢査然後被作出,以 決定是否規則 3為一具有一空的右手邊部分之産生規則 。由於為否(N),之後,步驟412對於 G中vc之 毎一直接後组者X ,將一形態為<vc,x,p,cat,ai>之元 素傺被加至集合R。 R = { < u 3 , z 6 , 3 , v b a r , a 4 > } -6 4 - ---------------------~-----裝------ΤΓ------線, (請先Μ讀背面之注意事項再塡寫本頁) u氏用中國國家慄準(CNS)甲4現格(210 χ 297公货) 82.6. 40,000 A6 B6 五、發明説明() 步驟413然後檢査是否有下一鯧動作在由步驟40 3所決定的登錄中。由於為否(N),此時,步驟41 5 檢査是否下一健詞語己被指定予目前的基元。由於為杏( N),所以該動作常式到達該結束位置417並且所述方 法回返至該語法解析常式之步驟3 0 5。 由步驟305開始,步驟310然後決定出是否該等 集合 A, R以及Re為空的。此為否(Ν),因為R不 是空的。步驟307然後經由步驟304和306達到。 該減降常式俱在步驟307彼叫用。由啓始位置601開 始,一元素偽自 R中被取出並在步驟602被讀入。在 步驟603,規則 7之左手邊部分然後係被指定予變數 N〇 (請先閲讀背面之注意事項再塡寫本頁) 裝 訂 3- 經»部中央榇準局ear工消费合作.?!.叩 v c = u 2 在步驟403,對有関於目前的基元(亦即 *vbar[CENTER,BOLD])和對由闢於 vc (亦卽 3 )之狀 態決定出登錄,並且第一指定的動作偽自此被讀入。此得 出動作"shift 8"(移轉 8)。步驟405 (N)和步 -65 - 用中SS孓徉苹(CNS〉甲·!現格(210 X 297 d ) 82.6. 40,000 經濟部中喪標準局員工消If合作..江印*.': A6 B6 五、發明説明() 驟407 (Y)執行後,步驟408偽被執行。元素 < u 2,8 , * v b a r , a 4 >偽被加至集合Q。 Q = { <u2,8,#vbar,a4> } 步驟413 (N)和步思415 (N)之後,结束位 置417係逹到並且所述方法回返至該語法解析常式之步 驟 3 0 5 〇 在步驟3 1 0之檢査顯示出集合 A, R和Re為空的 (Y),因此步揉311被執行。 該移轉常式偽在步S3 1 1被叫用。在此情況下,該 移轉常式之結果偽一新的節黏被加至 T以及兩個新的節 點被加至G。 id = 7 + 1 = 8 ' T: 1 0 («double [CENTER] aO) 2 0 («triple [CENTER] al) 3 0 (#vbar [CENTER,BOLD] a2) -66- 衣呔烺逯用中國國家棵苹(CNS)甲4現格(2U) x 297公:^ ) 82.6. 40,000 (請先閱讀背面之注意事項再瑣寫本頁) •裝· 訂. 303659 A6 B6
經濟部中央標準局3工消·iu'合作:Ξ S 五、發明説明() a 3) [BOLD] (1,2,3,4)) [BOLD] (5)) [BOLD] (6)) [CENTER , BOLD] a4] vr 2 U4,0 = { h15 u4 u3 u2 w2 } 所述方法現在可藉由讀入下一値基元而繼續。接下來 的步驟在辱則上已討論過,因此現僅將給出最後由該語法 解析常式所傳送的T。 T: 1 0 double [CENTER] aO] 2 0 (^triple [CENTER] al] -6 7- 4 0 (*blank 5 0 (a 6 0 (Character 7 0 (Characters 8 0 Ovbar -----------------..,1-----裝------tr------線 (請先閲讀背面之注意事項再堉寫本頁) 尽呔適用中围国孓漂半(CNS)甲4規恪(210 X 297公货〉 82.6. 40,000 五、發明説明() A6 B6 3 0 〇 v b a r [ C E N T E R,B 0 L D ] a 2 ] 5 0 (a [BOLD] (1,2,3,4)) 6 0 (Character [BOLD] (5)) 0 (Characters [BOLD] (6)) 8 0 Ovbar [CENTER,BOLD] a4] 9 0 (*hbar [ Η I GH_CENTER] a5] 11 0 Oblank [ ] a7) —---------------^-----裝------tr------線' (請先閲讀背面之注意事項再填寫本頁) 經濟部中央標準局SK工消費合作.ii印V·: 12 0 (n [BOLD] (8 9 10 11)) 13 0 (Character [BOLD] (12)) 6 3 - 各f Hia用中國國家i.?準(CNS)甲4規烙(210 X 297 乂釐) 82.6. 40,000 A6 B6_ 五、發明説明() 14 0 (Characters [BOLD] (7 13)) 15 0 Oendnark 【]a8) 16 0 (WORD (14 15)) 到達結束位置315時,所獲得的分析傜呈一括弧结 構之形態被寫出。有關於所找出該分析之根的id係被指 定予變數result並且此得出: result = 16 16 -> 0 (WORD [] 0 (Characters [BOLD] 0 (Characters [BOLD] 經濟部中央標準局員工消"合作:匕1,,‘:-: (0 Character [BOLD] (0 a [BOLD] (0 * double [CENTER] aO) -6 9 ~ 82.6. 40,000 (請先閲讀背面之注意事項再填鸾本页) 尽这用中國國家桴芈(CNS)甲4現格(210 X 297公货) 經濟部中央標準局貝工消!fH合作.fiM-'u A6 B6 五、發明説明() (0 «triple [CENTER] al) (0 #vbar [CENTER BOLD] a2) (0 «blank [] a3)))) 0 (Character [BOLD] (0 n [BOLD] (0 #vbar [CENTER BOLD] a4) (0 «hbar [ΗIGH_CEHTHR] a5) (0 #vbar [CENTER BOLD] a6) (0 blank [] a?)))) (*endaark [] a8)) 該語法解析常式终結時,所述方法回返至步驟2〇7 ,其檢査是否該語法解析常式已傳送出一結果不等於零。 -70- 冬汰汛疋/又通用中國國家揉準(CNS)甲4規烙(21〇 X 29?公货) 82.6. 40,000 ------------------^-----裝------ir------β (請先《讀背面之注意事項再填寫本頁) 經濟部中央標準局g工消^合作;.!.,.»*': A6 B6 五、發明説明() 由於為是(Y),因此步驟2 1 1然後檢査是否違反的數 目偽等於零。由於亦為是(Y),因此所述方法在步驟2 1 4終止。 所述方法現已參照一文法分析了所提供之一信號並且 未發現到任何違反 現可趄續處理原來的信號或是由該語法解析單元所傳 送的分析。在目前的例子中,係針對所辨識的字元,因此 其將被用於進一步的處理。 若步驟211顯示出最後結果之違反的數目係不等於 零(N),則在圖1中的修正單元104係在步驟212 被叫甩。此種方法(適於所述裝置之目前的睡用領域,亦 卽光學字元之辨識)其一較有利的實施例包括了下述步S 。於第一步驟,對由該語法解析單元所提供之每一组群的 基元所獲得的字組傜依違反計數而予排序。一檢査首先披 作出,以決定是否該具有最低違反計數之字組出現在一電 子語法的字棄中。若為否的話,此字組係被拒退而接下來 的字組被取出。若僅有一値字組被傳送且若此字紐並未含 於有闋的字蠶中,一拼音檢査程式偽被叫用,其産生出該 字組之一些變形者被參照該字棄依序地檢査。若該字组在 電子字蠶中被找到•則該宇組以及有關於該字組的語法資 料偽被置於一句子缓衝器中。若該字組被找到但是有詞形 變化(i n f 1 e c t i ο η)不正確之顯示,則此字组被檫記出並 被置於一缓衝器中。€該句子含有"一完整的句子 -7 1- ------------------ -----裝------ΤΓ------M {請先W讀背面之注意事項再填寫本頁) 尽边明中國园家挖毕(CNS) Ψ 4现格(210 X 297父釐) 82.6. 40,000 308659 年(/瓜―;兩修正/更正/補光 I B7 經濟部中央橾準局貝工消費合作社印製 五、發明説明( ) 1 1 1 | 則 — 文 法 檢 查 程 式 被 叫 用 對 正 確 的 詞 形 fb 作 一 檢 查 ( 1 1 1 若 有 需 要 的 話 ) — 如 描 述 在 荷 蘭 申 請 案 N L- A 9 1 0 1 2 8 6 1 I 請 1 I ( 其 並 非 _ 前 案 ) 中 的 詞 形 isg& it 程 式 係 被 叫 用 〇 該 完 整 的 先 閱 1 | 句 子 然 後 被 傳 送 K 此 方 式 對 語 法 領 域 的 知 識 係 被 利 用 讀 背 1 | 到 便 作 字 元 辨 識 r· 之 注 | 意 I 關 於 將 元 素 圖 形 轉 換 成 為 詞 語 和 特 澂 字 串 成 組 群 地 事 項 1 1 再 1 提 供 至 該 語 法 解 析 簞 元 之 方 法 如 圖 8 所 示 必 須 注 afr. 思 的 填 寫 本 裝 是 在 步 驟 8 〇 5 指 定 數 個 類 項 予 —· 元 素 行 ( 造 成 數 個 有 頁 '---, 1 1 關 於 一 基 元 之 詞 語 ) 是 較 為 有 利 的 0 结 果 關 於 一 類 項 之 1 1 選 取 的 決 定 可 被 延 遲 到 該 辨 識 程 序 之 一 稍 後 階 段 0 此 變 通 1 1 方 式 是 可 行 的 因 為 該 語 法 解 析 單 元 係 可 處 理 不 清 疋 的 ( 1 訂 a itt b i gu 0 U S) 輸入 > 1 1 在 步 驟 8 0 6 指 定 互 斥 的 ( m u t U a 1 ly e X C lu si v e ) 特 1 1 徵 予 —. 基 元 也 是 較 有 利 的 〇 其 使 用 具 有 對 於 一 個 或 多 個 特 1 ! 徵 之 選 擇 不 需 要 在 指 定 特 澂 的 時 候 ( 此 時 除 了 元 素 叢 集 之 1 知、 幾 何 外 尚 不 知 道 進 一 步 用 於 指 定 該 等 特 激 之 資 料 ) 被 作 1 出 的 效 用 J 以 及 此 選 擇 可 予 延 緩 至 __. 稍 後 階 段 兩 種 可 能 1 1 性 都 是 可 接 受 的 致 使 只 有 在 一 稍 後 階 段 即 依 據 違 反 的 1 1 數 巨 或 是 依 據 語 法 檢 查 正 確 的 選 擇 才 可 予 作 出 〇 此 項 設 1 I 計 係 由 於 該 語 法 解 析 單 元 處 理 特 徵 之 方 式 而 變 得 可 能 0 — 1 1 1 類 Μ 的 情 況 係 參 照 圖 1 0 ( 示 出 — liL· 基 元 ) 作 描 述 0 關 於 1 1 第 五 基 元 t 不 容 易 決 定 是 否 其 具 有 下 降 的 ( d e S C e a d i ng ) 1 1 或 是 上 升 的 ( ascending) 特徴 因為中間的元素叢集無 1 I - 7 2 - 1 1 1 本紙張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) 經濟部中央標準局員工消骨合作社 A6 B6 五、發明説明() 法被歸類為〃上升的"或是"下降的〃,若是兩互斥特徵 現被指定予有關於此基元之詞語的話,則涉及到關於是否 一 〃或〃 Z"的決定可予延後到後一階段。假設該語法 解析單元得出兩分析和〃az〃 (二者皆有相同的違 反計數),則一修正程序(檢査是否所辨識的字組出現在 一電子字彙中)係得出字组"as 〃為正確的字組。 必須注意的是,指定互斥特徴予基元之能力以及其後 績處理並非侷限於此項K用中所述的組合,而是亦適用於 其他應用中。 關於顯示在表1中的文法,必須注意的是,此文法特 別有利之處在於其可為該語法解析單元所傳送之非分離的 字元,而是字組。與違反機制有闢者,所述方法係可傳送 一串被辨戡的字組(對一给定所供給的基元序列被提供以 一違反計數)。較有利的是,若一値或多個解答偽由該語 法解析單元所傳送,則這些解答可直接由語法協助來檢査 。當一次一値字元被辨識時,此為不可能的。無任何語法 規則是適用於單一艏字元的。在此一情況下(其當然可藉 由適配該文法而以目前的方法來執行),需要一額外的步 驟以將所辨識的字元結合成為宇組。 現將參照圖1中所示的文法再討論一些變化。在第一 變化中,其非整個字組而是一糸列固定數目(n)的字元 被該語法解析單元所傳送,下述中稱為n-grams^在此等 情況下修正機制偽由相對於可容許 η-grams之一列表檢 -73- .I—.---------------j-----裝------tr------嫁: (請先H讀背面之注意事項再填寫本頁) 用中國國家標.半 (CNS)甲4规格(210 X 297公* ) 82.6. 40,000
AS B6 五、發明説明() 査所傳送的 n-graias所組成。表5給出一得出trigrans (η = 3)之文法。 下一變化之组成,為藉由注意接下來所供給的常態化 基元糸列係重叠,而讓接下來傳送的n-graas重叠。 必須注意的是,n-graias (其為重《或為不重叠)由 一圈形辨識單元所作的傳送並非侷限於此項匾用中所述的 组合,而是亦適用於其他應用中。 〔表5 ] //Ftrs = CENTER HIGH-CENTER BOLD NORMAL VIOL LONG-UP LONG-DOWN //Weight = BOLD NORMAL Character(Weight) :a(Weight).
Character(Weight) :h(Weight).
Character(Weight) :n(Weight)· START :TRIGRAM. TRIGRAM:Character{Weight),Character(Weight),Character(Weight)f*endmark. a(Weight) :^double(CENTER),*triple(CENTER),*vbar(CENTER,Weight),*blank. h(Weight) :*vbar(LONG-UP,Weight),^hbar(HIGH-CENTER)f *vbar(CENTER,Weight),*blank. n(Weight) :*vbar(CENTER,Weight),*hbar(HIGH-CENTER), *vbar(CENTER,Weight),*blank. 該文法之一較有利的變化包括了將文法規則涵括入, 經濟部中央標準局貝工消费合作社印" 此等文法規則偽預計依附的字元無論如何必須被辨識為分 離的字元。此種愛化係顯示在表6中。以此方式,除了 a d外,例如a c和1乃可能被傳送為解答。修正機制 然後可作正確的選擇。 〔表6〕 -74- 用 t a囡家棵举(CNS)甲 4 規格(21ϋ X 297 么、釐) 82.0. 40 000 五、發明説明() A6B6
Ftrs = CENTER HIGH-CENTER BOLD NORMAL VIOL LONG-UP LONG-DOWN VIOL //Weight = BOLD NORMAL Character(Weight) ;a(Weight). Character(Weight) :h(Weight). Character(Weight) :n(Weight). Characters(Weight) : Character(Weight). Characters(Weight) :Characters(Weight),Character(Weight). START :WORD. WORD :Characters(Weight),*eadmark. a(Weight) :*double(CENTER),*triple(CENTER)t*vbar(CENTER,Weight),blank, blank :*blank. blank :missing-blank(VIOL,VIOL,VIOL). h(Weight) :*vbar(LONG-UP,Weight),^hbar(HIGH-CENTER), *vbar(CENTER,Weight)Tblank. missing-blank :. n(Weight) :*vbar(CENTER?Weight),-hbar(HIGH-CENTER), *vbar(CENTER,Weight),blank. 請 先 閲it 背 面 之 注 意事 項 再 填 寫 本頁 裝 訂 經濟部中央標準局B工消費合作杜Μ,ν·ί 亦可以涵括入以一正確的方式處理宇元之(斜e字的 f, j等)上下突出部分(kerning)的文法規則。亦極明 顯的是字體(fonts)之辨識和傳送可立即被執行。最後 ,表7示出該文法之一變化,其中字元在解答中你被表示 為一待徴。 必須注意的是,此文法變化之利用並非侷限於此項應 用中所述的組合,而是亦適用於其他應用中。 〔表7〕 //Ftrs = CENTER HIGH-CENTER BOLD NORMAL VIOL LONG-UP LONG-DOWN a h n //Weight = BOLD NORMAL Character (Weight,a) : -'double (CENTER) , -·triple (CENTER), *vbar (CENTER,Weight) , -"blank.-75- 各通甲中國国家悌半(CNS)甲4現丨各(21U X 297 ) 82.6. 40,000 線 A6 B6 五、發明説明() Character(Weight,h) :*vbar(LONG-UP,Weight),*hbar(HIGH-CENTER) *vbar(CENTER,Weight) ,'"blank. Character(Weight ,n) : *vbar (CENTER,Weight) ,-uhbar (HIGH-CENTER), *vbar(CENTER,Weight),*blank. Characters(Weight) : Character(Weight). Characters(Weight) : Characters(Weight),Character (Weight)· START :WORD, WORD :Characters(Weight),*endmark. 面 之 注 再 壤 寫 本 頁 依據本發明用於光學字元辨識之裝置之一變化設計( 較有利地為利用違反計數)煤藉由鍺存宇元(被辨識為最 佳者)之位元映射而獲得。其逹成像藉由對毎一値第一次 被辨識的字元儲存位元映射,然後如果在各情況下此宇元 被辨識為具一較低違反計數的話以同一字元的位元映射取 代此位元映射。然後得以藉由所辨識基元(被最佳辨識者 )之位元映射重建原“字元。 必須注意的是,上述額外作法之利用並非侷限於此項 應用中所述的組合,而是此等作法亦適用於其他應用中。 在下述對第二例子的論述中,依據本發明之装置係用 於句子的文法分析。句子的文法分析在所有那些其中一供 辨識的原始信號含有語法資訊的應用中是有利的。在此一 法此於 文 。用 1 正採 以修傺 以之置 。 可將装 。 是話一中 , 的之 8 } 要明表 送箱發在 傳有本定 被若據給 偽 且依偽 組並 ,法 字,驟文 中號步的 其信者用 { 證後利 驟驗此所 步地於 c j 後細關驟 8 最詳有步表 的來偽者 t 序析子後 程分例此 裝 訂 線 乂这用ta國孓揉半(CNS)甲4規格(21U X 297公釐) 82.6. 40,000 五、發明説明() A6 B6 //Getal = SING1 SING2 SING3 PLU1 PLU2 PLU3 0 NP(Getal) :*article(Getal),*noun(Getal). 1 S :VP(Getal)· 2 START :TOP. 3 TOP :S,*endmark. 4 VP(Getal) :NP(Getal),*verb(Getal)- 在此例子中,六項特徴係被定義出:SINGl SING2 SING3 PLU1 PLU2和PLU3。這些特徴傜結合成一組群, 即組群Getai ( = Humber)。由此文法所推導出並鍺存在 記憶體中的表以及為本發明方法所利用的表,01動作表、 g 〇 t 〇表和持戤表,偽分別給定在表9、 1 〇和1 1中。 〔表 9 〕動作列表 (請先閲讀背面之注意事項再堉寫本頁> —裝
State
^article *endmark -noun *verb @ALL ΤΓ 經濟部中央標準局S工消費合作社印焚 0 1 2 3 4 5 6 7 8 sh5 acc sh6 sh7 〔表10〕goto列表 sh.3 大又/¾¾用中國國家標準(CNS)甲4规格(210 X 29Γ公货) rel
re3 re4 reO 82.6. 40,000 I 级 五、發明説明()
State NP S TOP VP 0 4 2 1 3 1 2 3 4 5 6 7 8 A6 B6 (請先閲讀背面之注意事項再填寫本頁) 經濟部中兴縹準爲貝工消費合作社印製 〔表1 1〕特戡列表 0 ((L11111) (111111) (111111)) 1 (() (111111)) 2 (()()) 3 (() {)()) 4 ((111111) (111111) (111111)) 吾人假設必須檢査語法精確性的句子為"A man works 〇 此句子形成信號S被頡至画1中轉換單元1 0 1。該 轉換單元將此信號轉換成一適於由該語法解析單元1 0 2 所處理的形態。為此目的,該信號首先被分段成為基元。 對於此項應用,字組係形成為該等基元,致使該轉換單元 將提供成字组的字元串。此等字組然後被提供以常態化基 元(詞語)和特徵。最後所得到經語法解析後的字串係被 饋至該語法解析單元1 0 2。 a 1 a (*art ids [SIHG3]) ___ -寸T- ί ____ 本纸張又度遵用中S3家徉準(CNS>甲4規格(210 χ 297 H) 82.6. 40,000 五、發明説明() A6 B6 a2 田3Ω (^noun [SIHG3]) a3 works 〇 v e r b [SING3]) a 4 (#endaark []) 所述語法解析之方法現將對此例子參照圖2_7詳細 描述。由啓始位置201 (圖2)開始,一些受數在步驟 2 0 2被啓始化。 result - 0 threshold = 0 delta-threshold = 0 new-threshold = 0 宇串然後在步揉2 0 3被讀入並且一詞語符號$被加 至該字串。該語法解析常式然後在步驟204被叫用。該 語法解析常式係在圖3中被詳細推導出。由啓始位置30 1 (圖3 )開始,計數器i, id,違反計數器、圖形结構 化堆叠G以及樹狀結構T係在步驟302被啓始化,並 且元素vQ傺披加至集合U0,0 —--------------- -----裝------.玎------線 (請先閲讀背面之注意事項再填寫本頁> 經濟部中央標準局貝工消贷合作.fif!·,;.: i d = 0 -78- 卜氏:乂乂又通用中國國家丨字準(CNS) T 4现丨各(210 X 297公釐) 82.6. 40,000 3 0 S 6 5 Ο Α6 Β6 經濟部中夹標孕局ΚΪ工消合作ii印a 五、發明説明() 違反計數器=〇 G = 0 T = 0 U 0,0 = { vO} 被提供以語法資料的第一基元aQ亦在此步驟自該字 串被讀入。 目前的基元 a 0 ( * a r t i c 1 e [ S I N G 3】) 計數器然後在步驟303被啓始化為0,集合R, Re 和 tl被啓始化成空集合並且集合 A被令為等於UQ,Q:A ={vO}j = 〇 R = R e = Q = { } A = { v 0 } -7 9 - (請先閲讀背面之注意事項再堉寫本頁) .裝. 訂. 線 本紙值尺度通闱中國國家悻準(CNS)甲4規彳各(210 X 297 W釐〉 82.6. 40,000 經濟部中夹櫺箏«ΚΪ工消费合作杜印a A6 B6 五、發明説明() 一檢査然後在步驟304被作出,以決定是否集合A 偽一空集合。由於為否(N),因此該動作常式偽被叫用 〇 該動作常式係詳示於圖4中。由啓始位置401開始 ,一元素係在步驟402中被自 A移除,並且此元素變 成為目前的節點 vc。在步驟403,動作列表中的登錄 然後被決定成與詞語”《article”和狀態 0有關。該動 作列表(其係由該文法導出)偽顯示在表9中。來自此登 錄之第一動作然後在步驟404被謓入。此得出動作" shift 5 "(移轉5 )。在步驟405, —檢査偽被作
出,以決定是否該動作為"accept # (接受)。由於此 為否(N)的話,致使步驟407檢査是否該動作為# shift s 〃(移轉s )。由於為是,致使在步揉4 0 8 , <v0,5,*article,a0> 係作為一元素被加至該集合Q Ο Q = Q{ 〈νΟ,δ,*article,a0> } 既然步驟305已經被處理,所述方法趄績步思31 0 (圖3)。在此,一檢査然後被作出,以決定是否集合 A, R和Re皆為空集合。由於為是(Y),致使步驟3 1 1叫用該移轉常式。 -80" (請先閲讀背面之注意事項再堉寫本頁) .裝. 訂. 本紙m又度通阑中国国家標準(CNS)甲4規格(210 X 297公璉) 82.6. 40,000 經濟部中*攆婆局3工;«#合作杜印a A6 B6 五、發明説明() 該移轉常式燥詳細顯示在圔5中。由啓始位置501 開始,在步驟5 0 2,集合U1,Q係被啓始化成空集合。 U 1,0 = { } 在步揉503, —狀態係被取自Q。 s = 5 f r ο π element <v0,5,幸doub 1 e,a 0> 在步驟504,計數器id然後被増加1,並且在τ 一節點傺被産生為具檩記id並被提供以有關於第零基元 的語法解析資料。 id = 1 T: 1 0 (^article [SIHG3 PLU3] aO) 在步驟505,然後下列者係被加至 G : —節點w 具標記 s = 5、一節點X具標記id=l、一邊框自^ 到X、以及一邊框自x到v 0。 G : v 0 f- X 1 ^ w 5 -8 1 - 本紙Λ又度通用ta國家標準(CNS) f 4规烙(210 X 297) 82.6. 40,000 -裝------.玎------線 (請先閲讀背面之注意事項再填寫本頁) A6 B6 五、發明説明() (請先閲讀背面之注意事項再填寫本頁) 在步驟506,具標記s的w然後被加至集合U1,0。 U 1,0 = { »5 } 在步驟507, —檢査係被作出,以決定是否仍有更 多個元素存在於 Q中。由於為否(Ν),致使所述方法 回返到該語法解析常式自此龃缠步驟312,其中該計數 器偽被增加1。 步驟3 1 3然後檢査是否U1,0為空的。由於為否( Ν ),致使步驟3 16檢査是否有下一艏基元存在。由於 為是(Υ),致使在步驟3 18被讀入。 目前的基元 al: (*noun [SIHG3] al) 然後,j, A, R, Re以及Q在步SE303被啓始化 經濟部中央縹導Λ A工消费合作钍印a -82- 本纸依又度通用t國园家標準(CNS)甲4規格(210 X 297公货) 82.6. 40,000 經濟部中典標導局β工消费合祚社印54 A6 B6 五、發明説明() A = U 1 , 0 = { w5 } R = Re = Q = { } 步驟304然後檢査是否該 A為空的。由於為否( N) , A當然含有該元素h5 ,致使該動作常式在步驟3 0 5被叫用。 由啓始位置401開始,此元素係在步驟402被自 A中取出並披令為目前的節點vc。 v c = w5 在步驟403,有關於目前的詞語之動作列表的登錄 以及有關於vc之狀態然後被決定出,並且第一動作自此 被讀出。此産生了 shift 8(移轉8)。步驟405然後 檢査是否該動作被#接受〃。由於為否(N),所以步驟 407檢査是否該動作為一移轉動作。是的,s具有值8 。該元素<«5,8,11(}1111,31>然後在步驟4〇8被加至0。 -83- ---------------------------裝------,玎------^ (請先閲讀背面之注意事項再塡寫本頁) 本纸任又度過用中囷园家揉準(CNS)甲4規丨各(210 X 297公货) 82.6. 40,000 A6 B6 五、發明説明(
Q 有 ί 另否 否為 是於 定由 決 〇 以中 ,綠 出登 作的 被定 3 決 1 所 4 3 驟 ο 步 4 在驟 後步 然由 査在 檢作 一 動 傾 否 , 是} 定 Ν 決 < 以否 *為 出此 作於 被由 5 0 1 元 4 基 驟的 步前 在目 後予 然定 査指 檢被 1 已 以語 所詞 , 艟 下 N 下所 到 返 回 法 方 述 所 且 並 Ρ 7 1 〇 4 5 置 ο 位 3 束揉 结步 達之 到式 式常 常析 作解 動法 該語 以該 自此繼續,步驟3 10檢査是否該等集合 A, R以及 Re 為空的。由於是的(Y),所以該移轉常式偽在步琛 3 1 1被叫用。 (請先閲讀背面之注意事項再填寫本頁) -裝 訂
經濟部中喪律導局3工消费合件钍印S 由啓始位置50 1開始,步驟502將集合U2,0啓 始化為空集合。 U 2 , 0 = { }步驟503然後自Q之一 tuple取一狀態。 s=ll,自元素 <w5,8,noun,al> 8 4 * 本紙張尺度通用國家律準(CNS)甲4说格(210 X 297公釐) 82.6. 40,000 A6 B6 五、發明説明()
步驟504然後將id增加1並且一節點偽被加至T 〇 id = 2 T: 1 0 («article [SING3 PLU3] aO) 2 0 («noun [SIHG3] al) 下列者然後在步驟505被加至 G : —節點 w具標 記s = 8, —節點 X具標記id=2, —邊框自w到 X以及 一邊框自JC到 w 5。 G: vO f- xl w5 x2 w8
在步驟506,具標記 s 的w然後被加至集合U 2,0 = U 2,0 = U 2,0 { w8 }
經濟部中夹標婆局工消费合作社印S (請先閱讀背面之注意事項再填寫本頁) —裝‘ 步驟507檢査是否有多個元素存在於 Q中。由於 為否(N ),因此所述方法回返到該語法解析常式。 -85- 本紙張尺度適用中國S家樣準(CNS)甲4規烙(210 X 297公货) 82.6. 40,000 A6 B6 308659 五、發明説明() 所述方法繼續步驟3 1 2,其中該計數器 i偽被增 加1。 步驟3 1 3然後檢査是否該集合U2,Q為空的。由於 為否(N),因此步揉3 16檢査是否有下一個基元存在 。由於為是(Y),因此所述方法进績步驟3 17,其中 接下來的基元受成為目前的基元。 目前的字组:a2 (*verb [SING3] a2) 然後在步驟303. j· A, R, Re和 Q被啓始化。 A = U 2 , 0 = { w8 } R = Re = Q = { } 步驟304然後檢査是否該集合 A為空的。由於為 否(N),因此該動作常式在步驟305被叫用。 -86* ------------------------裝------.玎------線 (請先閲讀背面之注意事項再塡寫本頁) 本斌張尺廋遢用中Η國家棵準(CNS)甲4规格(210 X 297公釐) 82.6. 40,000 A6 B6 五、發明説明() 由啓始位置401開始,一元素在步驟402自 A 中被取出:vc = w8。在步驟403,該登錄在有関於目 前的詞語(亦即 verb)和 vc (亦即8)之狀態的動作 列表中被決定出,此時,一存在於此處的第一動作係被讀 入。此産生出動作〃 reduce 0〃 (減降 0)。步驟405 然後檢査是否該動作為被"接受"。由於為否(N),此 時,步驟407檢査是否該動作為〃 shift s 〃(移轉s )。由於亦為非,因此在步驟40 9 —檢査然後被作出, 以決定是否該動作為Λ reduce p # (減降p)。是的(γ )。一檢査然後被作出,以決定是否規則 〇為具一空的 右手邊部分之産生規則。由於為否,因此在步驟4 12, 對於 G 中 vc 之每一個直接後趙者 X ,—形態為 <vc,x,p,cat,a2>的元索係被加至集合R。 R = { <w8,x2,〇,verb,a2> } 步驟413然後檢査是否有下一個動作在由步驟40 3所決定的登錄中。由於為否(N),所以該動作常式到 逹該結束位置415並且所述方法回返至該語法解析常式 之步驟3 0 7。 自此ϋ镰,步驟3 1 0檢査是否該等集合A, R以及 Re為空的。此為否(Ν),因為R不是空的。步驟30 -87 - 本紙ft尺Λ遍,中國困家汴芈(CNS)甲4规格(210 X 297公梦) 82.6. 40,000 (請先閲讀背面之注意事項再填寫本頁) —裝. 訂. .線. A6 B6 五、發明説明() (請先閲讀背面之注意事項再填寫本頁) 7然後經由步驟304和306而達到。該減降常式在步 驟307被叫用。由啓始位置601開始,一元素係自R 中被取出並且在步驟602被謓入。在步驟603,規則 0之左手邊部分然後被指定予受數K。 N = HP(Getal) 有關規則之整合係發生在步驟6 0 5。 自啓始位置701逛缠,步驟702藉由決定在右手 邊部分的毎一個所宣告的特擻指示與對應之目前的特徴指 示的交集,而決定出有效的特徽指示。 NP(Getal) : «articleCGetal), *noun(Getal) F d e c 1 111111 111111 111111 Fact 001000 001000 Fvalidated 001000 001000 步驟7 0 3 於為是(Y ), 然後檢査是否所獲得的交集皆非空的。由 因此步驟705被執行。在步驟705, -8 8 - 本纸ft又度嬝用中國a家棵準(CNS)甲4規格(訂0 X 297公) 82.6. 40.000 經濟#♦***屬癱工消^印51 A6 B6_ 五、發明説明() 藉由決定出所有屬於該纟且群之有效的的持德[指示之交集, 一整合的待擻指示然後係對在右手邊部分之每一傾被宣告 乙次以上的待徽組群被決定出〇在目前的例子中,有一個 組群,即組群"GETAL 〃。此得出整合(GETAL) = 0 0 1 0 0 0 。步驟7 0 6然後檢査是否在先前步驟中所獲得整合的特 徴指示並非空的。由於為是(Y) »因此關於該等特徵指 示之間的一致性並無發現到違反。所述方法然後繼缥步SE 7 0 8,其中Ptenpl係藉由在所有於先前步驟中所獲得 整合的待徴指示以及存在於右手邊部分之獨特的有效恃徴 指示上執行一邏輯OR運算而決定出。此得出 Ftenpl = 0 0 1 0 0 0 。步驟709然後被執行,其中該待徴指示
Ftenip2 俱藉由對所有來自右手邊部分之所宣告的待擻指 示之組合取負號而決定出。
Fteinp2 = 0000 步驟710然後對左收邊部分決定出目前的特徵指示 F(Getal)act = (001000 OR 000000) AND 111111 = 001000 步驟7 1 1然後檢査是否在步驟7 1 0所獲得的所有 目前的持徽指示偽非空的。由於為是(Υ ),因此關於持 -89- -----------------I------裝------、玎------線 (請先閲讀背面之注意事項再塡寫本頁) ' 本紙張又廑遶两中困a家棵準(CNS)甲4规格(210 X 297公货) 82.6. 40,000 308659 嬈濟#t*·*4麄工消 ί#社_* A6 B6 五、發明説明() 擻之傳送無發現到違反。结束位置713然後達到並且所 述方法回返到該減降常式之步驟5 〇 5。 所述方法鏺缠執行步驟606,其中一檢査係被作出 ,以決定是否該違反計數器有一超過該變數threshold 之計數。由於為否(N),因此步驟6 16被執行。 在步爨6 16,那些為是(Y)者偽被決定出,對此 在G中有一自xc (亦即χ2)到y長度2*2-2之路徑 。此産生出 y = xl。第一健 y然後在步思6 1 2被取出並 被指定予荽數JTC。 y c = X10 步驟613然後藉由自所減降規則之右手邊部分取屬 ' 於該等語辭的id而決定了 L。 L = (1,2) 在步驟614,所有的中態 s傜被決定出,對此有 一 w致使該w傜yc之一直接後繼者,以及亦致使該狀 態s偽在g 01 〇列表(其係由屬於該w之狀態和對應於 目前規則之左收邊部分的語辭所決定出)之登錄中找到。 -9 0 - 本紙ΛΑΛ邊國國家律準(CNS)甲4規格(2丨0 X 297父货) 82.6. 40,000 ---------------------------裝------,玎------線 (請先《讀背面之注意事項再填寫本頁) A6 B6 五、發明説明() 査詢G將顯示出有yc之一直接後繼者,亦卽vO。所隨 附的狀態偽 s = 0。對狀態s = 0 (有關於W的狀態)和語 辭H P査詢g 〇 t 〇列表得出s = 4。此狀態在步驟6 1 5被 令為目前的狀態sc。 s c = 4 步驟6 1 6然後指定w = vO作為一元素予集合W。 W = { vO } 步驟6 1 7然後檢査是否有一 u為集合U2,0之一 元素以及是否有翻於U的狀態係等於sc。由於為否(N ),因此步驟618偽被執行。在步驟618, id 偽被 增加1 ,並且在 T中一節點偽被産生具一標記id ,左 手邊部分之語辭具特徵以及一指到其他id之指標(在步 驟6 1 3中所決定)。 id = 3 T: 1 0 (^article [SING3 PLU3] aO] 2 0 (* η ο α n [SING3] al) -9 1 - 本紙Λ尺度適明中aa家棵準(CNS)甲4規格(210 X 297公;¢) 82.6. 40,000 (請先閲讀背面之注意事項再填寫本頁) 丨裝- 訂· .線· Α6 Β6 五、發明説明() 3 Ο (ΝΡ [SING3] (1,2)) 然後自 G移除在步驟6 1 1中對yc所決定的路徑 ,並且有一具標記sc = 4之節點u、一具擦記id = 3之節 點z、一自u到z之邊框、自z到w之邊框、W中所 有w被加至G,以及具標記sc = 4之u係被加至集合 A 和 U 2 , 0。 G: v 0 ζ 3 — u 4 A = { u4 } U 2,0 = { w8 u4 } 步驟624然後檢査是否多個狀態 s在步驟6 1 4 中被找到。由於為否(N),因此所述常式續行步驟62 6,在此處一檢査係被作出,以決定是否步铤6 1 1找到 了多痼y。此亦為否(N),因此結束位置628達到, 其中所述方法回返到該語法解析常式之步驟307。自步 驟307繼鑕,步驟310細逹到,其中一檢査傜被作出 ,以決定是否集合A, R以及Re為空的。A並非空的, 因此步驟3 0 5繼續作步驟3 04中所作的檢査。 -92- 本娬ft尺及嬝*肀《3家播準(CNS)甲4规ΙΜ210 X 297公货) 82.6. 40,000 ------------------------裝------ΪΓ------線 (請先閲讀背面之注意事喟再埸寫本頁) A6 B6 五、發明説明() 該動作常式係在此步驟被叫用。由啓始位置40 1繼 缅,一元素係自 A被移除並且此元素傜被令為目前的節 點vc 0 v c = u4 步驟4 0 3然後對有關於目前的字組"works"(亦 卽動詞)和對由關於 vc (亦即4)之狀態決定出登錄, 此時,在步驟404第一指定的動作係自此被讀入。此得 出w shift 7〃 (移轉7)。在步琛405 (N)和步揉 407 (N)已被執行之後,步驟408乃被執行。元素 < u 4 , 7 , <= v e r b , a 2 >傜被加至集合R。 R = { <u4,7,J!!verb,a2> } 步驟4 1 3和步驟4 1 5之後,結束位置4 1 7達到 並且所述方法回返至該語法解析常式之步驟3 0 5。 在步驟3 10之一檢査顯示出集合A, R和Re為空 的,致使步驟3 1 1係被執行。 -9 3 - ——-----------------------裝------.玎------線 {請先閲讀背面之注意事項再填寫本頁) 本紙值又度邊《中困a家樣準(CNS)甲4规烙(210 X 297公») 82.6. 40,000 A6 B6 五、發明説明( 該移轉常式偽在步驟3 1 1被叫用。在此情況下,該 移轉常式之結果偽一新的節點被加至 T以及兩健新的節 點被加至 G。 id T: 1 0 (^article [SIHG3 PLU3] aO) 2 0 (*noun [SIHG3] al)
3 0 (HP
[SIMG3] (1,2)) 4 0 (*verb [SING3] works) -------------------------------裝------,玎------線 (請先閲讀背面之注意事項再塡寫本頁) G: v 0 — z 3 — u 4 x 4 w 7 U 3, { »7 移轉常式之後,在步驊3 1 2計數i係被增加:i = 3 。步铤3 1 3然後檢査是否U3,0是空的。由於為否(N ),此時,步驟3 16檢査是否有下個基元存在。由於為 是(Y) •因此此下一鏡基元傜在步驟3 18被取出:” -9 4 - 82.6. 40,000 本紙ft尺度邊,中®國家捸準(CN*S)甲4規烙(210 X 297公;t ) 嫌濟# t*屬廉工消f鏵社印黧 A6 B6 五、發明説明() *etidaiark”。在步驟3 0 3, j 再次被啓始化為零,R, Re和Q被啓始化為空集合,以及A被啓始化為U3,0( 即 U7})。由於A並非空的,該動作常式係在步驟30 5被叫用。在動作常式中,該動作列表係對基元( *endaark)和狀態 7作讀取。此得出# r educ β 4” (減 降4)。在動作常式的步驟4 10, —檢査偽被作出,以 決定是否規則 4傜一空的産生規則。由於為否(Ν ), 因此步驟412然後披執行,其中 R 傜被提供以元素 <H7,x4,4,#endaark>a3> : i? = { < w 7 , X 4 , 4,* & n d π a r k · a 3 > } 由於無接下來的動作被指定,因此動作常式回返到該 語法解析常式。該減降常式然後在該語法解析常式中被叫 用。在該減降常式中,規則 4的左手邊部分係在步驟6 0 3被決定。此為〃 VP(GETAL)"。持擻傺被宣告於此規 則中,以致該整合常式係在步驟6 0 5被叫用。自啓始位 置70 1開始,步驟702決定了在右手邊部分的有效持 徴指示。 NP(GETAL) : «verb(GETAL), NP(GETAL)
Fdec1 111111 111111 111111 -95- ------------------------裝------#------線 (請先閲讀背面之注意事項再埸寫本頁) 本斌ΛΑΛ遍《中aa家樣準(CNS)甲4規丨各(210 X 297公梦) 82.6- 40,000 A6 B6 五、發明説明()
Fact 001000 001000
Fvalidated 001000 001000 此等並非空的(一在步驟704被測試的特徵),因 此所述方法龃缠步驟7 0 5。在此步驟中,對於在右手邊 部分中每一項披宣告多於乙次的待擻組群,一整合的特徴 指示係藉由決定出所有屬於該組群之有效的的特徴指示之 交集而被決定出。在目前的例子中,有一餹組群,即组群 "GETAL 〃。此得出整合(GETAL ) = 001000。步驟 7 0 6然後檢査每否在先前步思中所獲得整合的特撖指示 並非空的。由於為是(Y),因此翻於該等特擻指示之間 的一致性並無發現到違反。步琛708然後藉由在所有於 先前步驟中所獲得整合的特戡指示以及存在於右手邊部分 之獨待的有效特徴指示上,執行一邏輯OR蓮算而決定出 ?1811?1。此得出?18〇1?1 = 0〇1〇〇〇。步驟7 0 9 然後被 執行,其中該持激指示Fteap2偽藉由對所有來自右手邊 部分之所宣告的待徴指示之組合取負號而決定出。
Fteap2 = 0000 步驟710然後對左收邊部分決定出目前的持擻指示 -9 6 - 泰城ΛΑ-度邊《中國a家播準(CNS〉甲4觇格(210 X 297公璉) 82.6. 40,000 ------------------------裝------.玎------^ (請先閲讀背面之注意事項再塡寫本頁) 303659 A6 B6 五、發明説明() F(Getal)act = (001000 OR 〇〇〇〇〇〇) AND 111111 = 001000 步驟7 1 1然後檢査是否在步驟7 1 0所獲得的所有 目前的特徵指示偽非空的。由於為是(Υ),因此關於特 徽之傳送無發現到遠反。结束位置713然後達到並且所 述方法回返到該減降常式之步驟5 0 5。 所述方法龃續執行步驟606,其中一檢査偽被作出 ,以決定是否該違反計數器有一超過該變數threshold 之計數。由於為否(N),因此步驟6 16被執行。在步 驟616,那些為是(Y)者係被決定出,對此在 <3中 有一自xc (亦卽K4)到y長度2|p丨-2 = 2之路徑。 此得出 y = z3。步驟6 1 3然後決定出有関於來自目前規 則右手邊部分之符號的 id。此得出L=(4,3h步驟6 1 4一628然後以先前已描述的方式被執行,給出下列结 果: sc = GOTO(STATE(w),N) = G0T0 (0,VP) = 3 W = { v0 } -97- 本娬ft又廋邊明中國國家惲準(CNS)甲4规格(210 X 297公货) 82.6. 40,000 ---------------------------裝------iT------線 4. (請先閲讀背面之注意事項再填寫本頁) A6 B6 五、發明説明( id = 5 T: 1 0 (*article [SING3 PLU3] al) 2 0 (* η 〇 u η [SIHG3] a2)
3 0 (HP
[SING3] (1,2)) [SINS3] a3)
0 (VP
[SI NG3 ] (4,3)) S: vO z5 u3 { u3 —---------------------裝------.玎------線 (請先閲讀背面之注意事項再填寫本頁) 經濟工消 f*ti_w U 3 , 0 = { u3 } 所述方法然後回返到該語法解析常式,其中,由於A 並非空的,在步驟3 0 5之動作常式係被叫用。 對此,在步驟4 0 3 ,動作列表査詢字組"*endnark 〃以及狀態3。此得出〃 r e d u c e 1 "(減降1),因為集 -98- 本娬ftXJt遍《中aa家棵準(CNS) r 4规烙(210 X 297公釐) 82.6. 40,000 A6 B6_ 五、發明説明() 合 R 變成為:R = {<u3,z5,l,*endnark,a3>}。所述方法 然後回返到該語法解析常式,在此,由於 R並非空的, 該減降常式現被叫用。在該減降常式中,左手邊部分偽首 先對有關用於減降的規則被決定。此為N = S。步驟60 4然後檢査是否有待戡被宣告於此規則中。由於為是(Y ),因此整合常式被叫用。由啓始位置701開始,有效 的恃徵指示在步驟7 0 2中右邊被決定。 S : VP(GETAI) 〇 Fdec 1 111111
Fact 001000
Fun i 0 0 1 0 0 0 此等並非空的(一在步驟703被測試的特徵),因 此所述方法逛續步驟7 0 5。由於在右手邊部分中沒有與 相同的组群有関的數個特徵指示,因此步驟705和70 6没有作用。Fteapl 係在步驟7 ◦ 8被決定。F t e b p 1 = 0 0 1 0 0 0 。在步驟 7 Ο 9 , Ftemp2 被決定出:Ftenp2 = 000000。在步驟6 1 0,對左手邊的部分,目前的特徽指 示然後被決定出。在左邊無任何特徵已被宣告,所以對此 -9 9- 本紙值尺·度嬝中家埭準(CNS)甲4規格(210 X 297公皱) 82.6. 40,000 ------------------------裝------.玎------線 (請先閲讀背面之注意事項再蜞寫本頁) 經濟 #♦*«♦«·工请 印« A6 B6 五、發明説明() 無目前的特徴須被決定而且步驟710和711無作用。 結束位置71〇然後達到•其中所述方法係回返到該減降 常式。. 在此,步隳604檢査是否該違反計數器已超過該 受數 threshold。由於為否,因此常式趄續步缀6 1 1 。在此步驟,所有的y係被決定出/對此在G中有一自 xc ( = z5)到 y 長度2|p| -2 = 2之路徑。此得出 y=z5。步驟6 1 3然後決定出有關於來自目前規則右手邊 部分之符號的 id。此得出L=(5)。步驟5 1 3-529 然後以先前己描述的方式被執行,給出下列結果: sc = G0T0(STATE(w) ,N) = GOTO(VO,S) = 2 W = { vO } ’ id = 6 τ: 1 0 («article [SING3 FLU3] al) 2 0 («noun [SING3] a2) 30 (NP [SING3] (1,2)) -1 0 0 - 本纸ΛΛΛ遍《中a困家捸準(CNS)甲4規格(210 x 297公釐) 82.6. 40,000 ------------------------裝------ΤΓ------線 (請先閲讀背面之注意事項再填寫本頁) A6 B6
五、發明説明() 4 0 («verb 5 0 (VP 6 0 (S
[SING3] a3) [SING3] (4,3)) (5)) (請先閲讀背面之注意事項再項寫本頁) 嫌濟部中喪鑼瘳爲工消i#社印w A = { u 2 } U 3,0 = { u2 } 所述方法然後回返到該語法解析常式,其中,由於A 並非空的·在步驟305之動作常式係被叫用。 在此動作常式中,動作列表査詢字組# *endnark 〃 以及狀態2。此得出〃 s h i f t 6 "(移轉6 ),因此Q = {u2,6,*endiaark,a3}。所述方法然後自該動作常式回返 到該語法解析常式,其中該移轉常式係在步驟3 1 1被叫 用。在此,在步驟502, U4,0首先被啓始化成空集合 ,之後.接下來的步驟503 — 509得出下列结果: -1 0 1 - 本纸ΛΑΛ遍*中as家律苹(CNS)甲4規格(210 X 297公釐) 82.6. 40,000 A6 B6 五、發明説明() id = 7 T: 1 0 (^article [SING3 PLU3] al) 2 0 (*noun [SING3] a2)
3 Ο (NP
[SING3] (1,2)) 4 0 («verb [SING3] a3)
5 0 (VP
[SING3] (4,3)
6 0 (S (5)) 7 0 («endmark a4 ) ------------------------裝------.玎------線 (請先閲讀背面之注意事項再填寫本頁) 經濟部t*蠓攀屬晨工消#« G: vO 4- z 6 u2 f- x 7 w6 U 4,0 = { w6 所述方法然後回返到該語法解析常式,在其步驟31 2 ,計數i偽被增加1以得出i = 4。步驟3 1 3然後檢 査是否U4,0是空的。由於為否(N),此時,步驟3 1 -1 0 2 - 本娬»人廋遍期中國a家標準(CNS)甲4规格(210 X 297公釐) 82.6. 40,000 A6 B6 «濟部t**♦屬·工潙ί #社_« 五、發明説明() 6檢査是否有一基元。該结束符號仍然存在(Y),因此 結束符號$偽在步驟318被讀入。一些啓始化然後出現 在步驟303,以及 A =U4,0={wS}。由於 A並非空的 ,該動作常式係在步驟305被叫用。在步驟403査詢 動作列表得減降 3 之後,在步驟412, R 受成為 {<w6 , x7 , 3 , end s y π bo 1, a 4 > },之後,所述方法經由步驟 417回返到該語法解析常式。在後者中,由於 R並非 空的,該減降常式像在步驟307被叫用。在該減降常式 的步驟603,有關規則的左手邊部分係決定出:N = TOP。該減降常式之進一步蓮作最後得出: i d = 8 T: 1 0 («article 2 0 (^noun 3 0 (NP 4 0 («verb 5 0 (VP -1 0 3 - [SING3 PLU3] al) [SING3] a2) [SING3】(1,2)) [SIHG3] a3) [SING3] (4,3)) ------------------------裝------tr------線 (請先閲讀背面之注意事項再塡寫本頁) 本纸张尺廑遴明中國國家攆孕(CNS)甲巩烙(210 X 297公货) 82.6. 40,000 A6 _B6_ 五、發明説明() 6 〇 (S (5)) 7 0 (*endnark a4 ) 8 0 (TOP (6,7)) G:V〇 — Z6 <r U2 <r 28 ir ul U 4 , 0 = { u 1 } 所述方法回返到該語法解析常式,並然後在執行步揉 310、 304之後,該動作常式被叫用。在步驟304 ,動作列表被對結束符號"$"和狀態 1作査詢。此得 出動作#接受# (accept)以及節點ul亦被指定定予變 數r和id 8被指定予變數result。所述方法經由步揉 413和415回返到該語法解析常式。該移轉常式傜在 該語法解析常式之步驟311被叫用。然而,由於該集合 Q偽空的,因此該移轉常式無作用並且步驟3 1 3係達到 。在此,一檢査然後被作出,以決定是否U5,0為空的。 由於為否,此畤,步驟316檢査是否有一基元或是一結 束符號存在。此為否(N )。在步驟3 1 7 ,所獲得的分 -104- 本斌張AJt*«中B國家攆準(CNS)甲4規格(210 X 297公釐) 82.6. 40,000 ------------------------裝------.玎------線 (請先閲讀背面之注意事項再塡寫本頁) 308659 A6 B6 五、發明説明() (請先閲讀背面之注意事項再埸寫本頁) 析然後以一括弧結構的形態被寫出,與所找出分析有關的 id偽被指定予變數result。此得出下列者(為清楚起見 基元本身係予涵括入): result = 8
8 Θ (TOP
(S (VP [SING3] (VP [SING3] 〇article [SING3 PLU3] A) («noun [SIHG3] nan (*verb [SING3] eorks)))) 經濟♦中夹屬雇工消f鎿社印鼇 (^endmark .)) 該語法解析常式然後達到結束位置3 1 5 ,回到該語 -1 0 5 - 82.6. 40,000 本娬罹尺廋遢《中國國家律準(CNS)甲4現格(210 X 297父釐) 經濟部中*樣攀屬晨工消f #杜印· A6 B6 五、發明説明() 法解析常式的方法之後,步驟205偽達到,其中一檢査 然後被作出,以決定是否該語法解析常式已傳送出一结果 不等於零。由於為是(Y),因此一檢査然後在步琛20 9被作出,以決定是否違反計數偽等於零。由於亦為是( Y),因此所述方法停止在步驟2 1 1。 該語法解析單元關於違反機制的多樣以及適用持性現 將參照一些例子詳細描述。這些例子偽有關於自然語言處 理的領域之事實並無限制意味,如此作的原因只是因為這 些例子比較容易了解罷了。 在下述例子中,假設依據表8的文法傜可適用。吾人 假設餿至装置的信號偽被轉換單元101分段成基元宇串 :w A nan works . 〃。然後處理方式完全同於先前的例子 ,其中輸入字串為Λ A nan works.",就該文法的減降規 則 4。在此時,樹狀結構T有下列形態(為清楚起見基 元變數ai係為基元本身所取代): T: 1 〇· («article [SIHG3 PLU3] A) 2 0 (#noun 【SING3】 man) 30 (NP [sing3] (1,2)) -1 0 6 - 本紙Λ又度Λ»!中國国家棵準(CNS) τ 4规格(210 X 297公釐) 82.6. 40 000 ---------------------------裝------,玎------線 (請先閲讀背面之注意事項再塡寫本頁) 缦濟_中夹*♦屬晨X消ί鎿社印a A6 B6 五、發明説明() 4 〇 Overb [SIHG3] work) 在該文法規則 4之減降中,其中一名詞子句(NP) 和一動詞偽被減降至一動詞子句(VP),欲被減降語辭的 數目並不一致。在此情況下,待擻指示之處理偽如下: VP(Getal :NP(Getal), *verb ( Geta 1),
Fdecl 111111 111111 111111
Fact 001000 110111
Fvalidated 001000 110111 決定靥於相同組群有效持戲指示之交集乃得出一違反 ,因為該交集偽空的:
Funif (Getal) 0 0 0 0 0 0 — +1 因此關於來自右手邊部分語辭之持'戲間的一致性有一 本蛱Λ又度遠用中國國家標準(CNS) T 4规格(210 x 297 乂法 82.6. 40.000 丨—---------------------裝------.耵------線 (請先閲讀背面之注意事項再堉寫本頁) 經濟部中典«婆40工消ft合作钍印s A6 ___B6 五、發明説明() F t e a p 1之決定得出:〇 〇 〇 〇 0 0 Ftemp2之決定得出:〇〇〇〇〇〇 左手邊部分目前特徽指示之決定得出: Fact (Gatal) = ( 0 0 0 0 0 0 OR 0 0 0 0 0 0 ) AND 1 1 1 1 1 1 = 0 0 0 0 0 0 -^· +1 關於待擻之傳遞至左手邊部分的語辭一違反現亦被找 到,因此在離開整合常式時,該違反計數有計數2。 若所述方法現再度回返到該減降常式,步驟606檢 査是否該違反計數偽大於在步驟2 0 2被啓始化為零的受 數 threshold。由於為是(Y),此時,步驟6 0 7撿査 是否亦在步驟2 0 2被啓始化為零的受數new-threshold ' 係等於變數 threshold。此亦為是(Y),此時,在步驟 6 0 9, new-threshold偽被賦予值2。該減降常式不再 逛缳,所述方法回返到該語法解析常式並繼續步驟3 1 0 。所有集合A,Re和R為空的,因此在步驟3 1 1移轉 常式被叫用。集合 Q亦為空的,因為動作常式尚未被叫 用。因此,僅Ui + l,〇係在移轉常式被啓始化為空集合, 之後,结束位置5 0 9直接達到。所述方法回返到該語法 解析常式,在此,在步驟3 12,i然後被增加。步驟3 -1 0 8 - ---------------------------^------#------^ (請先閲讀背面之注意事項再填寫本頁) 本紙恨尺度適用中囷國家樣半(CNS)肀4規格(210 X 297么、釐) 82·6. 40,000 經濟部中央標準局員工消i?-<s-!vii-tii.:-: A6 B6 五、發明説明() 1 3然後檢査是否Ui,Q偽空的i此為是(Y)。在步.驟 3 14,值0然後被指定予變數result,之後,語法解 析常式到逹結束位置3 1 5。 所述方法回返到該語法解析單元之主常式,之後,步 驟2 0 5檢査是否變數result有一值不等於零。此為否 (N ),因此所述方法繼績執行步铤206。步驟206 檢查是否變數 threshold 由一值大於一預先設定的值 MAX。假設在目前的情況下 MAX具有值20.則對此問題 之解答為否(N)。在步駿2 08,受數 threshold之 值然後被固定在 2 + 1 = 3 並且值 3 亦披指定予變數 new-threshold。’該語法解析常式然後在步驟2 0 4再次 被叫用。 該語法解析常式然後由啓始化G和T而再繼缠,並 讀入第一基元。若所述方法再次到達該文法之減降規則4 ,則整合再次得出 2膣違反之計數。然而減降常式之步 驟6 0 6現顯示出計數並未大於 thireshold(N),因此所 述方法繼續執行語法解析常式的步驟6 1 1 - 628。在 步驟6 1 8加入一節點至 T之後,該違反計數器之位置 亦被指示出。此得出: i d = 5 -1 0 9 - i請先閔讀背面之注意事項再項寫本頁) I裝_ 訂· 用中國因家控半(CNS) Τ 4現烙(2ΐυ x 297 ) 82.6. 40.000 A6 經濟部中央標準局S工消f合ιτίινϊ.·:.: _ B6 五、發明説明() T: 1 0 (*artici 2 0 («noun 3 0 (NP 4 0 («verb 5 0 (VP A = { u3 } U 3,0 = { u3 } 所述方法然後回返到該語法解析常式,其中,由於A 並非空的,在步驟305之動作常式係被叫用。 所述方法谢續,該文法規則 1之減降再次顯示出一 違反,因為屬於VP之目前的特徵指示偽為零。由該違反 計數器所指示的計數因而變成為3。然而,計數仍然不大 於threshold,(其偽在步驟6 0 6檢査),致使所述方 法ϋ缅。無進一步規則之違反被發現到,因此該語法解析 -1 10- [SING3 PLU3] the) [SING3] man) [SING3] (1,2)) [SING3] work) [SING3] (4,3)) --------------------「------裝------tr------. (請先閲讀背面之注意事項再塡寫本頁) 尽適用t國國家槔苹(CNS)甲4現格(2i〇 X 29?公货) 82.6. 40,000 S0S659 A6 B6 五、發明説明( 常式最後得出下列分析結果 T : 10 Oart ic le [SING3 PLU3] the) [SIMG3] nan) 3 0 (ΝΡ [SING3] (1,2)) 4 0 ( * ν e r b [SING3] works)
5 2 (VP
[SING3] (4,3))
6 3 (S (5)) 7 0 («endmark ------------------------裝------'玎------11· (請先閲讀背面之注意事項再塡寫本頁> (6,7)) 經濟部中央標準居3工消泞合作;c:
8 3 (TOP 在步驟3 1 7, T偽被以一括弧結構形態寫出,並且 屬於所得出分析之 id係被指定予變數result。此得出 result = 8 -111 闱中國国家作·半(CNS)甲4規格(2i0 X 乂釐) 82.6· 40,000 經濟部中喪標準局員工消1Γ-合1rfi.v!l·*.: A6 _____B6_ 五、發明説明() 8 (3 TQP [] (3 S [】 (2 VP [] (〇 MP [SING3] (0 «article [SIHG3 PLU3] the) (0 *noun [SING3] Ban)) (〇 «verb [S1NG1 SING2 PLU1 PLU2 PLU3] work))) («endaark [].)) 該語法解析單元主常式之步驟2 〇 5然後檢査是否變 數result偽不等於零。此為否(n),因此所述方法趙 續步驟2 1 〇,其中一修正常式係被執行。在目前有自然 信號之處理的例子中,一此類型的修正常式可包含有一如 申請案ΕΡ-Α-0 052 459號中所描述的詞形變化修正程式 结合於依據本發明之語法解析常式。其所得出的結果可在 -112- rn司中 祕(加 8277ΊΓ( (請先《讀背面之注意事項再塡寫本頁) _裝· 訂. 經濟部中央標準局**工消ΛΗ合作a印ti A6 B6 五、發明説明() 此作有利的應用,其中對那些在其中規則之違反被找出的 減降步驟係有一指示。該語法解析單元之主常式然後達到 結束位置2 1 1 ,之後,所獲得的分析結果和所修正的信 號偽可供作進一步處理。 此例子顯示出該装置係適用於參照一糸统規則檢驗信 號,並然後參照所獲得的分析結果執行一修正動作。 在文法規則(或条統規則)確實適用於本發明方法之 前,使得這些規則形成為一適用於本發明方法之形態是必 要的,所述形態包括一動作列表、一 g 〇 t 〇列表和一特徴 列表,此特徴列表係一與該等規則聯繫的特徽指示架構。 令一語法解析程式適用於處理待定信號之程序,通常偽使 得一呈一些重寫規則(依據某一文法規範)形態之文法被 寫並然後該文法被编譯,亦即適用於由一電腦單元自動處 理的一些列表係自該文法導出。自一文法推導一動作列表 和一 g D t 0列表偽習知於此項技藝中。依據本發明推導一 特徵列表現將參照圖1 1所顯示的方法詳細描述。由啓始 位置1101開始,步驟1102自文法讀入所有定義的 持徵供作處理。每一持歡然後在步驟1 1 0 3被賦予一序 號。步驟1 104決定了持微指示披定義所需要的 N-位 元字组的號碼。此號碼係由所定義特戡的總數以及由 N 所決定。對於在程式化語言C所規劃的安装實施,以及利 用 Unix作業糸統,N = 32偽一適當選擇。具號數〇的 規則然後在步驟1 1 0 5被讀入。屬於左手邊語辭的第一 -11 3 - 冬尺^通用中SS家桴準(CNS)甲4规格(210 X 297公货) 82.6. 40 000 --------------------一------装------,玎 (請先閲讀背面之注意事項再墣寫本頁) S0S659 A6 ___B6_ 五、發明説明() (請先《讀背面之注意事項再塡寫本頁> 組群然後自步驟1 1 0 6中的規則被讀入。持擻指示然後 在步驟1 107被決定出。若此涉及到一定義在文法中的 組群,此組群所包含的特徴係參照此定義被決定。若涉及 到直接指示在該文法規則中的箪一個持徵,則由此一持歡 的名稱所指示的组群正好包括了該一特歡。此外,亦可容 許藉由增加或減除預先定義的特擻組群,而在一文法規則 中定義一组群。該特徴指示然後藉由在一長度為特戡數目 的零(zero)字串中代之以一査(one)而形成,其中毎 一値零具有一順序號碼對睡於一所涵括特歡的順序號碼。 所獲得的字串然後映射到在步驟1 1 0 4中所獲得 N-位 元字組的號碼。步驟1 1 08然後檢査是否一完金相同的 持戤指示在右手邊部分偽已知。若為是(Y),距此先前 決定的持擻指示的距離係在步驟1 1 09決定。在步驟1 1 1 0 ,所獲得的資料然後被以一適當的記憶結構( 經濟部中央標準局貝工消"合作社印5仪 下在 。一並.例 ,重的 否係 7 下入一構該同 是群 ο 有讀之結據相 査组 1 則被構弧依全 檢此 1 規 5 結括係完 後 ,驟的 1 億 一並前 然} 步前 1記為組先 1Y缠目 1 當製集至 1{繼否驟適複則加 1 是法是步一偽規被 1 為方査在 。構寫偽 驟或述檢傜 6 結重標4-步 。所 3 則 1 億一指11 。中後 1 規 1 記每 一 出辭然 1 此 1 此對中 寫語並 1 ,驟 ,係其 } 的入驟 }步中群及 re前謓步 Y 續 1 組以 tu目被 - <繼1 擻 , UC於 2} 是法表持序 tr在 1N 為方在的排 S 存 1 ί 或述示碼予 ry群 1 否 。所顯编則 Ιηα組驟為辭後偽中規 me一步若語然子其寫 82.6. 40,0( 戈通用中家桴準(CNS)甲4規烙(210 X 297公» ) A6 ____B6 五、發明説明() (請先閲讀背面之注意事項再填寫本頁) 、屬於表8文法的待戤組群。 C 表 1 1 ] ((linn) (mm) (1—111111)) (()(111111)) (()()) (()()()) ((111111) (111111) (1—111111)) 該等特徵之順序為:SING1 SING2 SIHG3 PLU1 PLU2 PLU3。籍由對编碼待戡組群提供以指到相同右手邊部分内 完金相同組群的指標,在一组群相同的所宣告持擻内,有 関符合的決定乃可加速達成。在步驟11〇9中所決定的 距離係對該指標所作。 經濟部中央標準局貝工消費合作.fi印k 依據本發明,該等特歡之處理給出了相當多的優點。 依據本發明操作之一辨識条統的設計員因而可精確地決定 出信號可辐離理想信號並仍可接受到達何種程度。此給出 了相當大的優點,特別是在進人信號為不完整或摂毀,例 如由於感測機構不精確的情況下,其中此等信號傜非常弱 ,或者是其中此等信號本來就有些許變異(例如手寫字或 語音信號)。 關於以重窝規則導入的特徵,適配於本發明依據一文 法架構所寫的文法之多樣以及適用待性將參照一些例子詳 細描述。這些例子偽有関於顯示在表1 2中的文法規則。 這些規則(其並非共同存在)僅用以顯示出依據本發明作 -115- 82.6-40,000 用中围国家柃半(CNS)甲4蚬格(210 X 29了公楚> 經濟部中喪標準马Λ工消費合作杜印夂 A6 B6 五、發明説明() 配合設計之常態文法的多樣性。其應用並非侷限於自然語 言處理。 〔表 1 2 ]
//Ftrs = SING1 SING2 SING3 PLU1 PLU2 PLU3 DUMMY //Getal = SING1 SING2 SING3 PLU1 PLU2 PLU3 //Dum : DUMMY 0 S :NP(Getal), VP(SING1+SING2+SING3+PLU1+PLU2+PLU3) 1 NP(Getal) :*det(Getal), *noun(Getal+Dum). 2 NP(PLU3) :*noun(Getal). 規則 〇顯示出一特徴組群可藉由加缌特擞而形成。 組群 Getal偽等於在VP定義的組群。此意味一測試係 對整合中對睡的目前特戡指示間符合性作出。若欲免除掉 對符合所作的測試,如規則 1中所示,偽可將一虛設的 特擻加至該組群 G e t a 1。組群” G e t a I + D u π ”不等於组群 ” Getal”並因而無符合測試被實施。在規則 2,持歡” PLU3”總是被指定予 NP。以此方式,係可導入不再需要 是與一詞語有關的特擻。 -1 1 6 - 氏尕尺Ji適用中國國家慄毕(CNS) T 4規丨各(210 X 297 ) 82.6. 40,000 -----------------------------裝------.玎------f (請先閲讀背面之注意事項再塡寫本頁)
Claims (1)
- 經濟部中央標準局員工消費合作社印策 六、申請專利範圍 1 · 一棰用於語法信號分析之装置,包括有: ——轉換單元(10 1)供將一輸入信號轉換成基元以及 轉換成對應於此等基元的常態ib基元; ——圖形辨識單元(102)被連至該轉換單元 > 供藉由 參照一文法提供常態化基元之字串在每一情況下的語法 分析; ——記憶體單元(1 0 3 )供儲存該文法,該文法包括有 被Μ重寫規則所排序並且亦包含對應於常態化基元之詞 語的語辭;特徴在於: 該轉換單元包括有特徵析取機構用於自一基元導出特澂、 ---- ----— 用於將自該基元所導出的特徵聯接在一起Μ形成至少一個 目前的特徵組群、以及用於將所述至少一個目前的特徵組 ' 、 一_---- - _ ,~ 群指.賦予對應於該基元的至少一個常態化基元, 一 ------ 該文法包括有隨附於該等語辭之所宣示的特激組群,Μ及 ** — - 該圖形辨識單元包括有用於目前的和所宣示的特徵組群之 丨圓〆 整合的機構。 2 ·如申請專利範圍第1項所述用於語法信號分析之 裝置,其中該圖形辨識單元高括有饑構用Κ依據目前的和 所宣告的特徵組群,將一違反計數指定予語法分析。 3 ·如申請專利範圍第2項所述用於語法信號分析之 裝置,此裝置包括有機構用於在假若該違反計數超過一臨 界值時中斷語法解析,以及有機構用於在假若該違反計數 超過該臨界值時提高該臨界值和機構用於重新啟始語法解 本纸張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) ---------一------訂------I (請先閱讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 A8 B8 C8 D8 六、申請專利範圍 析。 4 ·如申請專利範圍第2或3項所述用於語法信號分 析之装置,此装置包括有修正機構,若該違反計數不等於 零時,其係被致動。 5 ·如申請專利範圍第2或3項所述用於語法信號分 析之装置,此装置亦包括有警告機搆依據該違反計數而被 致動。 6 ·如申請專利範圍第1 — 3項中任一項所述用於語 法信號分析之装置,其中一特徴組群係K 一二進位數字表 示。 7 ·如申請專利範圍第1 一 3項中任一項所述用於語 法信號分析之装置,其中該轉換單元包含有偵測機構用Μ 將輸入信號轉換成一電子信號。 8 · —種參照儲存在一記憶體中文法之語法信號分析 方法,包括有下列步驟: —將一輸入信號轉換成基元Μ及轉換成對應於此等基元的 常態化基元; 一藉由該文法對該等常態ib基元之字串在每一情況下作語 法分析;特激在於: 該文法包括有所宣告的特徵組群,K及 --^〜 所述方法亦包括有下列步驟: —自一基元推導出目前的特徵, -结合由該基元所導出目前的特勸Μ形成至少一個目前的 -2 - 本紙張尺度適用中國國家標準(CNS ) Α4規格(210 X 297公釐) (請先閱讀背面之注意事項再填寫本頁)A8 B8 C8 D8 經濟部中央標隼局員工消費合作社印製 六、申請專利範圍 1 1 特 澂 組 群 1 1 | — 將 所 逑 至 少 —* 個 巨 J—C- 刖 的 特 徵 组 群 指 定 予 對 應 於 該 基 元 的 1 I 常 態 化 基 元 Μ 及 請 先 I 1 閱 I — 整 合 0 前 的 和 所 宣 告 的 特 徵 組 群 0 讀 背 1 \έ I 9 如 申 請 專 利 範 圍 第 8 項 所 述 參 照 儲 存 在 一 記 憶 體 冬 1 I 意 1 | 中 文 法 之 語 法 信 號 分 析 方 法 其 中 該 文 法 包 括 有 語 辭 Μ 重 事 項 1 I 寫 規 刖 排 序 並 對 每 -- 重 寫 規 則 分 布 於 —_. 左 手 邊 部 分 和 . 右 再 填 1 寫 手 邊 部 分 以 及 其 中 所 述 語 法 解 析 包 括 有 — 減 降 步 驟 用 以 頁 1 藉 由 依 據 一 包 含 了 一 對 應 於 該 巨 刖 語 辭 之 字 串 之 右 手 邊 部 1 1 分 的 可 適 用 重 寫 規 則 該 左 手 邊 部 分 重 寫 該 等 巨 前 語 辭 1 ! 之 字 串 以 形 成 該 語 辭 將 巨 前 語 辭 之 字 串 減 降 成 一 a 前 的 1 訂 減 降 語 辭 其 特 徵 在 於 所 宣 告 的 特 m 組 群 ί系 白 該 文 法 與 1 該 等 語 辭 结 合 在 於 對 每 減 降 步 驟 為 了 決 定 出 在 此 減 1 1 降 步 驟 中 所 獲 得 百 » t- 月 所 減 降 語 辭 之 巨 刖 的 特 徵 組 群 整 合 1 1 係 實 施 在 有 關 於 該 可 適 用 重 寫 規 則 之 語 辭 之 所 r^· 告 的 和 巨 1 前 的 特 激 組 群 上 : Μ 及 在 於 整 合 包 括 下 列 步 驟 1 | — 決 定 每 — 所 告 的 特 徵 組 群 和 對 應 之 g 前 的 特 徵 組 群 間 1 1 之 Λ*Α* 付 合 並 且 若 不 付 合 被 找 到 的 話 增 加 一 違 反 計 數 1 1 — 決 定 對 應 於 完 全 相 同 的 在 右 手 邊 部 分 中 所 宣 告 的 巨 »'« 月ϋ 1 I 特 徵 組 群 間 之 A*/V 付 合 並 且 若 不 符 合 被 找 到 的 話 增 加 該 1 1 違 反 計 數 > Η 及 1 1 — 對 每 一 宣 告 在 右 手 邊 部 分 中 持 澂 組 群 決 定 出 巨 前 的 特 徵 1 1 組 群 ί 並 且 若 巨 刖 的 特 徵 3- 組 群 不 付 合 任 何 特 激 的 話 t 1 1 1 1 本紙張尺度適用中國國家#準(CNS ) A4規格(210X 297公釐) ABCD 經濟部中央標隼局員工消費合作社印製 六、申請專利範圍 增加該違反計數= I 0 ·如申請專利範圍第9項所述參照儲存在一記憶 體中文法之語法信號分析方法,其中每一所宣告的特徵組 群和對應的目前特徵組群間符合之決定包括了藉由決定出 有關的目前的持澂組群與有關的所宣告持徽組群之邏輯交 集,而決定一有效的特激組群;對應於相互完全相同、在 右手邊部分中所宣告的特徴組群之目前特澂組群間符合之 決定包括了藉由決定出所有對應的有效特徵組群之邏輯交 集,而決定一有效的特徵組群;所述方法亦包括了下列步 驟: a ·编碼所有與一特徵組群中現在的重寫規則之右手邊部 分語辭之一者無關的特徵, b ·決定所有整合的持戤組群以及對應於在有關的重寫規 則中僅出現乙次之所宣告特徵組群之有效的特徵組群 之埵輯組合;Μ及 對每一在左手邊部分中所宣告的特徴組群,目前的特徵組 群之決定包括了: 在宣告於左手邊部分中特澂組群未被宣告在右手邊部分中 時’將所宣告的特徵组群指定予目前的特激組群。 II •如申请專利範圍第9或1 0項所述參照儲存在 一記憶體中文法之語法信號分析方法,其亦包括有下列步 驟: 一若該違反計數超過一臨界值:岔斷語法解析、將該臨界 本紙張尺度適用中國國家標準(CNS ) A4規格(210 X 297公釐) (請先閱讀背面之注意事項再填寫本f ) 訂 Λ ! ab,cd 308659 六、申請專利範圍 值增加至該違反計數與一可調值加總的值、並然後重行啟 動對常態化基元字串之語法解析。 n _ m n m m _ —L m I— _ tn n m T -'a (請先閱讀背面之注意事項再填寫本頁) 1 2 ·如申請專利範圍第9或1 0項所述參照儲存在 一記憶體中文法之語法信號分析方法,其亦包括有下列步 驟: —若經語法解析得出至少兩項解答時,選取具有最低違反 計數之解答。 1 3 ·如申請專利範園第9或1 0項所述參照儲存在 一記憶體中文法之語法信號分析方法,其亦包括有下列步 驟: —若該違反計數不等於零的話,啟動一修正動作。 14 ·如申請專利範圍第1 3項所述參照儲存在一記 憶體中文法之語法信號分析方法,其中該修正動作包括依 據由語法解析程式所傳送的分析令一基元適配3 經濟部中央標隼局員工消費合作社印製 1 5 ·如申請專利範圍第9或1 0項所述參照儲存在 一記憶體中文法之語法信號分析方法,其中若語法解析後 並未傳送一解答Μ及若該違反計數超過一可調值的話,該 警告機構係被致動。 1 6 ·如申請專利範圍第8 — 1 0項中任一項所述參 照儲存在一記憶體中文法之語法信號分析方法,其亦包括 有下列步驟:將特澂組群编碼以形成二進位數。 1 7 · —種編碼特徵之方法,包括有下列步驟: —指定一順序號碼 η予每一特徵, -5 - 本紙張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) 經濟部中央標準局員工消費合作社印製 A8 B8 C8 D8 六、申請專利範圍 一形成一代表一特徵組群並包含二進位值字串之二進位數 ,其係藉由將一第一二進位值放在該具有順序號碼對應於 該等須被涵括於該特徵組群之特澂的順序號碼之字串中所 有位置上,以及藉由將一第二二進位值放在該字串之其他 位置中。 1 8 ·如申請專利範圍第1 7項所述編碼特徵之方法 •其中該等特徵係有關涵括於一文法之重寫規則中的語辭 ,特徵在於所述方法包括有下列步驟: 對每一重寫規則Μ成組群之形態並依據該重寫規則予排序 之方式儲存编碼的特徵組群於該記憶體中,Μ及 若對每一重寫規則成組群並依據該重寫規則予排序之組群 含有一先前完全相同的编碼特徵組群的話,則加入一指標 至此先前完全相同的編碼特激姐群。 1 9 · 一種用於依據申請專利範圍第1 — 3項中任一 項所述方法作信號分析之裝置,其特澂在於: -該特徵取出機構係設計成可自一基元推導出互斥的特ί数 並將此等特徵涵括在目前的特徵組群中,以及 _該圖形辨識單元儀設計成可處理涵括在目前的特徵組群 中互斥的特徴。 2〇· 一種用於依據申請專利範圍第1— 3項中任一 項所述作語法信號分析之裝置,可適用於光學字元辨識, 其中欲由圖形辨識單元所傳送的語法分析包括有至少一個 字元供作辨識,其特激在於: 本紙張尺度適用中國國家梯準(CNS ) Α4規格(210Χ297公釐) (請先閱讀背面之注意事項再填寫本頁) 訂 A8 B8 C8 D8 經濟部中央標準局員工消費合作社印製 六、申請專利範圍 1 1 I — 該 装 置 包 含 儲 存 機 構 供 儲 存 一 有 關 於 欲 辨 識 字 元 並 由 對 1 1 | 應 於 來 自 有 關 的 _ 入 字 串 以 及 違 反 計 數 之 常 態 ib 基 元 的 1 I 基 元 所 形 成 的 字 元 影 像 請 1 1 閱 | — 該 装 置 包 含 有 m 搆 用 於 將 一 所 儲 存 的 違 反 計 數 比 較 於 一 讀 | 面 I 由 圖 形 辨 識 單 元 對 一 個 並 且 相 同 的 被 辨 識 字 元 所 決 定 的 之 1 | 意 1 | 違 反 計 數 以 及 若 該 比 較 機 搆 顯 示 出 所 儲 存 的 違 反 計 數 事 1 項 1 係 大 於 被 辨 識 字 元 的 違 反 計 數 的 話 用 於 由 一 有 關 於 一 存 填 寫 個 並 且 相 同 的 被 辨 字 元 的 字 元 影 像 蓋 寫 — 所 儲 存 的 字 本 頁 1 元 影 像 0 1 1 2 1 一 種 用 於 依 據 申 請 專 利 範 圍 第 1 — 3 項 中 任 一 1 | 項 所 述 作 語 法 信 Ocfe 分 析 之 裝 置 可 適 用 於 光 學 字 元 辨 識 » 1 訂 其 中 該 分 析 包 括 有 至 少 — 個 字 元 供 作 辨 識 其 特 徵 在 於 * 1 該 等 被 饋 入 圖 形 辨 識 單 元 之 常 能 化 基 元 字 串 各 包 含 有 一 itb 1 1 常 態 化 基 元 致 使 在 每 — 情 況 下 對 應 的 語 法 分 析 包 含 實 質 1 I 上 相 等 數 的 供 辨 識 字 元 I 2 2 如 申 請 專 利 範 圍 第 2 1 項 所 述 之 装 置 特 徵 在 1 1 於 被 饋 至 圖 形 辨 識 單 元 之 常 態 化 基 元 的 連 壤 字 串 係 相 互 叠 1 1 合 0 1 I 2 3 一 種 將 代 表 藉 由 一 光 學 掃 描 器 所 獲 得 的 文 字 線 1 I 條 之 一 影 像 元 素 圖 形 轉 換 成 適 於 供 作 圖 形 辨 識 之 基 元 和 特 1 1 ! 激 字 串 的 方 法 包 括 有 下 列 步 驟 1 1 — 將 影 像 元 素 圖 形 區 分 成 實 質 上 重 合 於 供 辨 識 文 字 行 之 平 1 I 行 的 鄰 接 段 1 | - 7- 1 1 本紙張尺度適用中國國家標準(CNS ) A4規格(210 X 297公釐) 308659 as B8 C8 D8 六、申請專利範圍 -將每一鄰接段區分成一些具有一固定影像元素圖形數目 行 一 每 予 項 類 定 指 佈 分 形 圖 素 元 像 ’ 影 行中 的行 度該 寬據 之依 基 成 形 而 起 。 1 徵 在 特 合 出 接 導 行 推 接 元 鄰 基 之 一 項 每 類 的 同 中 相 驟 予 步 賦 前 被 先 已及於 將以括 由 - 涵 藉 元 自 (請先閣讀背面之注意事項再填寫本頁) 訂 經濟部中央標準局員工消費合作社印製 本紙張尺度適用中國國家橾準(CNS ) A4規格(210X 297公釐)
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
NL9300310A NL9300310A (nl) | 1993-02-19 | 1993-02-19 | Inrichting en werkwijze voor syntactische signaal-analyse. |
EP93200893A EP0612018B1 (en) | 1993-02-19 | 1993-03-29 | Apparatus and method for syntactic signal analysis |
Publications (1)
Publication Number | Publication Date |
---|---|
TW308659B true TW308659B (zh) | 1997-06-21 |
Family
ID=19862082
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW082106458A TW308659B (zh) | 1993-02-19 | 1993-08-12 |
Country Status (5)
Country | Link |
---|---|
US (2) | US5550934A (zh) |
EP (1) | EP0612018B1 (zh) |
DE (1) | DE69331044T2 (zh) |
NL (1) | NL9300310A (zh) |
TW (1) | TW308659B (zh) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5892842A (en) * | 1995-12-14 | 1999-04-06 | Xerox Corporation | Automatic method of identifying sentence boundaries in a document image |
US5848191A (en) * | 1995-12-14 | 1998-12-08 | Xerox Corporation | Automatic method of generating thematic summaries from a document image without performing character recognition |
US5850476A (en) * | 1995-12-14 | 1998-12-15 | Xerox Corporation | Automatic method of identifying drop words in a document image without performing character recognition |
US5870700A (en) * | 1996-04-01 | 1999-02-09 | Dts Software, Inc. | Brazilian Portuguese grammar checker |
US6236959B1 (en) * | 1998-06-23 | 2001-05-22 | Microsoft Corporation | System and method for parsing a natural language input span using a candidate list to generate alternative nodes |
US20070118358A1 (en) * | 2005-11-08 | 2007-05-24 | Tom Alexander S | Phrase processor |
US9633005B2 (en) | 2006-10-10 | 2017-04-25 | Abbyy Infopoisk Llc | Exhaustive automatic processing of textual information |
US8145473B2 (en) | 2006-10-10 | 2012-03-27 | Abbyy Software Ltd. | Deep model statistics method for machine translation |
US9047275B2 (en) | 2006-10-10 | 2015-06-02 | Abbyy Infopoisk Llc | Methods and systems for alignment of parallel text corpora |
US9235573B2 (en) | 2006-10-10 | 2016-01-12 | Abbyy Infopoisk Llc | Universal difference measure |
US8548795B2 (en) * | 2006-10-10 | 2013-10-01 | Abbyy Software Ltd. | Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system |
US8214199B2 (en) * | 2006-10-10 | 2012-07-03 | Abbyy Software, Ltd. | Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions |
US20080086298A1 (en) * | 2006-10-10 | 2008-04-10 | Anisimovich Konstantin | Method and system for translating sentences between langauges |
US8195447B2 (en) | 2006-10-10 | 2012-06-05 | Abbyy Software Ltd. | Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions |
US9645993B2 (en) | 2006-10-10 | 2017-05-09 | Abbyy Infopoisk Llc | Method and system for semantic searching |
US9984071B2 (en) | 2006-10-10 | 2018-05-29 | Abbyy Production Llc | Language ambiguity detection of text |
DE102007006084A1 (de) | 2007-02-07 | 2008-09-25 | Jacob, Christian E., Dr. Ing. | Verfahren zum zeitnahen Ermitteln der Kennwerte, Harmonischen und Nichtharmonischen von schnell veränderlichen Signalen mit zusätzlicher Ausgabe davon abgeleiteter Muster, Steuersignale, Ereignisstempel für die Nachverarbeitung sowie einer Gewichtung der Ergebnisse |
US8959011B2 (en) | 2007-03-22 | 2015-02-17 | Abbyy Infopoisk Llc | Indicating and correcting errors in machine translation systems |
US8812296B2 (en) | 2007-06-27 | 2014-08-19 | Abbyy Infopoisk Llc | Method and system for natural language dictionary generation |
US8219407B1 (en) | 2007-12-27 | 2012-07-10 | Great Northern Research, LLC | Method for processing the output of a speech recognizer |
US9262409B2 (en) | 2008-08-06 | 2016-02-16 | Abbyy Infopoisk Llc | Translation of a selected text fragment of a screen |
US9244902B2 (en) * | 2011-10-20 | 2016-01-26 | Zynga, Inc. | Localization framework for dynamic text |
US8989485B2 (en) | 2012-04-27 | 2015-03-24 | Abbyy Development Llc | Detecting a junction in a text line of CJK characters |
US8971630B2 (en) | 2012-04-27 | 2015-03-03 | Abbyy Development Llc | Fast CJK character recognition |
RU2592395C2 (ru) | 2013-12-19 | 2016-07-20 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Разрешение семантической неоднозначности при помощи статистического анализа |
RU2586577C2 (ru) | 2014-01-15 | 2016-06-10 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Фильтрация дуг в синтаксическом графе |
RU2596600C2 (ru) | 2014-09-02 | 2016-09-10 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способы и системы обработки изображений математических выражений |
US9626358B2 (en) | 2014-11-26 | 2017-04-18 | Abbyy Infopoisk Llc | Creating ontologies by analyzing natural language texts |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4907285A (en) * | 1984-08-24 | 1990-03-06 | Hitachi, Ltd. | Image understanding system |
JPH07107694B2 (ja) * | 1984-08-31 | 1995-11-15 | 株式会社日立製作所 | 文書処理装置 |
US5060277A (en) * | 1985-10-10 | 1991-10-22 | Palantir Corporation | Pattern classification means using feature vector regions preconstructed from reference data |
US4773099A (en) * | 1985-10-10 | 1988-09-20 | The Palantir Corporation | Pattern classification means for use in a pattern recognition system |
US5077807A (en) * | 1985-10-10 | 1991-12-31 | Palantir Corp. | Preprocessing means for use in a pattern classification system |
US4754489A (en) * | 1985-10-15 | 1988-06-28 | The Palantir Corporation | Means for resolving ambiguities in text based upon character context |
US5261009A (en) * | 1985-10-15 | 1993-11-09 | Palantir Corporation | Means for resolving ambiguities in text passed upon character context |
US5133023A (en) * | 1985-10-15 | 1992-07-21 | The Palantir Corporation | Means for resolving ambiguities in text based upon character context |
US4837842A (en) * | 1986-09-19 | 1989-06-06 | Holt Arthur W | Character and pattern recognition machine and method |
US4887212A (en) * | 1986-10-29 | 1989-12-12 | International Business Machines Corporation | Parser for natural language text |
WO1990001198A1 (en) * | 1988-07-20 | 1990-02-08 | Fujitsu Limited | Character recognition apparatus |
JPH0261763A (ja) * | 1988-08-29 | 1990-03-01 | Sharp Corp | 機械翻訳装置 |
DE68928230T2 (de) * | 1988-09-15 | 1998-02-05 | Oce Tech Bv | System zur grammatikalischen Verarbeitung eines aus natürlicher Sprache zusammengesetzten Satzes |
AU624205B2 (en) * | 1989-01-23 | 1992-06-04 | General Electric Capital Corporation | Variable length string matcher |
US5125039A (en) * | 1989-06-16 | 1992-06-23 | Hawkins Jeffrey C | Object recognition system |
US5020112A (en) * | 1989-10-31 | 1991-05-28 | At&T Bell Laboratories | Image recognition method using two-dimensional stochastic grammars |
NL9100849A (nl) * | 1991-05-16 | 1992-12-16 | Oce Nederland Bv | Werkwijze voor het met behulp van een computersysteem corrigeren van een fout in een, in een natuurlijke taal gestelde zin, alsmede een inrichting geschikt voor het uitvoeren van deze werkwijze. |
US5343537A (en) * | 1991-10-31 | 1994-08-30 | International Business Machines Corporation | Statistical mixture approach to automatic handwriting recognition |
US5359673A (en) * | 1991-12-27 | 1994-10-25 | Xerox Corporation | Method and apparatus for converting bitmap image documents to editable coded data using a standard notation to record document recognition ambiguities |
US5317647A (en) * | 1992-04-07 | 1994-05-31 | Apple Computer, Inc. | Constrained attribute grammars for syntactic pattern recognition |
-
1993
- 1993-02-19 NL NL9300310A patent/NL9300310A/nl not_active Application Discontinuation
- 1993-03-29 DE DE69331044T patent/DE69331044T2/de not_active Expired - Fee Related
- 1993-03-29 EP EP93200893A patent/EP0612018B1/en not_active Expired - Lifetime
- 1993-08-12 TW TW082106458A patent/TW308659B/zh not_active IP Right Cessation
-
1995
- 1995-11-27 US US08/562,787 patent/US5550934A/en not_active Expired - Lifetime
-
1996
- 1996-07-02 US US08/674,732 patent/US5784489A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
NL9300310A (nl) | 1994-09-16 |
US5550934A (en) | 1996-08-27 |
EP0612018B1 (en) | 2001-10-31 |
EP0612018A1 (en) | 1994-08-24 |
US5784489A (en) | 1998-07-21 |
DE69331044D1 (de) | 2001-12-06 |
DE69331044T2 (de) | 2002-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW308659B (zh) | ||
Lopresti et al. | A tabular survey of automated table processing | |
US7580828B2 (en) | Automatic or semiautomatic translation system and method with post-editing for the correction of errors | |
Green et al. | Multiword expression identification with tree substitution grammars: A parsing tour de force with french | |
Andersen et al. | Spelling in the Hebrew Bible: Dahood memorial lecture | |
US20150127324A1 (en) | Natural language parsers to normalize addresses for geocoding | |
Bayraktar et al. | An analysis of english punctuation: The special case of comma | |
JP2008282366A (ja) | 質問応答装置、質問応答方法、質問応答プログラム並びにそのプログラムを記録した記録媒体 | |
Vydrin | Mande languages | |
Joyce | Constructing a Large-Scale Database of Japanese Word Associations. | |
Loftsson et al. | Developing a PoS-tagged corpus using existing tools | |
CN101499056A (zh) | 倒排参考句型语言分析方法 | |
Nagata | Language family relationship preserved in non-native english | |
Freschi | The Role of paribhāṣā s in Mīmāṃsā: Rational Rules of Textual Exegesis | |
POPOVIČ et al. | Processing of documents and queries in a Slovene language free text retrieval system | |
Krause et al. | Lemmatizing German newspaper texts with the aid of an algorithm | |
List | Computational historical linguistics | |
KR101080880B1 (ko) | 외래어의 자동 음차 표기 방법 및 장치 | |
ABBAS | Semi-Semantic Annotation: A guideline for the URDU. KON-TB treebank POS annotation | |
Roochnik | COMPUTER-BASED SOLUTIONS TO CERTAIN LINGUISTIC PROBLEMS ARISING FROM THE ROMANIZATION OF ARABIC NAMES.(VOLUMES I AND II) | |
Peters | Prescription and normativity in the evolution of inner-circle Englishes | |
Kamal et al. | Improve Academic Query Resolution through BERT-based Question Extraction from Images | |
Schilder et al. | A Flexible Table Parsing Approach | |
Anderl et al. | Some Reflections on the Mark-up and Analysis of Dūnhuáng Manuscripts: Exemplified by the Platform Sūtra | |
Hu et al. | An MT-Oriented Study of Corresponding Lexical Chunks in Business Correspondences from English to Chinese |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |