TW308659B - - Google Patents

Download PDF

Info

Publication number
TW308659B
TW308659B TW082106458A TW82106458A TW308659B TW 308659 B TW308659 B TW 308659B TW 082106458 A TW082106458 A TW 082106458A TW 82106458 A TW82106458 A TW 82106458A TW 308659 B TW308659 B TW 308659B
Authority
TW
Taiwan
Prior art keywords
group
grammar
grammatical
primitive
special
Prior art date
Application number
TW082106458A
Other languages
English (en)
Original Assignee
Oce Nederland Bv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oce Nederland Bv filed Critical Oce Nederland Bv
Application granted granted Critical
Publication of TW308659B publication Critical patent/TW308659B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18162Extraction of features or characteristics of the image related to a structural representation of the pattern
    • G06V30/18171Syntactic representation, e.g. using a grammatical approach
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/196Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
    • G06V30/1983Syntactic or structural pattern recognition, e.g. symbolic string recognition
    • G06V30/1985Syntactic analysis, e.g. using a grammatical approach
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)
  • Machine Translation (AREA)

Description

306G59 A6 B6
經濟部中央標準局W工消费合忭.vitl'. J 五、發明説明() 發明背景 發明之領域 本發明僳槪略有闋用於語法信號分析之裝置,包括有 :一轉換單元供將一输入信號轉換成基元(primitives) ---------- 以及轉換成對應於此等基元的常態化基元(nor aalized P r i b i t i v e s); —圖形(p a 11 e r η)辨雜單元被連至該轉 、----------'-------- 換單元,供藉由參照一文法(granaiar)提供第猫化基元 之字串(string)在每一情況下的語法分析;以及記憶 體單元供儲存該文法,該文法包括有被以重寫規則(in -----—~- -------- rewriting rules)所排序(ordered)並且亦包含對應於 常態化基元之詞語(terminals)的語辭(terms);本發 明亦有問於一種用於語法信號分析之方法、有關於一種用 於编碼(c 〇 d i n g)特戲(f e a t u r e s )之方法、以及有關於 一種用於將一代表了藉由光學掃描器所獲得文字行( lines of text)的影像元素圖形(pixel pattern )轉 換成適合於作圖形辨識之基元和特戧的字串。 前技說明 信號在許多種的技術領域中被處理。然而,這些信號 時常因為各種原因而受得不完整或損毀。在大多&的情況 下,有完整或未損毀的信號是較為有利的。如果事先#道 完整或未損毀的信號必須滿足某些規則.那麼就可以檢査 - 一·- 是否所得到的信號確實滿足這些規則,並且如果不滿足的 逯用中國國家榨準(CNS)甲4規烙(21U X 297公货) 82.6. 40 000 (請先閲讀背面之注意?項再項寫本頁) —裝‘ 訂. ...¾丨. 308659 a6
五、發明説明() 話,就捨棄或是修正這些信號。 經濟部中央標準局WK工消"合作.^tl,,」 $ 一種習知於此項技藝中用於檢查是否信號滿足某些規 則的技術為語法分析法或語法解析技術。對於此語法分析 法或語法解析技術之介紹諳分別參看"數位圖形辨識〃( Digital Pattern Recognition) , Springer-Ver 1 ag 於 1 9 8 0年出販,K . S . F u编著,第9 5 - 1 3 4頁,以及*數 位影像處理〃 (Digital inage processing) , John Wiley & Sons 於 1978 年出販,W. K. Pratt 编著,第 574-578 頁。 於此法中,信號首先被分段單元( primitive e 1 e m e η.υ.。這些基#元(其後將表示為基 元)然後被分類並由一常態化基取代。一此暖類型的 常態化基兀偽某一類別(class)或類項(category)的 原型。然後檢査是否以此方式所獾得的常態化基元之字串 棋足一文法〇 —文法包括了一些規則,熟知為重寫( rewriting)或生産(production)規則,各文法由一些 語辭(t e r m s)、詞語(t e r i n a 1 s)或非詞語( non-terainals )所组成,並且每一文法預先決定出一種 方式其中一组語辭可被重寫以形成一非詞語。該文法亦定 義了一啓始符號(starting symbol)。該啓始符號像一 非詞語。所定義的頚別或類項以及因而該等常態化基元係 一對一地(one by 〇ne)對塍於來自該文法的詞語。 一倒反的語法解析程序係由恶用適當的重寫規則至常 尽兔用中圉國择半(CN'S)甲4 )見格(21〇 X 297 '广贫) 82.6. 40,000 (請先閲讀背面之注意事項再項寫本頁> _裝· 訂· A6 B6 3 G 8 6 5 9 JL、發明説明( 態化基元的字串以及至中間所獲得的重寫結果,直到該啓 始符號係被獲致所組成。重寫規則之應用在每一情況中偽 意謂將較簡單的語辭接在一起以形成更為後雜的語辭,並 最後造成信號呈樹狀結構之層次结構组成,亦熟知為一語 法解析樹(parsing t r β β)、解法樹(s ο 1 u t i ο n t re β) 或分析(analysis),具有啓始符號在根部位置、該等常 態化基元位在枝葉部位置、以及所應用重寫規則之非詞語 位在中間節點位置。該文法定義了所有這樣可允許的層次 結構組成。 若在某一時間下,當該啓始符號尚未被找到時,於語 法解析程序中不可能睡用任何進一步的重寫規則,則該信 號就不符合該文法並且該信號將被否绝。然後,可能可以 調整一或多傾基元或常菔化基元,以使得該文法中的規則 可符合:該信號然後就被修正了。此類型之一修正法係示 於 # 數位彩像處理 〃 (Digital Iiaage Processing)中, 由》. Pratt 出販,第 571 頁,圖 20.2-3。 若該語法解析程序確實傳送了啓始符號,則該信號符 合了所預先決定的規則,並且其有所允許的層次結 f组成 之一者《若該信號之驗證為唯一所擗者,則該啓始符號已 到達此項事實就足以證明該信號係符合該等規則。萬一信 號之辨識亦為裝置之目的,則辨識之標的物可由所提供的 分析直接導出:辨識之一標的物偽由非詞語符號來表示, 而非詞語符號為一對應於供辨識標的物之次樹狀結搆組成 (請先閲讀背面之注意事項再填寫本頁)
T % 經濟部中央標準局貝工消"合作:^.印- 卜呔^又通用中國国家桴準(CNS)甲4現格(210 X 297公货) Α, ά(\ ΩΠΠ A6 B6 3 G 8 6 5 9 五、發明説明() 的根部。若一信號已被以此方式轉換成被辨識符號之一字 串,則讓最後所得到的符號(經過一些中間操作之後(若 有需要的話))受到下一個語法解析步驟是可能的,其中 是否所辨識符號之字串符合其他的規則条统之檢査傺被作 出。此然後可導致該等符號之適配(adaptation),以及 此然後可導致該信號之適配。此語法解析步驟將再次産生 一结構化描述,而以此結構化描述進一步的處理係予實施 亦為可能。 各式類型的語法解析程式偽已知。一種亦處理不符合 文法中規則之信號的語法解析程式,以及一與此語法解析 程式相互配合的修正機制偽描述於 EP-A-0361570號案中 在"對自然語言之有效語法解析Efficient Parsing for natura 1 1 anguage)中,K1uwer Acadβic Publisher (1986), H. Tomita 描述了一種 * 一般化 LR 語法解析程式〃 (generalized LR parser)。此語法解 析技術傜依據LR (左到右最又· Left-to-right KUhhost)語法解析技術,一種熟知於此項技运中由 Knuth 於1965年所引入的技術。Toaiita擴展了此LR •藉由使其適用於含混的輸入:在此情況下語法解析 程式:傜可對此一輸入給出多於一個的結構化描述。在自然 語言中含混输入之一實例偽此輸入句子:"He saw a Ban a telescope"(可解為#他以一副望遠鏡看到一個 ----------------------裝------ir------線 (請先閱讀背面之注意事項再塡寫本頁) 經濟部中央標準局员工消CH合汴:-..u',-
82.6. 40,000 A6 B6 308659 五、發明説明() 人"或#他看到一個人帶有一副望速鏡"),其中子句v with a telescope”可為一副詞子句修飾動詞"saw” , 或是為一形容詞子句修飾名詞〃 nan”。G L R語法解析 程式為目前最快速並且最有效語法解析技術之一者。 應用領域 有許多技術領域其中語法解析技術傜可用以檢査並修 正信號。 光學字元辨識糸統係欲藉由一光學捅描器黷入文字( text),並將之轉換成一種可由一電腦做處理之形式的条 统。由該光學掃描器所傳送的電子信號係被取入( thresholding)並以一影像元素圖形儲存於一記億體中。 該影像元素圖形並非原始文字之一精確影像,例如由於光 學条統之不精確、明暗不均(uneven illunination)、 或是於取入中的捨人誤差(rounding error)。亦可能供 掃描的原始文件品質差,字元殘缺、損壞、或是為手寫字 元。然而,所獲得到的信號必須代表字元是眾所周知的。 此認知可藉由令一語法解析程式檢査是否該影像元素圖形 確實有代表字元的結構而加以利用。為達此目的,該影像 元素圖形必須予轉換成一条列的基元或常態化基元,而此 常態化基元係直接對應於來自該文法的詞語,籍此,該等 詞語係相對於該文法的重寫規則被加以檢視。在K . S · Fu (编著者)的"數位圔形辨識#第 1 0 3頁給出了對於手 寫英文字元的基元,以及第 110及以下的頁次給出了一 -----------------J -----裝------TT------線 (請先《讀背面之注意事項再塡寫本頁) 經濟部中央標準局貝工消泛合作::一印^ 又边用中國国家悻芈(CNS)甲4規格(210 X 297公:Ϊ ) 82.6. 40,000 經濟部中夹標準局貝工消费合作江印; A6 _B6_ 五、發明説明() 些描述特定圖形的文法。 下一踱用領域為物體辨識之領域。若僅一小數目的物 髏須加以辨識,則可比較源自於一偵側機構之输入信號與 所有可容許的物體,並決定出何物饈最符合該输入信號。 然而,若涉及到一大量數目的物體,則將每一物體描述為 一组基元偽較為有利。這些描述規則就形成了文法。一输 入信號係被分段成該等基元,並且然後一語法解析程式檢 査是否該文法之規則被符合,以及結果該語法解析程序送 出何物體對睡於所找到的結構組成。在 K.S. Fu (编著 者)的#數位函形辨識",尤其是第 113頁描述了一用 於染色體之辨識的文法。 語法分析方法亦可被較有利地使用於語音辨識。在 K.S. Fu (编著者)的"數位圖形辨識〃第177頁給出了 一語音辨識糸统之一實例。在此裝置中,一磬波處理器( acoustic processor)係緊接著一語音處理器( linguistic pracessor)。經過一些處理操作之後,該聲 波處理器傳送出一串音素(a s t r i n g 〇 f p h ο n e b e s)。此 串音素偽被餒至該語音處理器,其(特別是依據語法分析 規則)將該串音素轉換成一串字(a string of words) ο 語法解析技術可應用於檢査並修正信號之技術領域的 另一例子為#自然語言界面〃 (natural language interface)条统的領域。此類型之一条统偽著重在協助 ------------------一-----裝------.玎------線 (請先閲讀背面之注意事項再塡寫本頁) 通甩中a國家漂準(CNS)甲4現格(210 X 297父货〉 82.6. 40,000 A6 B6_ 五、發明説明() (請先閲讀背面之注意事項再填寫本頁) 人類於其與一電腦条統之交互作甩。此對於例如使得門外 漢可查詢一資料庫偽為非常重要。此類型之一"自然語言 界面"必須容許使用者可以自然語言設想出複雜的問題》 由使用者以自然語言所输入的句子僳由一語法解析程式作 分析,並然後以一適合於餓入該資料庫的形態傳送出一些 問題。此類型之一糸统係在由Wallace所著:〃 以自然語言與資料庫溝通〃 (CoBBunicating with databases in Natural Language),由 Wiley & Sons Inc. (1984年)出販的教科番中被討論。 歐洲專利申請案ΕΡ-Α-0 5 1 3 9 18描述了一種拼音檢 査条统。一語法解析程式之使用於此應用中使得此拼音檢 査条统更具多樣性以幾更精確:被檢査的不僅僅是一描離 的字組(》〇rd),宇組的詞形受化(inflection)以及句 子的語法亦被檢査。結果是對於一錯誤拼字之許多可能的 變化選擇偽大為減少。此外,一語法解析程式(因事物之 本質)亦偽一適當的工具供使用作為對於一自然語言之一 文法檢査器。 經濟部中央標準局貝工消贷合作:α印^ 在機器翻譯条统中,語法解析程式偽適用於分析要® 譯的句子,以及適用於以其文法作用(功能)自所晒譯& 字組合成(synthesise) —被翻譯的句子。 在此一應用中一語法解析程式之利用將可在EP_卜〇 3 5 7 3 4 4號菜中找到。 利用一語法解析程式亦可能重組源自於一受損的# 3 -10- 82.6. 40,000 本用中國國家I?準(CNS)甲4規格(210 X 297公货) A6 B6 30S659 五、發明説明() 記憶髏条統或一差的通訊頻道之不完整或損毀的信號,因 為該等信號偽遵循事先已知的規則。 一語法解析程式亦可較有利地被使用於索引条統。此 類型糸統之目的煤在對一组文字製作索引字之表列。為達 此目的,被減至一常態化形態之名詞和動詞(例如分別為 單數形和不定詞)係藉由一語法解析程式自文韋中被取出 。此類型之一条統係描述於由 C. Berrut和 P. Palmer 所著文聿:〃在一用於自動化索引之表面語法解析程式内 解決文法上不確定性〃 (Solving grannatical asbiquities within a surface syntactical parser for automatic indexing) , ACM Conference on Research and Development in Infornation REtrieval (1 98 6 ) 0 由上述可清楚得知語法解析技術係可適用於許多種的 技術領域中。 特街[整合(feature unificatian) ,___ 語法㈣技J中之一重要進展偽利用^徽整合>獲致 。為達此目的,建立起輸入信號的基元偽被提供^徽。 這些持徴更加詳细地給定出一基元。為此之故,來自文 規則的語辭亦係被提供以持戡。於語法解析處理中,基元 ·—— 一~^ --- 的持^偽相較於該i文法規則中對應語辭的持徽被測試。 3等持戡亦可被傳換至語辭,其接著於語法解析程序中被 ..... - ______ 進一步相對於下一可應用的文法規則作測試。特徴整合使 -1 1 - --------------------U -----裝------.玎------線 (請先閱讀背面之注意事項再蜞寫本頁) 經濟部中央標準局3工消货合诈fxtr):v: i这甲中國國家懔準(CNS)甲4規洛(210 X 297公釐) 82.6. 40,000 五、發明説明( A6 B6 經濟部中央標準局3工消?'/--,riis:fi 得更為複雜的結構組成可以語法解析技術予處理。 特戡整合之一實例係描述於文章〃一般化LR語法解 析程式/编譯程式V8—4:實用NL計《之套裝軟腰" (The generalized L R Parser/conpiler V8-4: A software package for practical HI projects),由 M. Toiaita 出版於 Proceedings of the Coling-90, Helsinki 1990。然而,其中所描述用於實施待戡轚合之 方法之一缺點在於特戡處理之理雜度。雖然一語法解析程 式可以此方式被設計成適用於處理更為複雜的結構组成, 但其對於該語法解析方法用於實際目的之實用性傺棰為不 利,這是因為一大堆額外的步琛被須被加至該語法解析方 法。 本發明之概要 本發明之目的係在於藉由加入一增進功效的並更為多 樣的整合機制,以改菩適用於上述懕用領域之用於信號分 析之裝置。 本發明之原理主要偽奠基於認知到特徴之整合可藉由 成组群地纳入特徴於文法中,並然後對該等待戡组群實施 整合而有效地受到影堪。 依據本發明,在一種於申請專利範圍之前言中所提到 類型的裝置,為達本發明之目的,該轉換單元偽包括有待 (請先閲讀背面之注意事項再填寫本頁> t
T %
Pdf ΐϋ用中國國家棵苹(CNS)甲4规格(210 X 297公釐) 82.6. 40,000 經濟部中央標準局貝工消·nlrii印V-: A6 B6_ 五、發明説明() 徵析取機構(feature extraction means)用於自每一基 元導出特徴、兩於將自毎一基元所導出的特戡聯接在一起 以形成目前的(current)特徵组群、以及用於將目前的 特徴組群指賦予對應於該基元的常態化基元,該文法係包 括有隨附於該等語辭之所宣示的(declared)持擞組群, 以及該圖形辨識單元傜包括有用於目前的和所宣示的持擻 組群之整合的機構。 用於整合之特徵的處理現在可柑當快速地做到,因為 該等待擻不再必須被分別地處理。 依據本發明之另一有利的實施例,其特戡在於該圖形 辨識單元包括有機構用以依據目前的和所宣示的特徴組群 之整合,賦予一違反計數(violation score)至該語法 分析。 以此方式,特擻之族群處理係為一記錄了特獻之違反 的違反機制所延展。若該語法解析程式傳送出一分析,以 此方式則可以在該分析中指示出何(等)基元不符合所要 求的特徵。 依據本發明另一增進访效的簧施例其持徵偽在於裝置 包括有機構用於在假若該違反計數超過一臨界值時中斷語 法解析,以及有機構用於在假若該違反計數超過該臨界值 時提高該臨界值和機構用於重新啓始語法解析。 若該違反計數超過了一给定的臨界值時語法解析係被 中斷。該臨界值然後被增加至一由該違反計數加上一固定 -13- 82.6. 40,000 --------------------* -----裝------ΤΓ------線 (請先Μ讀背面之注意事項再填寫本頁) 經濟部中央標準局貝工消货合作.'1印^ A6 _B6_ 五、發明説明() 值所決定出的值。語法分析然後重新開始。因此,在一些 語法分析執行中,一或多項分析係最後在被提供以一違反 計數下被傳送出。所傳送的分析正好就是那些在一給定的 範圔内有最低可能的違反計數之分析。造些步驟産生了一 適配的臨界機制,致使該用於信號分析之語法解析機制的 應用性係大為提高。該等特擞之違反係可被容許到一額外 可調整的程度。為該装置所可容許之變異的程度偽可依據 該裝置之目的而調整。由於這些步驟,該語法解析機制( 其原本因其待性的問係而為固定不妥的)已變得非常具彈 性。 依據本發明裝置之另一項改進偽由下述事簧而獲致: 該裝置包括有修正機構,若該違反計數不等於零時,其供 被致動。 此修正步驟可較有利地利用分析中所指示出的遠反。 依據本發明装置之又一項改進係藉由將待徴組群以一 二進位數字來表示而獲致。 附圖之簡略說明 本發明現將參照一些圖式予詳細說明,其中·· _1為一依據本發明之装置的方塊概示圖; 圆2為一語法解析單元之一主要常式之流程圖; 圔3為一語法解析常式之一流程圖; 圖4為一動作常式(actor routine)之一流程圖; -1 4 - 通用中國國家作準(CNS)予4規格(2i0 x 297公货) 82.6. 40 000 --------------------,-,>-----裝------ΤΓ------線 (請先W讀背面之注意事項再«寫本頁) 308659 t6 B6 _ 五、發明説明() 圖5為一移轉常式(shift routine)之一流程圖; 圖6為一減降常式(reducing routine)之一流程圜 圖7為一整合常式(unification routine)之一流 程圖; 圖8係一用於將元素_形轉換成一串基元之方法的流 程圔程圖; 圖9 a到9 d顯示出適合於應用在字元辨識領域之詞 語和待徴之定義,以及一串基元; 圖1 0顯示出一串基元;以及 圖11偽一種推導出持戡指示器之架構之方法的流程 圖。 較佳實施例之詳細說明 圖1顯示出依據本發明之一装置。一供分析的信號S 偽被頡至一轉換單元1 0 1。該轉換單元將該信號S轉換 成為一基元流P和一常態化基元流L以及目前的特徴族组 。此詞彙流L,結合於該基元流P (若有需要的話),係 被饋至該語法解析單元102。該語法解析單元102在 各情況下讀入該常態化基元流L之一部分,並驗證是否此 已被讀入且包含一串常態化基元和目前的待徵族组的部分 符合一文法。此文法偽呈一些列表(table)的方式被儲 存在記億體1 0 3中。若該串常態化基元符合該文法,則 一或多痼分析A偽由該語法解析單元所傳送。一分析偽給 -15- --------------------------裝------,玎------M (請先閱讀背面之注意事項存蜞寫本頁) 衣紙Kt逯用中BB家棵準(CNS>甲4規格(21U X 297 〉 82.6. 40,000 A6 ___B6_ 五、發明説明() 定出該對應於所謓入常態化基元串之輸人信號之所述部分 之一結構化描述(為該文法所允許者)i在驗證顯示出所 描述的特徴被遠反的情況下,該語法解析單元便增加一違 反計數。在此情況下,所找到的分析係連同有闋的違反分 數被該語法解析單元所傳送。由該語法解析單元所傳送的 該等分析然後可供作進一步之處理,連同該原始的信號s 、該等基元流P以及該常態化基元流L。 此裝置之一受化設計俱藉由提供一修正單元104 ( 以斷線表示於_1中)於其上而獲致。若該語法解析單元 並未傳送一解答,或是若該語法解析單元僅傅送出該違反 計數不等於零並且因而已發現到持撖已被違反之解答時, 該修正單元係被ώ用,致使一修正機制被啓動。該修正機 制可以各種方式來建構。依據一第一S施例,修正係藉由 該更改由該語法解析單元所傳送的分析而為之。依據一第 二實施例,該等基元偽依據該語法解析單元所給定有鼷於 所違反的特擻之資訊而修正。若裔要的話,所修正的基元 流Ρ’然後被餵至該語法解析單元。 經濟部中央標準局貝工消ί合作;"ι,,.<- 在接下來之一變化設計中,該裝置亦被提供以一聱告 裝置105被由該語法解析單元所致動。若該語法解析單 元發現到該輸入信號S過度偏離該文法中所給定的規則時 ,該警告裝置便傳送出信號W。 若該装置被建構為一光學字元辨識糸統,則轉換單元 101亦包括有一光電轉換器,以藉由一掃描機制將光學 -1 6 _ 82.6. 40,000 (請先Μ讀背面之注意事項再填寫本頁) 本用中國國家彳S半(CNS)甲4说格(210 X 297公货〉 A6 B6 308659 五、發明説明() 翰入信號轉換成為一電子信號,此電子信號然後被分段成 為基元流P。該等基元偽被映射在常態化基元上並且(提 供以目前的恃徽組群)偽被餓至該語法解析單元。參照該 文法,該語法解析單元決定出何基元圖形代表一特定的字 元並送出連績被辨識的字元。 若該裝置被建構為一文法檢査和修正糸統,則該修正 信號偽一文聿資料流。轉換單元101將此資料流分段成 為字组並然後決定出常態化基元(詞棠類項)和目前的特 徴組群(詞彙待質)。該語法解析單元然後一句一句地讀 入該詞彙流並檢査是否每一句子皆滿足該文法中所給定的 語法。若有任何違反的話,該修正單元便依據所偵測到持 徴之違反更改該等基元。所修正的基元流P’然後被送出 〇 藉由將所辨識的字元餓至一較有利地配備有所述文法 檢査和修正糸统之拼字檢査器,可改進先前所描述的光學 字元辨識条統。 必須注意的是,該裝置之利用並非侷限於以上所描述 的恶用領域。該装置可有利地應用至信號必須被加以分析 供作辨識或供作驗證以及一先決要件為這些信號遵守特定 規則的所有領域。該裝置之方法現將參照圖1至8詳细加 以說明。 一供分析的信號S係被饋至圖1的轉換單元1 0 1 , 其將此信號轉換成為一基元流P和一常態化基元流L以及 -1 7 - ------------------j· ------裝------訂------線, (請先閲讀背面之注意事項再埔寫本頁) 經濟部中央標準局貝工消IfH合作:aM)t 用中國gj家f?':_MCNS)甲4現恪(21ϋ X 297公货) 82.6. 40, 經濟部中央標準局貝工消费合汴汪印公 A6 B6 五、發明説明()
目前的持徵組群。在該轉換單元1 0 1中要被實施的方法 依據應用領域將有不同的實施例。用於光學字元辨識之一 實施例稍後將詳細討論。該語法解析單元之方法現將參照 圖2至7說明之。依據本發明該語法解析單元之主常式係 參照圔2之流程圖詳偽苗述。由啓始位置201開始,在 步驟 202,變數:result, threshold 和 new-threshuld傺被啓始化為零並且變數 delta-threshold偽被啓始化為D E L T A。在步® 2 0 3,該詞*流L之部分係被讀入,包括一糸列被提供以目 前的持徵組群之常態化基元,以及一結束符號$係被加入 該宇串。然後在步K204,該語法解析常式被叫用。該 語法解析常式驗證是否所讀入的宇串谋足以一些列表形態 儲存在記®β中之文法。如果滿足的話,呈一樹狀結構形 態之一或多個分析(其中毎一分析有一分離的根節點)係 被傳送,並且變數result含有指到該等根節點的指標。 若該語法解析未發現到一分析,則該變數result含有值 0。在步驟205,一檢査然後被作出,以決定是否該受 數result有一值不等於0。若為否(N)的話,該方法 藉實施步驟206而逛續,其中一檢査然後被作出,以決 定是否該愛數 threshold有一值大於一預先決定的數值 MAX。若是(Y)的話,該主常式到達结束狀態207 。在此狀態,該語法解析單元未能找到一分析,並且該輸 入信號必須被以不符合所給定的規則(至少不落於該Μ A -1 8 - —---------------J-----裝------,玎------線— (請先閲讀背面之注意事項再塡寫本頁) 氏伥火‘又边用中國國家丨f苹(CNS)甲4規烙(21ϋ X 297公货) 82.6. 40,000 經濟部中央標準局員工消φ-ί^ΙΓίίΜ.-ν A6 B6 五、發明説明() X值所許可之違反數目之範圍内)而否決。該驗證不成功 之事實可予加以利用•例如,用以致動一警告裝置。若變 數threshold並未超過該值M A X ( N ),則 new-threshold.和 delta-threshold 之和係在步琢 20 8被賦予妥數threshold。在該語法解析常式之執行中, 違反計數已被指定予 new-threshold。Delta-threshold 有一重置值。因此,相對於該變數 threshold被由相同 的步驟增加的情況下,在少許步驟中,就該情況而言分析 係被發現到具有一最小數目的違反,並在違反之數目方面 有一些分布,該分布偽由 delta-threshold之值所決定 。實施步驟208之後,該語法解析常式偽再次被叫用。 若在步缀20 5該變數result有一值不等於零(Y). 一檢査傜在步驟209被作出,以決定是否該違反計數為 零。若為否(N)的話,一修正常式係在步驟2 10被叫 用。該修正常式之簧施例偽依據應用領域而定。較有利地 ,該修正常式可利用由該語法解析常式所傳送的分析,所 述分析指示出那些在該處規則之違反已被發現到的減降步 驟。該語法解析單元之主常式然後到達結束狀態2 1 1 , 其後,所獲得之分析以及所修正之信號係可供作進一步之 處理。若在步驟209所述違反之數目係等於零(Y), 則該結束狀態2 1 1偽立卽達到。 圖3顯示出該語法解析常式之一實施例。由啓始位置 30 1開始,在步驟302該基元計數器i、計數器識別 -1 9- -----------------i -----裝------1T------痒.- (請先閲讀背面之注意事項再填寫本頁) 闱中國国家作準(CNS)甲4規格(210 X 297公釐) 82.6. 40,000 經濟部中夬標準局3工消5·合作;fi印^ A6 _B6_ 五、發明説明() 號id、違反計數器、圖形結構化堆叠G以及分析樹T係 被啓始化,並且元素 vO傜被加至該集合U0,0:U0,(Uv0} 。此元素vO傜被賦予狀態s = G。而且,在此步驟,該被 提供以詞彙資料(常態化基元、目前的待徴組群)之第一 基元係被讀出該字串。在步驟303,計數器 j然後被 啓始化為0,該等集合R, Re和Q被啓始化為空集合並 且集合 A被令為等於U0,0:A={vO}。在步思3 0 4 —檢 査然後被作出,以決定是否 A為一空集合。若為否(N ),則動作常式在步驟305被叫用。若為是(Y)的話 ,一檢査偽在步S306被作出,以決定是否 R為一空 集合。若為否(N),則滅降常式在步留307被叫用。 若為是(Y)的^,一檢査偽在步驟308被作出,以決 定是否Re為一空集合。若不是的話,e-減降常式被叫用 。若是的話,步驟3 1 0達到。同樣的,步驟3 1 0在實 施步驟305、 307和309之一者後達到。該等步驟 305和307偽分別詳細顯示在圖4和6中。步驟30 9,該 0-減降常式,未詳細導出惟相對於前技作必要修 改以使得此常式可適用於本發明中之作法偽類似於對詳细 導出在圖6中之減降常式的改變。在步驟310,—檢査 傜被作出,以決定是否該等集合A, R, Re皆為空集合。 若為否(N),則該方法回返到步驟304。若為是(Y )的話,該移轉常式在步驟311被叫用。像詳示於圔5 中並將於後述中詳細描述。實施了移轉常式之後,該方法 -2 0 - 本呔:7^’~沒通用中a国家挖苹(CNS)甲4規格(210 X 297公货) 82.6. 40,000 ------------------;-----裝------.玎-----—線 f (請先閲讀背面之注意事項再填寫本頁} 3086M :: 3086M :: 經濟部中央橒準局員工消 五、發明説明() 逛缥步驟3 1 2,其中基元計敦器 i傜加1。一檢査然 後在步駿3 1 3被作出,以決定是否Ui,J為空的。若為 是(Y),值0在步驟3 14被置入受數 result ,並且 此表示無分析可被找到,之後,結束位置3 1 5達到。若 Ui,J非為空的,一檢査在步驟3 1 6被作出,以決定是 否存在下一個基元或是结束符號。若是(Y)的話,其在 步驟3 1 8被讀入。若不是(N)的話,所獲得的分析在 步驟317被寫走。該語法解析常式然後到達結束位置3 15,之後.該方法继缅實施語法解析常式。 圔4顯示出該動作常式之一實施例。由啓始位置40 1開始,在步驟402 —目前的最高黏 vc被藉由自用於 此目的之該集合‘ A取出而決定。一動作列表然後在步驟 403披詢用。該動作列表偽由所定莪的文法所導出並對 一給定狀態 S以及定義於該文法中之語辭指定出動作。 該動作列表之登錄形式決定了何動作係有關於該目前的最 高點 vc。在步驟404,對此登錄所給定的第一動作然 後被讀入。一檢査然後在步驟405被作出,以決定是否 〃接受"動作被给定。如果是(Y )的話,vc 偽在步驟 40 6被指定予變數r並且變數result被加上值id。 若為否(N)的話,一檢査係在步驟407被作出,以決 定是否動作#移轉 s"被指定。若是(Y)的話,元素 < v c , s, category, primitive〉被加至集合 £1。若不是 (N)的話,一撿査在步驟409被作出,以決定是否動 -2 1- —----------------------裝------.玎------線- (請先閲讀背面之注意事項再填寫本頁) A6 B6 五、發明説明( 作〃減降p"被指定。若為是(Y)的話,一檢査係在步 驟4 1 0被作出,以決定是否規則 P為一空的産生規則 。若事實上規則 P是(Y) —空的産生規則的話,元素 <vc, P, category, priBitive〉供被加至集合 Re。若規 則P不是(N) —空的産生規則的話,步驟4 12係被執 行,其中對於 G 中vc之毎一直接後缠者X, —元素 <vc, X, P, category, prinitive〉係被加至集合 R。若 在步驟409發現到動作#減降P"並未被指定(N), 則步驟4 1 3被執行。步斑4 1 3在步S406、408 、4 1 1和4 1 2之後亦偽被執行。在步铤4 1 3 —檢査 偽被作出,以決定是否對於在步驟403中所決定的登錄 ,下一動作亦傈被指定在動作列表中。若為是(Y)的話 ,該動作係在步琛414被讀入,之後,該方法偽雄鑛步 驟405。若為否(N)的話,一檢査係在步驟415被 作出,以決定是否下一宿詞語,亦即下一锢常態化基元適 用於目前基元的情況。若為是(Y)的話,此下一傾詞語 係在步驟416被讀人並且該方法雄績再次執行步驟40 3。此作法之效果為使得可處理不明確的輸入,亦即多於 一艏類項可被指定予基元並且這些基元因而可被映射在多 於一値常態化基元或詞語上。若在步驟415發現到在目 前的基元之情況下無後钃的詞語,則該動作常式到逹其结 束位置417並且所述方法回返到該語法解析常式之步驟 3 0 5 〇 82.6. 40,000 (請先W讀背面之注意事項再填寫本頁)
T ‘‘ 戈逯甩中a因家悻半(CNS)甲4規烙(210 X 297公货)
經濟部中央標準局員工消费合作社印製 五、發明説明() 圖5顯示出該移轉常式之一實拖例:.由啟始位置5 0 1開始,集合U i + 1 , Q係在步驟5 0 2被敗始ib到空集合 元素然後在步驟5 0 3被取自Q :該元素有一狀態其 稍後將被指定為s。在步驟5 0 4 ,該計數器i d然後被 加 1 ,並且一具辨識i d之最高點係被加至兮析樹T。 兩最高點 w和X然後依據在步.驟5 0 3中自集合Q所 選取的元素,在步驟5 0 5被加至圖形结搆it堆叠 G,最 高點 w具有標記 s以及最高點 X具有標記1 d,一邊框 自《到X以及一邊框自s到最高點(在自集合Q所選 取的元素中所涉及者):在步驟5 0 6 ,被提供以標記s 的 w然後被加至集合U i + 1 , Q 。在步驟5 0 7 ,一檢查 然後被作出,Μ決定是否 Q仍然有下一個元素。若為是 (Υ )的話,此元素係在步驟5 0 8被選取,並且據此, 步驟5 0 5和5 ◦ 6然後被執行。若步驟5 0 7顯示出無 下一個元素存在·則該移轉常式到達结束位置5 0 9並且 所述方法回返到該語法解析常式之步驟3 1 1 。 由啟始位置6 0 1開始,一元素除在步驟6 0 2自集 合 R被取出。該規則之左手邊部分(其披在步驟6 ◦ 2 所取出的元素所參照到)然後在步驟6 0 3被指定予變數 Ν。一檢查然後在步驟6 0 4被作出,Μ決定是否所參照 到的規則含有特徴。此係涇由參照一被儲存在該記憶體中 並自該文法中所推導出的特徵列表而為之。若為是(Υ ) 的話,該整合常式係在步锶6 0 5被叫用。執行該整合 -2 3 - 本紙張尺度適用中國國家標隼(CNS ) Α4規格(21〇Χ 297公釐) . 裝I 訂 Μ (請先閱讀背面之注意事砀再填寫本頁) A6 _B6_ 五、發明説明() 常式之後(其中一違反計數器係被更新),一檢査傺在步 驟606被作出,以決定是否該違反計數器超過了臨界值 threshold。若為是(Y)的話,一檢査僳在步*607 被作出,以決定是否變數 threshold和 new-threshold 為相等。若為是(Y)的話,該埋反計數器之值係在步® 6 0 9被指定予受數new-thireshold,然後,结束位置6 10達到。若為否(N)的話,一檢査偽在步® 608被 作出,以決定是否受數超過了違反計數器。若為是(Y) 的話,步驟609亦被執行,然後,結束位置6 10達到 。若在步想6 0 8發現到變數 new-threshold並未超過 違反計數器,該減降常式之結束位置610則直接達到。 一到達該減降常式之結束位置610時,所述方法回返到 該語法解析常式之步骐3 0 7。既然事實上無任何減降, 該語法解析常式亦將到達其结束位置315,值零被指定 予變數 result (因為集合Uid為空的)。此導致臨界 值在主常式中被提高並且語法解析被再度叫用。
若在步驟604發現到該規則不含待戡,或者是若步 驟6 0 6顯示出該違反計數器並未超過妥數threshold, 則該減降常式繼缅執行步驟6 1 1。步思6 1 1決定出在 該圖形结構化堆叠 G中之所有的節點,而對於此堆叠有 一路徑自 xc到y長度為2|p|-2,其中p為規則p 之右手邊部分之語辭的數目。第一個 y然後在步驟6 1 2被取出並被指定予變數 yc。在步驟6 1 3, —向量 L -24- ------------------_ ----裝------"-----—線 (請先聞讀背面之注意事項再埙寫本頁) 逯用中國國家作半(CNS)甲4规烙(210 X 297 ) 82.6. 40,000 垣濟部中夬桴準局筠工消贷合汴;:'1|)·:.: A6 B6 五、發明説明() 然後藉由自供減降之規則之右手邊部分取有關於語辭之 id被決定出。步驟6 14然後決定出所有的狀態s ,對 此有一節點 w在G中致使該》係yc之一直接後趄者 .以及對此該狀態 s亦可在一 goto列表之登錄(此登 錄你由有關於 w狀態和與目前規則之左手邊部分符合的 語辭所決定出)中被找到。該goto列表傜儲存在記憶鼸 中並且係自文法所推導出。第一狀態 s然後在步思6 1 5被取出並指定予該愛數 sc。在步驟6 1 6, —集合W 然後被産生,其具有所有在步驟614所決定出的節點 作為元素。一檢査然後在步驟617被作出,以決定是否 該集合Ui,j含有一元素u具狀態sce若為是(Y)的 話,步驟6 1 9 &査是否在該圃形结構化堆β G中已經 有一邊框致使來自《之元素偽為ζ的直接後龃者。若為 是(Υ)的話,ζ所指到的id然後在步驟620中被加 至向量L。若在步驟6 19中所加諸的條件不諶足,則步 越621被執行。在步驟621,計數器id係被加1; —被提供以在步驟6 0 5所決定的違反計數器以及被提供 S照到直接後繼節點之節點偽被加至該分析樹 T :兩節 點,一節點U具標記SC以及一節點Z具標記id傺被 加至G ;以及一邊框自U到ζ和邊框自ζ到所有在W 中被提及的節點w亦被加至G。步驊622然後檢査是 否具標記sc的u在集合A中被提到。若為否(N)的 話,步驟623被執行,其中對每一 q, —元素<u, ζ, -裝------訂------線., (請先閱讀背面之注意事項再塡寫本頁) -25-
甲4現格(210 X 297公货) 82.6. 40,000 絰濟部中央標準局員工消s,合作社印.- 306659 A6 B6 五、發明説明() <3 , c a t e r 〇 r y , p r i π i t i v e >傜被加至集合 r ,對該 q現 存的規朗並未有一空的右手邊部分以及對該 q —減降動 作你被賦予在該動作列表之登錄中(對有関於 U的狀態 和有間於該類項的詞語)。若為是(Y)的話,所述方法 组鑛執行步驟6 24。此步思執行步揉6 2 0之後以及在 執行步驟6 2 3之後亦偽被執行。 若在步驟617所加諸的條件並未被淇足,則執行步 驟6 1 8。在步驟6 1 8中,計數器id你被加1 ; 一被 提供以在步驟6 0 5所決定的違反計數器以及被提供參照 到直接後姐節黏之節點係被加至該分析樹 T ;兩節點, 一節點u具檩記sc以及一節黏z具揉記id偽被加至 G ;以及一邊框自u到z和邊框自z到所有在W中被 提及的節點η亦被加至G;u亦係披加至 A和Ui,j。 所述方法然後趄鑲執行步驟624,其中一檢査係被 作出,以決定是否在步琛6 14中有下一掴狀態s。若為 是(Y)的話,此狀態傜在步想625被指定予sc並且 所述方法雄績執行步親6 16。若為否(N)的話,步揉 626檢査是否有下一値 y在步驟6 1 1中被決定出。 若為是(Y)的話,步驟627將此下一艇y指定予yc 並且所述方法趄續執行步驟6 13。若為杏(N)的話, 該減降常式到達結束位置6 2 8並且所述方法回返到該語 法解析常式之步驟307。 圖7顯示出依據本發明該整合常式之一實施例。此常 -2 6 - ------------------^-----裝------、玎------線! (請先閲讀背面之注意事項再填寫本頁) 尽呔張々1边用t國國家«半(CNS)甲4現烙(210 X 297公货) 82.6. 40,000 A6 B6 五、發明説明() 式傜在該減降常式之步驟605被叫用。此常式同樣的可 由該 e -減降常式所叫用(該語法解析常式之步揉3 09 ),但是在此將不作詳細描述。該整合常式利用了儲存在 該記億體中以及由該文法所導出之待撖列表。二進位制解 碼的特戡组群在後述中將稱為"特擻指示"(feature indicator) 〇 由啓始位置701開始,步驟702藉由對右手邊部 分之所宣告的特徵指示決定出後者特撳指示之邐輯交集與 對應之目前的特欺指示,而決定了有效的特戡指示。步驟 7 0 3然後檢査是否在先前步驟中所獲得的每一有效的特 戡指示偽不等於零。若為否(N)的話,則其指示出有所 供給基元之字串、詞語和特擞中所沒有的待戡。在此情況 下,步驟704係被執行,其中若一有效的持欲指示係為 零的話該違反計數器傜被增加某一數目。此步S之後以及 若步驟7 0 3顯示出所有的.有效特戡指示係不等於零的話 •步驟705則被執行。步驟706然後檢査是否所有所 獲得被整合的特戡指示係不等於零。若為否(N)的話, 則其指示出在輸入字串中持擻之間無共通的協定,雖然該 等規則確實要求此點。在此情況下,該違反計數器偽在步 驟707被增加某一數目(對毎一傾等於零之被整合的持 徴指示)。在此情況下亦可以利用加椹數目。步驟707 之後以及若步驟7 0 6顯示出所有所獲得有效的特徵指示 偽不等於零的話,步驟708偽被執行。步驟708藉由 -27- ------------------^-----裝 -------,玎------線 J , (請先閲讀背面之注意事項再填寫本頁) 張、χϋ用中围国家饽半(CNS)甲4觇烙(210 X 29?公;ί ) 82.6. 40,000 A6 B6 經濟部中央標準局員工消5·合作,fl印\ 五、發明説明() 決定出在步驟706中所獲得所有特徽指示,以及對匾於 在右手邊出現乙次所宣告恃激指示之有效待徴指示之組合 ,而決定了一特戡指示Fteapl。步驟709然後藉由取 右手邊部分所有所宣告特徽指示之組合的相反者,而決定 了一特擻指示Ftei»p2。若在左手邊部分所宣告的特擞指 示亦係被宣告在右手邊部分的話,對應之目前的待徴指示 偽藉由區分而決定出 Ftempl和Fteisp2之組合與所宣告 的特徴指示而被決定。若在左手邊部分所宣告的特徴指示 未在右手邊部分中被宣告的話,則目前的特擻指示偽由取 出所宣告的待徴指示之值而獲得。步驟711然後檢査是 否所有在步驟710中所獲得的特徵指示係不等於零。若 為否(N)的話,’其顯示出該等特戡無法依據該等規則而 交遞。在此情況下,在步驟712該違反計數器對每一個 所獲得等於零之目前的特徴指示係增加。該整合常式然後 到達结束位置7 1 3。若步驟7 1 1顯示出所有所獲得的 持徽指示係不等於零的話,則結束位置7 1 3係直接逹到 ,所述方法回返到該減降常式之步驟605。 必須注意的是,依據本發明之整合機制(在先前自整 合機制一可能的實施作法已被給定)係亦可適用在一語法 解析程式,此語法解析程式不一定霈要是為一GLR—語 法解析程式。 此方法和裝置之多樣化現將參照一些實例詳細描述之 〇 -2 8 _ I-- 一 (請先閲讀背面之注意項再填寫本頁) —裝. 訂. —線7 4¾¾、.戈通用中國國家找苹(CNS)甲·!現烙(21U X 297公:^ ) 82.6. 40,000 A6 B6 308659 五、發明説明() 在第一例子中,所述方法和裝置偽用於字元辨識。 假設一光學信號s傜由一行一行地藉著一掃描裝置掃 描一載有影像的介質而得。信號S係由一光電轉換器(含 於圔1之轉換單元101中)轉換成為一電子信號。此信 號係被分辨並以一影像元素圖形之形態鍺存在一頁次缓衝 器中。此影像元素圖形然後被讀出並轉換成一基元流P和 一被提供以特擻组群之常態化基元流L。 一種被執行來轉換此一影像元素圖形成為一条列基元 並對這些基元作語法解析之方法之一可行較佳實施例係顯 示在圖8中。 由啓始位置8 0 1開始,被饋至轉換器之影像元素圖 形偽在步驟802被區分成為線條。在步驟803,每一 線條然後被分隔成一些位元映射行(bit nap colutn), 毎一行為一個影像元素寬。每一位元映射行將包含零或多 屆影像元素蕞集(Pixel c luster)。步駿ί 8 0 4然後決 定出影像元素遘集的數目、其長度以及對於每一影像元素 蕞集其位置。在步驟8 0 5,該等位元映射行然後依據在 先前步驟所獲得之資料被標記以一類項,以及相同類項之 鄰接的位元映射行傑被結合。在此同時,移除無法被结合 的位元映射行是較為有利的,除非該等位元映射行係為其 中無影像元素叢集者。在步驟806·毎一最後所得到的 位元映射行(下述中稱為一基元)然後被賦予一常態化基 元,此常態化基元依據該基元所被標記的類項偽為一類項 -29- 用中aa家揉準(CNS)甲 4 現恪(210 X 297 公货) 82.6. 40.000 ---------------------;-----裝------,玎------線' , (請先閲讀背面之注意事項再瑣寫本頁) 經濟部中央標準局貝工消"合作:"*1'、,': 經濟部中央標準局貝工消*13:-',ίί,''-: A6 B6 五、發明説明() 之一原型。而且,每一位元映射行偽藉由賦予持徴而依據 該等由每一基元所含的影像元素裘集而詳細地被給出,所 述特戡亦傜含於該文法中。在步驟8 0 7,被提供以特撤 之常態化基元(此等特激係被结合以形成然後被二進位制 方式解碼的特戡組群)然後被結合成為字串,並且此等字 串被接績地饋至該語法解析單元,之後,該結束位置80 8係達到。 必須注意的是,所述用於將一影像元素圈形轉換成為 一糸列基元之方法係可廣泛適用,而非侷限於使用在此處 所描述的組合。常態化基元和特徴以及該文法之一適酋蘧 取,極有肋於此方法之成功«施。此類型之一適當選擇係 顯示在圖9a—9b中。六種基元類項偽被B分出,對應 於下列顯示在圖9 a中的常態化基元:blank (空白)、 vertical bar (垂直條)、horizontal bar (水平條)、 double (雙條)、triple (三條)以及endaark(結束符 號)。被賦予一基元之待歡係由含於該基元中彩像元素叢 集之幾何形態所決定。在賦予該等特徴中,係利用一假想 的體線(bodylins )和基線(baseline )(參見圖9 c )。最後,一字组空間你假想成位在詞語結束符號上, 並且此完成了欲被餓至該語法解析單元的字串。 必須注意的是,上述類項和對應常態化基元之應用並 非侷限於在此應用中所描述之組合,而是此等類項和常態 化基元偽可更廣泛地應用。一適用於處理一些顯示在圖9 -30- 逯用中國国家棵苹(CNS)甲4规烙(210 X 297公釐〉 82.6. 40,000 ------------------《------裝------,玎------! (請先閲讀背面之注意事項再項寫本頁) Α6 Β6 五、發明説明() a—9b中詞語和持徵之簡單文法之一實例,偽給出在表 1中。目前的偽適用於辨識字元” a ”、” h ”和” η ” ,並且亦可決定出是否這些字元為揉準的或粗醱的。所示 的文法有其非為被傳送之分離的字元,而是整個字组的特 性。與稍後對修正機制之討論有藺者,其將顯示出此為特 別有利。 必須注意的是,由該語法解析程式所作完整的字组( 而非分離的字元)之傳送並非侷限於此處所描述之组態, 而是其亦可睡用於此。 〔表1〕 (請先閲讀背面之注意事項再填寫本頁) •裝 ΤΓ
經濟部中央標準局貝工消ίΗ合作;J //Ftrs = CENTER HIGH-CENTER BOLD NORMAL VIOL LONG-UP LONG-DOWN //Weight = BOLD NORMAL 0 Character(Weight) : a(Weight). 1 Character(Weight) :h(Veight). 2 Character(Weight) :n(Weight). 3 Characters(Weight) :Character(Weight). A Characters(Weight) :Characters(Weight),Character(Weight). 5 START :WORD. 6 WORD :Characters(Weight),*endmark· 7a(Weight):*double(CENTER),^triple(CENTER),^vbar(CENTER,Weight),*blank. 8 h(Weight) :*vbar(LONG-UP,Weight),*hbar(HIGH-CENTER), *vbar(CENTER,Weight),*blank. 9 n(Weight) :*vbar(CENTER,Weight),*hbar(HIGH-CENTER), *vbar(CENTER,Weight),*blank. -3 1 線 通用中a国家桴半 (CNS) r 4说烙(210 X 297公货) 82.6. 40.000 A6 _B6_ 五、發明説明() 七項待徵被定義於此文法中。與該文法之語辭有两的 特徴组群係在對睡的語辭之後以括弧指示出。一項待徽偽 被明示地定義,含有僅一項特擻的特徴组群亦傜被明示地 定義。此文法係以分別被顯示在表2、3以及4之動作列 表、goto列表以及持戡列表之形態被鍺存在記憧β中。 〔表2〕 (請先閲讀背面之注意事項再項寫本頁) 經濟部中央標準局S工消費合作杜印\
State $ *blank ^double *endmark *hbar -triple *vbar @ALL 0 sh7 sh8 1 acc 2 sh7 shlO shS 3 re3 4 reO 5 rel 6 re2 7 shll 8 shl2 9 re 4 10 re6 11 shl3 12 shl4 13 shl5 14 sh!6 15 re7 16 re8/re9 〔表3〕 -32- 裝· 訂· .線· 82.0. 40,000 边用中as家悌竿(CNS)甲4現丨各(21D X 297公» ) 308659 五、發明説明( A6 B6
State Character Characters WORD a h n 0 3 1 2 1 4 5 6 2 9 4 5 6 [表, 4〕 0 ((0011000) (001100)) 1 ((0011000) (001100)) 2 ((0011000) (001100)) 3 ((0011000) (001100)) k ((0011000) (001100) (0011000)) 5 (()()) 6 (()(0011000)()) 7 ((0011000) (1000000) (1000000) (1000000 , 0011000)()) 8 ((0011000) (0000010 , 0011000) (0100000) (1000000 , 0011000) ()) 9 ((0011000) (1000000 , 0011000) (0100000) (1000000 , 0011000) ()) (請先閱讀背面之注意事項再填寫本頁) 經濟部中央標準局貝工"·"合作:^印V: 在表4中,行數偽直接對應於來自顯示在表1中該文 法之規則。一對括®係對睡於來自一文法上規則之語辭。 在一對括弧之間,有零値、一個或多個二進位制编碼的持 戡组群隨附於(有閎於)對睡的語辭。定義在文法中之特 擞被轉換成二進位制编碼的持戡组群之方式稍後將描述。 在現將詳細說明之方法的例子中,係假設轉換單元把 下一串的常態化基元饋至該語法解析單元,此常態化基元 字串偽被提供以目前的特徵组群: -3 3 - 文通用中國國家桴'半(CNS)甲4巩格(21U X 297公货) 82.6. 40,000 A6 B6 五、發明説明() double (CENTER) tripe (CENTER) vbar (CENTER, BOLD) b1 vbar (CENTER, BOLD) hbar (Η IGH-CENTER) v b a r ( C E N T E R , B 0 L D ) b 1 e n d π a r k 〇 對應的基元字串偽顯示在圖9d中。為淸楚起見,特 徴组群並未被以二進位制编碼形態顯示出。在整合常式之 討論中,此二進位制编碼將被利用到。 變數” result ”,” threshold”,"delta-threshold”, ” new-threshold”在步琛2 0 2 (圖2)被啓始化之後, 由語法解析單元所傳送的字串僳披讀入並在步思2 0 3以 一结束符號$作結束。 result = 0 threshold = 0 delta-threshold = 0 ne«--threshold = 0 該語法解析常式然後在步驟2 0 5被BM用。 由啓始位置30 1 (圔3)開始,計數器、i、id、違反 計數器、圖形結構化堆叠G以及樹T係在步® 302被 啓始化,並且元素vO被加至集合U〇,〇 i = 0 i d = 0 違反計數器=〇 G = 0 Τ = 0 -34- 表呔怅遇用中國国家棵苹(CNS)甲4規格(210 X 297 乂釐) 82.6. 40,000 —---------------_-----裝------.玎------線,' (請先《讀背面之注意事項再塡寫本頁) A6 B6 五、發明説明() U 0,0 = { vO} 一詞語和與第一基元ai有關的特徽亦在步驟3 0 2被讀 入。 目前的基元aO, 目前的詞語和待擻:double (CENTER) 計數器然後在步驟303被啓始化為0,該等集合R, Re 和 Q被啓始化為空集合,以及集合 A被令為等於U0,0 <請先閲讀背面之注意事项再填寫本頁) —裝. 訂. 經濟部中央標準局8工消费合作社印¾ R = Re = Q = { } A = { v Ο } 一檢査然後在步驟304被作出,以決定是否 Α為一空 集合。由於A並非一空集合,致使該動作常式被叫用。 該動作常式偽詳示於圖4中。由啓始位置4 0 1開始 ,一元素傺在步驟402中被自 A移除,並且此元素變 -35- 各纸張尺度國S家樣準(CNS)甲4规格(210 X 297公;?!·> 82.6. 40,000
嫌濟部中夹棣準為ΛΧ消费合诈:i-J, V 308659 A6 _B6__ 五、發明説明() 成為目前的節點 vc。在步缀403,動作列表然後對詞 語” dQuble”和狀態 〇被謓取。該動作列表(其係由該 文法導出)傜顯示在表2中。此傳送了動作"shift 7〃 (移轉7)。在步琛405, —檢査係被作出,以決定是 否該動作為"accept"(接受)。由於此為否(N)的話 ,致使步驟407檢査是否該動作為"shift (移轉 s )。由於為是,致使在步揉4 0 8, <v0,7,double,a0> 係作為一元素被加至該集合Q。 Q = Q{ < v 0 , 7 , d 〇 u b 1 e , a 0 > } 步驟413然後裣査是否下一動作出現在於步S403中 所決定的登錄中。由於為否(N),之後,一檢査然後在 步思415被作出,以決定是否下一詞語已披指定予目前 的基元。由於為否(N),致使該動作常式到達结束位置 4 1 7並且所述方法回返到該語法解析常式之步驟3 0 5 〇 既然步驟305 (圖3)已經被處理,所述方法组績步驟 3 10。在此,一檢査然後被作出,以決定是否集合 A, R和Re皆為空集合。由於為是(Y),致使步驟31 1 叫用該移轉常式。 該移轉常式係詳細顯示在圖5中。由啓始位置501開始 ,在步驟502,集合U1,0偽被啓始化成空集合。 -3 6 - --------------------U-----裝------.玎------尊 (請先閲讀背面之注意事項再填寫本頁) 々I通拜]中國國家桴準(CNS)甲4規格(21〇 X 297公釐) 82.6. 40,000 經濟部中央標準局8工消?合作:::^\ A6 B6 五、發明説明() U 1, 0 = { } 在步驟503, —狀態偽被取自Q。 s = 7 froia elenent < v 0 , 7 , d o u b 1 e , a 0 > 在步驟504,計數器 id然後被增加1 ,並且在T 一 節點係被産生為具標記i d並被提供以有關於a i的語法 解析資料。 i d = 1 T: 1 0 (*double [CENTER] aO)
在步摄[505,然後下列者偽被加至G : —節點Η具標 記 s = 7、一節點X具標記id = 1、一邊框自η到X 、以及一邊框自X到 V 0。 G: vO xl w7 在步驟506,具標記s的w然後被加至集合U1,0。 -3 7 - —--------------------裝------ir------線~ - (請先W讀背面之注意事項再塡寫本頁} 尽4氏:'UliS用中國凶孓丨戈半(CNS)甲)规丨各(21U X 29Γ公,货) 82.6. 40,000 經濟部中央標準局貝工消費合作fi印,乂 A6 B6 五、發明説明() U 1,0 = { »7 } 在步驟507,—檢査傜被作出,以決定是否仍有更多傾 元素存在於 Q中。由於為否(N> ,致使所述方法回返 到該語法解析常式自此繼績步驟3 12 (圔3),其中該 計數器像被增加1。 步琢3 1 3然後檢査是否U 1,0為空的。由於為否(N) ,致使步驟316檢査是否有下一緬基元存在。由於為是 (Y),致使在步183 18·詞語和特擻被讀入。 目前的基元:a 1 目前的詞語和特擞:(《triple 【CENTER]) 然後,j, A, R, Re以及Q在步铤303被啓始化。 U 1,0 = { «7 } -38- u氏mi用中囷因家桴羋(CNS) f 4規格(210 x 297公货) 装------Tr------線 r - (請先閲讀背面之注意事項再塡寫本頁) 308659 A6 B6 經濟部中央標準局3工消*ΓΗ合泎.^-.l'^- 五、發明説明() R = R e = Q = { } 步驟304然後檢査是否該 A為空的。由於為否(N) ,A當然含有該元素W7 ,致使該動作常式在步駿305 被叫用。 由啓始位置401開始,此元素偽在步揉402被自 A中取出並且其變成為目前的節點vc。 在步驟403,有囫於目前的詞語之動作列表的登錄 以及有闋於vc之狀態然後被決定出,並且第一動作自此 被讀出。此産生了 shift 11 (移轉11)。步驟405然 後檢査是否該動作被"接受#。由於為否(N),所以步 驟407檢査是苔該動作為一移轉動作。是的,s具有值 11。該 tuple <»7 , 11, triple , al> 然後在步驟 4 0 8 被 加至Q〇 s - 1 1 -39- 通用中國国家桴準(CNS) T 4规丨各(2iu X 297公,货) 82.6. 40,000 ------------------_-----裝------.灯-----|亨 (請先閲讀背面之注意事項再填寫本頁) 五、發明説明() A6 B6 經濟部中央標準局貝工消"合作;1^·-'一 Q = { <w7,11,triple,al> } 一檢査然後在步驟413被作出,以決定是否另有下 一傾動作在由步驟4 0 3所決定的登錄中。由於為否(N ),所以一檢査然後在步思415被作出,以決定是否下 一個詞語已被指定予目前的基元。由於此為否(N),所 以該動作常式到達結束位置417,並且所述方法回返到 該語法解析常式之步驟305 (圖3)。 自此进缅,步驟3 10檢査是否該等集合A, R以及 Re 為空的。由於是的(Y),所以該移轉常式你在步费ί 3 1 1被叫用。 由啓始位置50 1 (圔5)開始,步驟502將集合 U2,0啓始化為空集合。 U 2 , 0 = { } 步驟5 0 3然後自Q之一 tuPl8取一狀態。 s = 11 .自 t u p 1 e < w 7,11, t r i p 1 e,a 1 > 在步驟5〇4, id 然後被增加1並且一節點偽被加 至T0 '纸张~*週用中g國家標準(CN.S) ί 4规烙(210 x 297公货) 82.6. 40,000 (請先閲讀背面之注意事項再塡寫本頁) t 丁 "Γ 五、發明説明() id T: 1 Ο («double 2 0 («triple A6 B6 [CENTER] aO) [CENTER] al) 經濟部中央標準局員工消泞合作:fiM,k 下列者然後在步驟505被加至G ·. —節點w具標 記 s=ll, —節點X具標記id=2, —邊框自w到X以 及一邊框自X到 w 7。 G: vO xl »7 <r- x2 «11 在步驟506,具標記s的w然後被加至集合U2,0。 U 2 , Ο = { w 11 } 步驟507檢査是否有多傾元素存在於 Q中。由於為否 (N),因此所述方法回返到該語法解析常式。 所述方法趄續步驟3 1 2,其中該計數器 i俗被增加1 -4 1 -------------------^ -----裝------訂------線 (請先閲讀背面之注意事項再填寫本頁) •卜適用中國国家摻準(CNS)甲4規格(21ϋ X 297公Ϊ ) 82.6. 40,000 A6 B6 五、發明説明() 步驟3 1 3然後檢査是否該集合U2,0為空的。由於 為否(N),因此步驟3 16檢査是否有下一値基元存在 。由於為是(Y),因此在步驟3 18此具有詞語和特徵 的基元被讀入。 目前的基元:a2 目前的詞語和特徵:(* V b a r [ C E N T E R】) (請先閱讀背面之注意事項再瑣寫本頁) 裝 然後在步驟303, j, A, R, Re和Q被啓始化 U 2 , 0 = { w 11 訂 線 經濟部+喪*♦屬工消f#tt_a 步驟3 04然後檢査是否該集合 A為空的。由於為 否(N),因此該動作常式在步驟305被叫用。 由啓始位置401開始,一元素在步驟402自 丨 中被取出:vc = Hll。在步驟40 3.該登錄在有關於目 -42- 本紙张又廑邊明国家捸率(CNS)甲4说格(210 X 297公笔) 82.6. 40,000 經濟*中夹樣攀屬麄工消»合伸ti印1 A6 B6 五、發明説明() 前的詞語(亦卽v b a r)和v c (亦卽11)之狀態的動作 列表中被決定出,此時,一存在於此處的第一動作偽被讀 入。此産生出動作〃 shift 13〃 (移轉13)。步驟40 5然後檢査是否該動作為被〃接受〃。由於為否(N), 此時,步驟4 0 7檢査是否該動作為〃 s h i f t s "(移轉 s )。由於是如此,因此tuple <wll,13,vbar,a2>偽作 為元素被加至集合Q。 Q = { <Hll,13,vbar,a2> } 步驟413然後檢査是否有下一傾動作在由步驟40 3所決定的登錄中。由於為否(N),此時,步费[4 15 然後檢査是否下一個詞語已被指定予目前的基元。由於為 否(N),所以該動作常式到達該結束位置4 17並且所 述方法回返至該語法解析常式之步驟3 0 5。 自此繼绩,步驟3 10檢査是否該等集合 A, R以及 Re 為空的。由於是的(Y),所以該移轉常式像在步驟 3 1 1被叫用。 由啓始位置501開始,步驟502將集合U3,0啓 始化為空集合。 U 3, 0 = { } -43- -袈------訂------線 (請先閲讀背面之注意W-項再填寫本頁) ( ♦紙Λ尺中a国家樣準(CNS)甲4規I各(210 X 297 82.6. 40 000 經濟部+典«攀爲β工消f鳕钍印a A6 B6_ 五、發明説明() 在步驟503,由關於一元素之S偽被取自Q。 s = 13,自元素 <wll,13,vbar,a2> 在步驟5 0 4, id 然後被增加1並且一節點係被加 至 T : i d = 3 T: 1 0 («double [CENTER] aO) 2 0 (^triple [CENTER] al) 3 0 Ovbar [CENTER, BOLD] a2) 步驟505然後將下列者加至G : —節點 w具標記 s = 1 3 . —節點X具標記i d = 3 , —邊框自w到X以及一 邊框自X到 w 11。 G: vO xl w7 <r x2 wll x3 <- wl3
在步驟506,具標記 s 的w然後被加至集合U 3,0 〇 -4 4- 本紙張尺·度逡用中國國家標準(CN_S)甲4規格(210 X 297公釐) 82.6. 40,000 ----------------------------裝------tr------ (請先閲讀背面之注意事項再填寫本頁) 一 經濟部中喪«♦局β工消费合作杜印3 A6 B6 五、發明説明() U 3,0 = { W13 } 步驟507檢査是否有多値元素存在於 Q中。由於為否 (N),因此所述方法回返到該語法解析常式。 在該語法解析常式中,所述方法繼績步驟3 1 2,其 中該計數器i係被增加1。 步驟3 1 3然後檢査是否該集合U2,0為空的。由於 為否(N),因此步驟3 16檢査是否有下一®基元存在 。由於為是(Y ),因此在步驟3 1 8此具有詞語和特徵 的基元被讀入。 目前的基元:a3 目前的詞語和持徵:Oblank) 在步驟303, j, A, R, Re和Q然後被啓始化。 -45- --------------------------裝------.玎------^ ~ (請先Μ讀背面之注意事項再填寫本頁) 本紙诔又廋適用中國国家ίί準(CNS)甲4規丨各(210 X 297公釐) 82.6. 40,000 經濟部中典«攀«<*工;«»合作社印a A6 B6 五、發明説明() A=U3,0={h13} R—Re=Q- {} 步驟304然後檢査是否該集合 A為空的。由於為 否(N),因此該動作常式在步思305被叫用。 由啓始位置401開始,一元素在步驟402自A 中被取出:vc = »13。在步揉403,該登錄在有鼷於目 前的詞語(亦即 b 1 a n k)和v c (亦即13)之狀態的動 作列表中被決定出,此時,一存在於此處的第一動作係被 謓入。此産生出動作〃 shift 15"(移轉15)。步驟4 05然後檢查是否該動作為被"接受"。由於為否(N) ,此時,步驟407檢査是否該動作為〃 shift, s"(移 轉 s )。由於是如此,因此在步驟408 tuple <wl3,15,*blank,a3>係作為元素被加至集合Q。 Q = { <w 1 3, 15,*b 1 ank , a3> } 步驟413然後檢査是否有下一傾動作在由步驟40 3所決定的登錄中。由於為否(N),此時,步驟41 5 撿査是否下一個類項已被指定予目前的基元。由於為否( -4 6 - —----------------------裝------.玎------線 (請先閲讀背面之注意事項再填寫本頁) 本紙ft尺廋通用中國国家.樣準(CNS)甲4規烙(210 X 297公藿) 82.6. 40,000 A6 B6 經濟部中典標婆局β工消#合作杜印3 五、發明説明() N),所以該動作常式到達該結束位置4 17並且所述方 法回返至該語法解析常式之步驟3 0 5。 自此繼續,步驟3 10檢査是否該等集合 A, R以及 Re 為空的。由於是的(Y),所以該移轉常式傜在步驟 3 1 1被叫用。 由啓始位置501開始,步驟5 02將集合U4,0啓 始化為空集合。 U 4 , 0 = { } 在步驟503, —狀態自偽被取自Q: s = 15 ,自 t u p 1 e < w 13 , 1· 5,b 1 a π k , a 3 > 在步驟504, id 然後被增加1並且一節點傜被加 至T : id = 4 T: 1 0 («double [CENTER] aO) -47- (請先閲讀背面之注意事項再堉寫本頁) .裝· 訂. *線 本紙ft尺度通用t國国家標準(CNS)甲4规格(210 X 297公货) 82.6. 40 000 A6 B6 五、發明説明() 2 0 («triple [CENTER] al) [CENTER , BOLD] a2) 4 0 (*blank a3) (請先閲讀背面之注意事項再填寫本頁} 步驟505然後將下列者加至G : —節點w具標記 s = 15, —節點x具標記id = 4, —邊框自η到x以及一 邊框自X到Vi 13。 裝 G: vO xl w7 f- x2 wll x 3 »13 f- x 4 f- h 1 5 訂
在步驟506,具標記 s 的w然後被加至集合U Μ 經濟部中央標準局S工消·ΓΗ合作:<t.‘UJ't': -- ο 法 ο 5 ) 方 4, 驟 N 述 U 步 ί 所。 否 1 為 加 値返 , 多回 2 有法 1 否方 3 是述 驟 査所 步 檢此 鑕 7因 繼 於 增 由 被 〇 0 係 中式 i Q 常 析 器 於解 數 在法 計 存語 該 素該 中 元到 其 用中SS家彳柔芈(CNS>甲4規格(210 X 297公it > 82.6. 40,000 經濟部中央標準局3工消"合诈;^.πν: A6 B6 五、發明説明() i = 4 步驟3 1 3然後檢査是否該集合U2,0為空的。由於 為否(N),因此步驟3 16檢査是否有下一傾基元存在 D由於為是(Y),因此在步驟3 18此具有詞語和特徵 的基元被讀入。 目前的基元:a4 目前的詞語和特徴:(*vbar) [CENTER BOLD] 在步驟303, j, A, R, Re和Q然後被啓始化。 j = 〇 A=U4,0= {wl5} R = R e = Q = { } 步驟3 0 4然後檢査是否該集合 A為空的。由於為 否(N),因此該動作常式在步驟305被叫用。 -4 9 - ------------------^-----裝------.玎------線,ί (請先閲讀背面之注意事項再堉寫本頁) 尽呔HUP]中國國家挖準(CNS)甲4規格(21ϋ X 297公釐) 82.6. 40,000 經濟部中央標準局貝工消赍合作江印1/: A6 B6 五、發明説明() 由啓始位置401開始,一元素在步驟402自A 中被取出:vc = wl5。在步驟40 3,該登錄在有關於目 前的詞語(亦邸vbar)和vc (亦邸15)之狀態的動作 列表中被決定出,之後,一存在於此處的第一動作係被讀 入。此産生出動作〃 reduce 15 "(減降7)。步驟4 0 5然後檢査是否該動作為被〃接受#。由於為否(N), 因此步驟4 0 7檢査是否該動作為"reduce p 〃(減降 P )。確實是如此(Y)。步驟410檢査是否規則 7 為一具有一空的右手邊部分之産生規則。由於為否(N) ,之後,在步驟412,對於 G中vc之每一直接後雔 者X, —形態為<vc,x,p,category,ai>之元素偽被加至 集合 R =丨 <wl5,x4,7, vbar, a4> } 步驟413然後檢査是否有下一锢動作在由步駿40 3所決定的登錄中。由於為否(N),此時,步顏1415 檢査是否下一健詞語已披指定予目前的基元。由於為否( N),所以該動作常式到達該結束位置4 17並且所述方 法回返至該語法解析常式之步驟3 0 7。 由步驟307開始,步驟310然後決定出是否該等 集合 A, R以及Re為空的。此為否(N),因為R不 -5 0- 11.--------------,-----裝------ir------I (諝先閲讀背面之注意事項再塡寫本頁) 本呔】’^又度通用中國國家桴準(CNS)甲4规格(210 X 297公货) 82.6. 40,000 A6 B6 五、發明説明() 是空的。步驟307然後經由步驟304和306達到。 該減降常式傜在步驟307被叫用。 由啓始位置60 1開始,一元素係自 R中被取出並 在步驟602被讀入。在步琛603,規則 7之左手邊 部分然後偽被指定予箩數N。 H = a(Weight) 步驟6 04然後檢査是否有特擻被宣告於規則 7中 由於為是(Y),因此該整合常式偽在步驟605被叫 用 (請先聞讀背面之注意事項再填寫本頁) 裝 訂 緩濟部中央棣準局^合作."3" 自啓始位置701趄續,步驟702藉由決定在右手 邊部分的毎一個所宣告的待擻指示與對應之目前的特擻指 示的交集,而決定出有效的特徵指示。有闋的所宣告的特 徴指示係由整合常式自顯示在表4中特歡列表之規則 7 中讀出。目前的待徵指示係以二進位制形態顯示於此處以 示出所述方法。 a(Weight): «double(CHNTER), *triple(CENTER), ”BAR(center,Weight),《blank 0 -5 1- 〔这3) tSIS;榨準(CNS)甲4現格(210 X 297公货) 82.6. 40,000 經濟部中央標準局员工消ίΗ合汴:if.t'lV.: A6 _ B6 五、發明説明()
Fdec1 0011000 1000000 1000000 1000000,0011000
Fact 1 0 0 0 0 0 0 1 0 0 0 0 0 0 10 0 0 0 0 0 , 00 1 1 0 0 0 ^validated 1000000 1000000 1000000,0011000 步驟7 Ο 3然後檢査是否所獲得的交集皆非空的。由 於為是(Υ),因此關於特擞之未出現,無發現到違反。 在步驟705,藉由決定出所有屬於該組群之有效的的特 戡指示之交集,一整合的待徴指示然後偽對在右手邊部分 之每一個被宣告乙次以上的特戡組群被決定出。在目前的 例子中,有兩個组群,即組群〃 CENTER 〃和組群# «eight 〃,而且必須注意的是,該組群"C ΕΝ T ER 〃僅含有一項特 徴。在右手邊部分中,有三項待徽指示屬於該組群〃 - CENTER"以及有一項特徵指示屬於該組群〃 Weight"。此 産生出 卩111^【16<1(0£!^£[〇 = 1000000。步揉 7 0 6 然後 檢査是否在先前步驟中所獲得整合的持徵指示並非空的。 由於為是(Y),因此關於該等特戡指示之間的一致性並 無發現到違反。所述方法然後趄續步驟7 0 8。在步驟7 0 8 , Ftenipl 係藉由在所有於先前步驟中所獲得整合的 特戡指示以及存在於右手邊部分之獨特的有效特徴指示上 執行一邏輯OR蓮算而決定出。此産生出 Fteapl = -5 2 - 这用中國国家ίί準(CNS)甲4規格(2ΐϋ X 297 乂釐) 82.6. 40,000 -----------------^ -----裝------1T------身 (請先Η讀背面之注意事項再塡寫本頁) 經濟部中央標準局貝工消e^itiiMJ.';.: A6 __ B6_ 五、發明説明() ?0£1^£{?01?卩\^1$111 = 1010000。步驟 7 0 9 然後被執行 ,其中該特徴指示Ft βιπρ2偽藉由對所有來自右手邊部分 之所宣告的特徵指示之組合取負號而決定出。
Ftemp2 = HON (1000000 OR 0011000) = 0100111 步驟7 1 0然後對左收邊部分決定出目前的特戡指示 。亦宣告在右手邊部分中屬於一組群之目前的待擻指示俱 決定自: F(Group)act = (Ftenpl OR FTemp2) AND F(Group)decl F〇leight)act = (1010000 OR 0100111) AND 0011000 =1110111 AND 0011000 = 0010000 步驟7 1 1然後檢査是否對右手邊部分語辭所獲得的 所有目前的特徵指示偽非空的。由於為是(Y),因此關 於待激之傳送無發現到違反。結束位置7 1 3然後達到並 且所述方法回返到該減降常式之步驟5 0 5。
所述方法繼續執行步驟606,其中一檢査係被作出 ,以決定是否該違反計數器有一超過該荽數 THRESHOLD -53- iHiii用中國國家疗準(CNS)甲4現格(21U X 297公釐) 82.6. 40,000 ---------------------^-----裝------.玎------線- (請先聞讀背面之注意事項再填寫本頁) 經濟部中央桴準局員工消费合作;1,印公 A6 B6 _ 五、發明説明() 之計數。由於為否(N),因此步驟6 16被執行。在步 驟616,那些為是(Y)者偽被決定出,對此在 G中 有一自 xc (亦即x4)到y長度2*4-2之路徑。此産 生出y = xl。第一値y然後在步琛6 1 2被取出並被指定 予愛數yc。 y c = x 1 〇 步驟613然後藉由自所減降規則之右手邊部分取屬 於該等語辭的id而決定了 L。 L = (1,2,3,4) 在步驟6 1 6,所有的中態 s偽被決定出,對此有 一 w致使該w係yc之一直接後逝者,以及亦致使該狀 -態s偽在goto列表(其偽由鼷於該w之狀態和對應於 目前規則之左收邊部分的語辭所決定出)之登錄中找到。 査詢G將顯示出有yc之一直接後繼者,亦即VO。所隨 附的狀態傜 s = 〇。對狀態S = 0 (有關於W的狀態)和語 辭#在”査詢 goto列表得出s = 4。此狀態在步驟6 15 被令為目前的狀態sc。 s c = 4 -54- —--------------4-----裝------.玎------M (請先聞讀背面之注意事項再填寫本頁) 遇用中國国家桴半(CNS)子4現格(21U X 297公* ) 82.6. 40,000 308659 五、發明説明( 步驟6 16然後指定w = vO作為一元素予集合W。 {Vi 步驟6 1 7然後檢査是杏有一 u為集合U4,0之一 元素以及是否有關於u的狀態偽等於sc。由於為否(N ),因此步駿[618偽被執行。在步驟618, id 俱被 增加1,並且在 T中一節點偽被産生具一標記id,左 手邊部分之語辭具待徽以及一指到其他id之指檫(在步 驟6 13中所決定)。 i d = 5 T : 1 0 (^double [CENTER] aO] —---------------一-----裝------,玎------線、 (請先閲讀背面之注意事項再塡寫本頁) («triple [CENTER] al] 經濟部中央標準局3工消CT合作:x'tMv: 0 (# v b a r 4 0 («blank [CENTER , BOLD] a2] a3) 5 0 (a [BOLD] (1,2,3,4)) -5 5 - 82.6. 40,000 氏峒中aa家作準(CNS)甲4规丨5· (210 X 297公釐) A6 B6 308659 五、發明説明() (請先閲讀背面之注意事項再填寫本買> 在步驟618,亦自G移除在步驟611中對yc所 決定的路徑,並且有一具樺記sc::4之節點u、一具標記 id = 5之節點z、一自(!到z之邊框、自2到w之邊 框、W中所有*被加至G,以及具標記sc = 4之u係被 加至集合 A和U 4 , 0。 G:v〇4- z54- u4 A = { u4 } U4,0 = { «15 u4 } 步驟624然後檢査是否多個狀態 s在步驟6 1 4 中被找到。由於為否(N),因此所述常式績行步驟6 2 6,在此處一檢査偽被作出,以決定是否步驟6 1 1找到 了多個y。此亦為否(N> ,因此结束位置628達到, 其中所述方法回返到該語法解析常式之步驟3 0 7。 烴濟部中央標準局w工消Ir'^itktll'u 査並查 檢 A 檢 1 。的 中的作 其空所 , 為中 到 β 4 達R ο 細及 3 0以驟 1 R 步 3 , 作 駿Λ缠 步合繼 , 集 5 缠否 ο 逛是 3 7 定驟 ο 決步 3 以此 驟 ,因 步出 , 自作的 披空 係非ο 82.6· 40,000 衣紙通用中國國;桴準(CNS)甲4現格(210 X 297公货) 308659 A6 經濟部中央標準居貝工消1τ-<ί^'.Γ·.ί-'-Ν^ B6 五、發明説明() 該動作常式係在此步缀被ΠΜ用。由啓始位置401繼 續,一元素偽自 A披移除並且此元素偽被令為目前的節 ,黏 vc〇 vc = u4 步驟403然後對有関於目前的基元(亦即 *vbar [CENTER, BOLD】))和對由闋於 vc (亦ΕΠ 4 )之狀 態決定出登錄,並且第一指定的動作係自此被讀入。此得 出動作〃 reduce 0# (減降0)。在步驟405, —檢査 然後被作出,以決定是否該動作為被''接受w。由於為S (N),因此步驟407檢査是否該動作為〃 shift s 〃 (移轉s)。確實是如此(Y)。一檢査然後被作出,以 決定是否規則 〇為一具有一空的右手邊部分之産生規則 。由於為否(N ),之後,步驟4 1 2對於G中v c 之每一直接後繼者X ·將一形態為<vc,x,p,cat,ai>之 元素傜被加至集合R。 R = { <u4,z5,0,*vbar,a4> } -57- ϋ乂Hi通用中國国家掊半(CNS)甲4規格(210 X 297公坌) 82.6. 40,000 —---------------_ ------裝------tr-----—線 (請先閲讀背面之注意事項再填寫本頁) 經濟部中央標準局貝工消费合作.'^54.>- 3G8659 A6 _B6_ 五、發明説明() 步驟413然後檢査是否有下一艏動作在由步驟40 3所決定的登錄中。由於為否(N),此時,步驟415 檢査是否下一健詞語己被指定予目前的基元。由於為否( N ),所以該動作常式到達該結束位置4 17並且所述方 法回返至該語法解析常式之步驟3 0 7。 由步驟307開始,步缀310然後決定出是否該等 集合 A, R以及Re為空的。此為否(N) ·因為R不 是空的。步驟307然後經由步揉304和306達到。 該減降常式係在步驟3 0 7被叫用。 由啓始位置έ〇 1開始,一元紫偽自 R中被取出並 在步驟602被讀入。在步驟603,規則 〇之左手邊 部分然後偽被指定予變數Ν。 N = Character(Weight) 步驟604然後檢査是否有特徵被宣告於規則 7中 。由於為是(Y).因此該整合常式係在步驟605被叫 用0 自啓始位置701繼績,步驟7〇2藉由決定在右手 邊部分的每一個所宣告的持徴指示與對應之目前的待徴指 -58- (請先閲讀背面之注意事項再項寫本頁) -丨裝· 訂· 通甩中國国家).?羊(CN-S)甲4現烙(21U X 297公货) 82.6. 40,000 308659 經濟部中央標準局3工消费vii-triit'lv: A6 B6 五、發明説明() 示的交集,而決定出有效的恃徴指示。 C h a r a c t e r (W e i g h t) : a (W e i g h t)。
Fdec 1 0 0 1 1 0 0 0 0 0 1 1 0 0 0
Fact 0011000
Fvalidated 0011000 步駿7 0 3然後檢査是否所獲得的交集皆非空的。由 於為是(Y),因此問於待戡之未出現,無發現到違反。 在步®[7 0 5 ,藉由決定出所有屬於該组群之有效的的特 擻指示之交集,一整合的待徴指示然後係對在右手邊部分 之每一値披宣告乙次以上的持擞組群被決定出。在目前的 例子中,其不存在。步铤706然後檢査是否在先前步驟 中所獲得整合的特擞指示並非空的。在無此等特擻指示之 情況下,此問題之答案是肯定的,因此關於該等持歡指示 之間的一致性並無發現到違反。所述方法然後繼績步驟7 0 8。在步驟7 0 8, Ftempl係藉由在所有於先前步缀 中所獲得整合的特徵指示以及存在於右手邊部分之獨特的 有效特徵指示上執行一逯輯OR蓮算而決定出。此得出 Ftempl =卩〇1$111 = 00100(]0。步驟 7 0 9然後被執行 -59- — I.--------------1 -----裝-------玎------Μ (請先閲讀背面之注意Ϋ項再埸寫本頁> 边甲中國國孓槔毕(CNS)甲4現格(21ϋ X 297公:^ > 82.6. 40,000 經濟部中央標準局員工消費合作枝印.;, 308659 A6 _ B6__ 五、發明説明() ,其中該特擻指示Ftemp2偽藉由對所有來·自右手邊部分 之所宣告的特徽指示之組合取負號而決定出。
Fteop2 = NON (0011000) = 1100111 步驟710然後對左收邊部分決定出目前的待擞指示 。亦宣告在右手邊部分中颶於一組群之目前的特徴指示係 決定自: F(Group)act = (Ftempl OR FTenp2) AMD F(Group)decl F(Weight)act = (0010000 OR 1100111) AND 0011000 =1110111 AND 0011000 = 0010000 步驟711然後檢査是否對右手邊部分語辭所獲得的 所有目前的特徵指示偽非空的。由於為是(Y),因此翻 於持戲之傳送無發現到違反。结束位置7 1 3然後達到並 且所述方法回返到該減降常式之步琛5 0 5。 所述方法繼續執行步缀606,其中一檢査偽被作出 ,以決定是否該違反計數器有一超過該變數 THRESHOLD 之計數。由於為否(N),因此步驟6 16被執行。在步 -60* --------------------- -----裝------,玎------M (請先閲讀背面之注意事項再壎寫本頁) ☆ dUii用中國国家悻芈(CNS)甲4現格(210 X 297公货) 82.6. 40,000 308659 A6 B6 經濟部中央標準局W工消#合作拄S V: 五、發明説明() 驟616,那些為是(Y)者係被決定出,對此在 G中 有一自 xc (亦卽z5)到 y長度 2*卜2之路徑。此産 生出y = z5。第一個y然後在步驟6 1 2被取出並被指定 予愛數yc。 y c = z 5 〇 步驟6 1 3然後藉由自所減降規則之右手邊部分取屬 於該等語辭的id而決定了 L。 L = (5) 在步驟616,所有的中態 s係被決定出,對此有 一 w致使該 w偽yc之一直接後繼者,以及亦致使該狀 態s偽在goto列表(其偽由屬於該w之狀態和對應於 目前規則之左收邊部分的語辭所決定出)之登錄中找到。 査詢G將顯示出有yc之一直接後繼者,亦卽v0。所隨 附的狀態偽 s = 0。對跃態s = 0 (有闋於《的狀態)和語 辭"Character”査詢 goto列表得出s = 3。此狀態在步 驟6 15被令為目前的狀態sc。 s c = 3 -6 1 - ------------------f-----裝------ΤΓ------後】 (請先閏讀背面之注意事項再堉寫本頁) 边用中SS家丨?芈(CNS)甲4規格(21ϋ X 297公釐) 82.6. 40 000 A6 B6 五、發明説明( 步驟6 16然後指定 w = vO作為一元素予集合 W。 vO } 步驟6 1 7然後檢査是否有一 u為集合U4,0之一 元素以及是否有關於u的狀態係等於sc。由於為否(N ),因此步驟618僳被執行。在步驟618, id 係被 增加1 ,並且在 T中一節點偽被産生具一標記id ,左 手邊部分之語辭具特徴以及一指到其他id之指標(在步 铤6 1 3中所決定)。 id T: 1 0 («double [CENTER] aO] -裝------tr------線' (請先閲讀背面之注意事項再塡寫本頁) 2 0 («triple [CENTER] al] [CENTER,BOLD] a2] 經濟部中央標準局貝工消^合作仏印.;'': 4 0 («blank 5 0 (a -6 2 - a 3 ) [BOLD] (1,2,3,4)) 用中國国家桴半(CN-S)甲4规烙(210 x 297公货) 82.6. 40,000 308659 A6 B6 五、發明説明() (Character [BOLD] (5)) 在步驟6 18,亦自G移除在步驟6 1 1中辑yC所 決定的路徑,並且有一具標記sc = 3之節點u、一具標12 id = 6 之節點z、一自u到z之邊框、自z到《之邊 框、W中所有《被加至G,以及具標記sc = 3之u傷被 加至集合A和U4.0。 G: vO 26 u3 u3 (請先《讀背面之注意事項再璜寫本頁) —裝· 訂.
U { w 1 5 u 4 u 3 經濟部中央橒準局*3:工消費合作;1印^ 步驟624然後檢査是否多饀狀態 s在步驟6 1 4 中被找到。由於為否(N) •因此所述常式續行步驟62 6,在此處一檢査係被作出,以決定是否步驟6 1 1找到 了多個y。此亦為否(N),因此結束位置628達到, 其中所述方法回返到該語法解析常式之步驟3 0 7。 自步驟307繼續,步驟310細達到,其中一檢査 偽被作出.以決定是否集合A, R以及Re為空的。A並 非空的,因此步驟305盌續作步驟304中所作的檢査 通用中國國家桴半 (CNS)甲4現烙(210 X 297公釐) 82.6. 40,000 經濟部中央標準局3工消費合作fi印k A6 ____B6 五、發明説明() 該動作常式偽在此步驟被叫用。由啓始位置4 0 1繼 縯,一元素偽自 A被移除並且此元素係被令為目前的節 點。 v c = u 3 步驟403然後對有朗於目前的基元(亦即 *vbar [CENTER, BOLD]))和對由闋於 vc (亦 01 3 )之狀 態決定出登錄,並且第一指定的動作偽自此被譎入。此得 出動作〃 reduce 3 Λ (減降3)。在步驟405, —檢査 然後被作出,以決定是否該動作為被#接受〃。由於為否 (Ν) ·因此步驟407檢査是否該動作為"shift s # (移轉s)。確實是如此(Y)。一檢査然後被作出,以 決定是否規則 3為一具有一空的右手邊部分之産生規則 。由於為否(N),之後,步驟412對於 G中vc之 毎一直接後组者X ,將一形態為<vc,x,p,cat,ai>之元 素傺被加至集合R。 R = { < u 3 , z 6 , 3 , v b a r , a 4 > } -6 4 - ---------------------~-----裝------ΤΓ------線, (請先Μ讀背面之注意事項再塡寫本頁) u氏用中國國家慄準(CNS)甲4現格(210 χ 297公货) 82.6. 40,000 A6 B6 五、發明説明() 步驟413然後檢査是否有下一鯧動作在由步驟40 3所決定的登錄中。由於為否(N),此時,步驟41 5 檢査是否下一健詞語己被指定予目前的基元。由於為杏( N),所以該動作常式到達該結束位置417並且所述方 法回返至該語法解析常式之步驟3 0 5。 由步驟305開始,步驟310然後決定出是否該等 集合 A, R以及Re為空的。此為否(Ν),因為R不 是空的。步驟307然後經由步驟304和306達到。 該減降常式俱在步驟307彼叫用。由啓始位置601開 始,一元素偽自 R中被取出並在步驟602被讀入。在 步驟603,規則 7之左手邊部分然後係被指定予變數 N〇 (請先閲讀背面之注意事項再塡寫本頁) 裝 訂 3- 經»部中央榇準局ear工消费合作.?!.叩 v c = u 2 在步驟403,對有関於目前的基元(亦即 *vbar[CENTER,BOLD])和對由闢於 vc (亦卽 3 )之狀 態決定出登錄,並且第一指定的動作偽自此被讀入。此得 出動作"shift 8"(移轉 8)。步驟405 (N)和步 -65 - 用中SS孓徉苹(CNS〉甲·!現格(210 X 297 d ) 82.6. 40,000 經濟部中喪標準局員工消If合作..江印*.': A6 B6 五、發明説明() 驟407 (Y)執行後,步驟408偽被執行。元素 < u 2,8 , * v b a r , a 4 >偽被加至集合Q。 Q = { <u2,8,#vbar,a4> } 步驟413 (N)和步思415 (N)之後,结束位 置417係逹到並且所述方法回返至該語法解析常式之步 驟 3 0 5 〇 在步驟3 1 0之檢査顯示出集合 A, R和Re為空的 (Y),因此步揉311被執行。 該移轉常式偽在步S3 1 1被叫用。在此情況下,該 移轉常式之結果偽一新的節黏被加至 T以及兩個新的節 點被加至G。 id = 7 + 1 = 8 ' T: 1 0 («double [CENTER] aO) 2 0 («triple [CENTER] al) 3 0 (#vbar [CENTER,BOLD] a2) -66- 衣呔烺逯用中國國家棵苹(CNS)甲4現格(2U) x 297公:^ ) 82.6. 40,000 (請先閱讀背面之注意事項再瑣寫本頁) •裝· 訂. 303659 A6 B6
經濟部中央標準局3工消·iu'合作:Ξ S 五、發明説明() a 3) [BOLD] (1,2,3,4)) [BOLD] (5)) [BOLD] (6)) [CENTER , BOLD] a4] vr 2 U4,0 = { h15 u4 u3 u2 w2 } 所述方法現在可藉由讀入下一値基元而繼續。接下來 的步驟在辱則上已討論過,因此現僅將給出最後由該語法 解析常式所傳送的T。 T: 1 0 double [CENTER] aO] 2 0 (^triple [CENTER] al] -6 7- 4 0 (*blank 5 0 (a 6 0 (Character 7 0 (Characters 8 0 Ovbar -----------------..,1-----裝------tr------線 (請先閲讀背面之注意事項再堉寫本頁) 尽呔適用中围国孓漂半(CNS)甲4規恪(210 X 297公货〉 82.6. 40,000 五、發明説明() A6 B6 3 0 〇 v b a r [ C E N T E R,B 0 L D ] a 2 ] 5 0 (a [BOLD] (1,2,3,4)) 6 0 (Character [BOLD] (5)) 0 (Characters [BOLD] (6)) 8 0 Ovbar [CENTER,BOLD] a4] 9 0 (*hbar [ Η I GH_CENTER] a5] 11 0 Oblank [ ] a7) —---------------^-----裝------tr------線' (請先閲讀背面之注意事項再填寫本頁) 經濟部中央標準局SK工消費合作.ii印V·: 12 0 (n [BOLD] (8 9 10 11)) 13 0 (Character [BOLD] (12)) 6 3 - 各f Hia用中國國家i.?準(CNS)甲4規烙(210 X 297 乂釐) 82.6. 40,000 A6 B6_ 五、發明説明() 14 0 (Characters [BOLD] (7 13)) 15 0 Oendnark 【]a8) 16 0 (WORD (14 15)) 到達結束位置315時,所獲得的分析傜呈一括弧结 構之形態被寫出。有關於所找出該分析之根的id係被指 定予變數result並且此得出: result = 16 16 -> 0 (WORD [] 0 (Characters [BOLD] 0 (Characters [BOLD] 經濟部中央標準局員工消"合作:匕1,,‘:-: (0 Character [BOLD] (0 a [BOLD] (0 * double [CENTER] aO) -6 9 ~ 82.6. 40,000 (請先閲讀背面之注意事項再填鸾本页) 尽这用中國國家桴芈(CNS)甲4現格(210 X 297公货) 經濟部中央標準局貝工消!fH合作.fiM-'u A6 B6 五、發明説明() (0 «triple [CENTER] al) (0 #vbar [CENTER BOLD] a2) (0 «blank [] a3)))) 0 (Character [BOLD] (0 n [BOLD] (0 #vbar [CENTER BOLD] a4) (0 «hbar [ΗIGH_CEHTHR] a5) (0 #vbar [CENTER BOLD] a6) (0 blank [] a?)))) (*endaark [] a8)) 該語法解析常式终結時,所述方法回返至步驟2〇7 ,其檢査是否該語法解析常式已傳送出一結果不等於零。 -70- 冬汰汛疋/又通用中國國家揉準(CNS)甲4規烙(21〇 X 29?公货) 82.6. 40,000 ------------------^-----裝------ir------β (請先《讀背面之注意事項再填寫本頁) 經濟部中央標準局g工消^合作;.!.,.»*': A6 B6 五、發明説明() 由於為是(Y),因此步驟2 1 1然後檢査是否違反的數 目偽等於零。由於亦為是(Y),因此所述方法在步驟2 1 4終止。 所述方法現已參照一文法分析了所提供之一信號並且 未發現到任何違反 現可趄續處理原來的信號或是由該語法解析單元所傳 送的分析。在目前的例子中,係針對所辨識的字元,因此 其將被用於進一步的處理。 若步驟211顯示出最後結果之違反的數目係不等於 零(N),則在圖1中的修正單元104係在步驟212 被叫甩。此種方法(適於所述裝置之目前的睡用領域,亦 卽光學字元之辨識)其一較有利的實施例包括了下述步S 。於第一步驟,對由該語法解析單元所提供之每一组群的 基元所獲得的字組傜依違反計數而予排序。一檢査首先披 作出,以決定是否該具有最低違反計數之字組出現在一電 子語法的字棄中。若為否的話,此字組係被拒退而接下來 的字組被取出。若僅有一値字組被傳送且若此字紐並未含 於有闋的字蠶中,一拼音檢査程式偽被叫用,其産生出該 字組之一些變形者被參照該字棄依序地檢査。若該字组在 電子字蠶中被找到•則該宇組以及有關於該字組的語法資 料偽被置於一句子缓衝器中。若該字組被找到但是有詞形 變化(i n f 1 e c t i ο η)不正確之顯示,則此字组被檫記出並 被置於一缓衝器中。€該句子含有"一完整的句子 -7 1- ------------------ -----裝------ΤΓ------M {請先W讀背面之注意事項再填寫本頁) 尽边明中國园家挖毕(CNS) Ψ 4现格(210 X 297父釐) 82.6. 40,000 308659 年(/瓜―;兩修正/更正/補光 I B7 經濟部中央橾準局貝工消費合作社印製 五、發明説明( ) 1 1 1 | 則 — 文 法 檢 查 程 式 被 叫 用 對 正 確 的 詞 形 fb 作 一 檢 查 ( 1 1 1 若 有 需 要 的 話 ) — 如 描 述 在 荷 蘭 申 請 案 N L- A 9 1 0 1 2 8 6 1 I 請 1 I ( 其 並 非 _ 前 案 ) 中 的 詞 形 isg& it 程 式 係 被 叫 用 〇 該 完 整 的 先 閱 1 | 句 子 然 後 被 傳 送 K 此 方 式 對 語 法 領 域 的 知 識 係 被 利 用 讀 背 1 | 到 便 作 字 元 辨 識 r· 之 注 | 意 I 關 於 將 元 素 圖 形 轉 換 成 為 詞 語 和 特 澂 字 串 成 組 群 地 事 項 1 1 再 1 提 供 至 該 語 法 解 析 簞 元 之 方 法 如 圖 8 所 示 必 須 注 afr. 思 的 填 寫 本 裝 是 在 步 驟 8 〇 5 指 定 數 個 類 項 予 —· 元 素 行 ( 造 成 數 個 有 頁 '---, 1 1 關 於 一 基 元 之 詞 語 ) 是 較 為 有 利 的 0 结 果 關 於 一 類 項 之 1 1 選 取 的 決 定 可 被 延 遲 到 該 辨 識 程 序 之 一 稍 後 階 段 0 此 變 通 1 1 方 式 是 可 行 的 因 為 該 語 法 解 析 單 元 係 可 處 理 不 清 疋 的 ( 1 訂 a itt b i gu 0 U S) 輸入 > 1 1 在 步 驟 8 0 6 指 定 互 斥 的 ( m u t U a 1 ly e X C lu si v e ) 特 1 1 徵 予 —. 基 元 也 是 較 有 利 的 〇 其 使 用 具 有 對 於 一 個 或 多 個 特 1 ! 徵 之 選 擇 不 需 要 在 指 定 特 澂 的 時 候 ( 此 時 除 了 元 素 叢 集 之 1 知、 幾 何 外 尚 不 知 道 進 一 步 用 於 指 定 該 等 特 激 之 資 料 ) 被 作 1 出 的 效 用 J 以 及 此 選 擇 可 予 延 緩 至 __. 稍 後 階 段 兩 種 可 能 1 1 性 都 是 可 接 受 的 致 使 只 有 在 一 稍 後 階 段 即 依 據 違 反 的 1 1 數 巨 或 是 依 據 語 法 檢 查 正 確 的 選 擇 才 可 予 作 出 〇 此 項 設 1 I 計 係 由 於 該 語 法 解 析 單 元 處 理 特 徵 之 方 式 而 變 得 可 能 0 — 1 1 1 類 Μ 的 情 況 係 參 照 圖 1 0 ( 示 出 — liL· 基 元 ) 作 描 述 0 關 於 1 1 第 五 基 元 t 不 容 易 決 定 是 否 其 具 有 下 降 的 ( d e S C e a d i ng ) 1 1 或 是 上 升 的 ( ascending) 特徴 因為中間的元素叢集無 1 I - 7 2 - 1 1 1 本紙張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) 經濟部中央標準局員工消骨合作社 A6 B6 五、發明説明() 法被歸類為〃上升的"或是"下降的〃,若是兩互斥特徵 現被指定予有關於此基元之詞語的話,則涉及到關於是否 一 〃或〃 Z"的決定可予延後到後一階段。假設該語法 解析單元得出兩分析和〃az〃 (二者皆有相同的違 反計數),則一修正程序(檢査是否所辨識的字組出現在 一電子字彙中)係得出字组"as 〃為正確的字組。 必須注意的是,指定互斥特徴予基元之能力以及其後 績處理並非侷限於此項K用中所述的組合,而是亦適用於 其他應用中。 關於顯示在表1中的文法,必須注意的是,此文法特 別有利之處在於其可為該語法解析單元所傳送之非分離的 字元,而是字組。與違反機制有闢者,所述方法係可傳送 一串被辨戡的字組(對一给定所供給的基元序列被提供以 一違反計數)。較有利的是,若一値或多個解答偽由該語 法解析單元所傳送,則這些解答可直接由語法協助來檢査 。當一次一値字元被辨識時,此為不可能的。無任何語法 規則是適用於單一艏字元的。在此一情況下(其當然可藉 由適配該文法而以目前的方法來執行),需要一額外的步 驟以將所辨識的字元結合成為宇組。 現將參照圖1中所示的文法再討論一些變化。在第一 變化中,其非整個字組而是一糸列固定數目(n)的字元 被該語法解析單元所傳送,下述中稱為n-grams^在此等 情況下修正機制偽由相對於可容許 η-grams之一列表檢 -73- .I—.---------------j-----裝------tr------嫁: (請先H讀背面之注意事項再填寫本頁) 用中國國家標.半 (CNS)甲4规格(210 X 297公* ) 82.6. 40,000
AS B6 五、發明説明() 査所傳送的 n-graias所組成。表5給出一得出trigrans (η = 3)之文法。 下一變化之组成,為藉由注意接下來所供給的常態化 基元糸列係重叠,而讓接下來傳送的n-graas重叠。 必須注意的是,n-graias (其為重《或為不重叠)由 一圈形辨識單元所作的傳送並非侷限於此項匾用中所述的 组合,而是亦適用於其他應用中。 〔表5 ] //Ftrs = CENTER HIGH-CENTER BOLD NORMAL VIOL LONG-UP LONG-DOWN //Weight = BOLD NORMAL Character(Weight) :a(Weight).
Character(Weight) :h(Weight).
Character(Weight) :n(Weight)· START :TRIGRAM. TRIGRAM:Character{Weight),Character(Weight),Character(Weight)f*endmark. a(Weight) :^double(CENTER),*triple(CENTER),*vbar(CENTER,Weight),*blank. h(Weight) :*vbar(LONG-UP,Weight),^hbar(HIGH-CENTER)f *vbar(CENTER,Weight),*blank. n(Weight) :*vbar(CENTER,Weight),*hbar(HIGH-CENTER), *vbar(CENTER,Weight),*blank. 該文法之一較有利的變化包括了將文法規則涵括入, 經濟部中央標準局貝工消费合作社印" 此等文法規則偽預計依附的字元無論如何必須被辨識為分 離的字元。此種愛化係顯示在表6中。以此方式,除了 a d外,例如a c和1乃可能被傳送為解答。修正機制 然後可作正確的選擇。 〔表6〕 -74- 用 t a囡家棵举(CNS)甲 4 規格(21ϋ X 297 么、釐) 82.0. 40 000 五、發明説明() A6B6
Ftrs = CENTER HIGH-CENTER BOLD NORMAL VIOL LONG-UP LONG-DOWN VIOL //Weight = BOLD NORMAL Character(Weight) ;a(Weight). Character(Weight) :h(Weight). Character(Weight) :n(Weight). Characters(Weight) : Character(Weight). Characters(Weight) :Characters(Weight),Character(Weight). START :WORD. WORD :Characters(Weight),*eadmark. a(Weight) :*double(CENTER),*triple(CENTER)t*vbar(CENTER,Weight),blank, blank :*blank. blank :missing-blank(VIOL,VIOL,VIOL). h(Weight) :*vbar(LONG-UP,Weight),^hbar(HIGH-CENTER), *vbar(CENTER,Weight)Tblank. missing-blank :. n(Weight) :*vbar(CENTER?Weight),-hbar(HIGH-CENTER), *vbar(CENTER,Weight),blank. 請 先 閲it 背 面 之 注 意事 項 再 填 寫 本頁 裝 訂 經濟部中央標準局B工消費合作杜Μ,ν·ί 亦可以涵括入以一正確的方式處理宇元之(斜e字的 f, j等)上下突出部分(kerning)的文法規則。亦極明 顯的是字體(fonts)之辨識和傳送可立即被執行。最後 ,表7示出該文法之一變化,其中字元在解答中你被表示 為一待徴。 必須注意的是,此文法變化之利用並非侷限於此項應 用中所述的組合,而是亦適用於其他應用中。 〔表7〕 //Ftrs = CENTER HIGH-CENTER BOLD NORMAL VIOL LONG-UP LONG-DOWN a h n //Weight = BOLD NORMAL Character (Weight,a) : -'double (CENTER) , -·triple (CENTER), *vbar (CENTER,Weight) , -"blank.-75- 各通甲中國国家悌半(CNS)甲4現丨各(21U X 297 ) 82.6. 40,000 線 A6 B6 五、發明説明() Character(Weight,h) :*vbar(LONG-UP,Weight),*hbar(HIGH-CENTER) *vbar(CENTER,Weight) ,'"blank. Character(Weight ,n) : *vbar (CENTER,Weight) ,-uhbar (HIGH-CENTER), *vbar(CENTER,Weight),*blank. Characters(Weight) : Character(Weight). Characters(Weight) : Characters(Weight),Character (Weight)· START :WORD, WORD :Characters(Weight),*endmark. 面 之 注 再 壤 寫 本 頁 依據本發明用於光學字元辨識之裝置之一變化設計( 較有利地為利用違反計數)煤藉由鍺存宇元(被辨識為最 佳者)之位元映射而獲得。其逹成像藉由對毎一値第一次 被辨識的字元儲存位元映射,然後如果在各情況下此宇元 被辨識為具一較低違反計數的話以同一字元的位元映射取 代此位元映射。然後得以藉由所辨識基元(被最佳辨識者 )之位元映射重建原“字元。 必須注意的是,上述額外作法之利用並非侷限於此項 應用中所述的組合,而是此等作法亦適用於其他應用中。 在下述對第二例子的論述中,依據本發明之装置係用 於句子的文法分析。句子的文法分析在所有那些其中一供 辨識的原始信號含有語法資訊的應用中是有利的。在此一 法此於 文 。用 1 正採 以修傺 以之置 。 可將装 。 是話一中 , 的之 8 } 要明表 送箱發在 傳有本定 被若據給 偽 且依偽 組並 ,法 字,驟文 中號步的 其信者用 { 證後利 驟驗此所 步地於 c j 後細關驟 8 最詳有步表 的來偽者 t 序析子後 程分例此 裝 訂 線 乂这用ta國孓揉半(CNS)甲4規格(21U X 297公釐) 82.6. 40,000 五、發明説明() A6 B6 //Getal = SING1 SING2 SING3 PLU1 PLU2 PLU3 0 NP(Getal) :*article(Getal),*noun(Getal). 1 S :VP(Getal)· 2 START :TOP. 3 TOP :S,*endmark. 4 VP(Getal) :NP(Getal),*verb(Getal)- 在此例子中,六項特徴係被定義出:SINGl SING2 SING3 PLU1 PLU2和PLU3。這些特徴傜結合成一組群, 即組群Getai ( = Humber)。由此文法所推導出並鍺存在 記憶體中的表以及為本發明方法所利用的表,01動作表、 g 〇 t 〇表和持戤表,偽分別給定在表9、 1 〇和1 1中。 〔表 9 〕動作列表 (請先閲讀背面之注意事項再堉寫本頁> —裝
State
^article *endmark -noun *verb @ALL ΤΓ 經濟部中央標準局S工消費合作社印焚 0 1 2 3 4 5 6 7 8 sh5 acc sh6 sh7 〔表10〕goto列表 sh.3 大又/¾¾用中國國家標準(CNS)甲4规格(210 X 29Γ公货) rel
re3 re4 reO 82.6. 40,000 I 级 五、發明説明()
State NP S TOP VP 0 4 2 1 3 1 2 3 4 5 6 7 8 A6 B6 (請先閲讀背面之注意事項再填寫本頁) 經濟部中兴縹準爲貝工消費合作社印製 〔表1 1〕特戡列表 0 ((L11111) (111111) (111111)) 1 (() (111111)) 2 (()()) 3 (() {)()) 4 ((111111) (111111) (111111)) 吾人假設必須檢査語法精確性的句子為"A man works 〇 此句子形成信號S被頡至画1中轉換單元1 0 1。該 轉換單元將此信號轉換成一適於由該語法解析單元1 0 2 所處理的形態。為此目的,該信號首先被分段成為基元。 對於此項應用,字組係形成為該等基元,致使該轉換單元 將提供成字组的字元串。此等字組然後被提供以常態化基 元(詞語)和特徵。最後所得到經語法解析後的字串係被 饋至該語法解析單元1 0 2。 a 1 a (*art ids [SIHG3]) ___ -寸T- ί ____ 本纸張又度遵用中S3家徉準(CNS>甲4規格(210 χ 297 H) 82.6. 40,000 五、發明説明() A6 B6 a2 田3Ω (^noun [SIHG3]) a3 works 〇 v e r b [SING3]) a 4 (#endaark []) 所述語法解析之方法現將對此例子參照圖2_7詳細 描述。由啓始位置201 (圖2)開始,一些受數在步驟 2 0 2被啓始化。 result - 0 threshold = 0 delta-threshold = 0 new-threshold = 0 宇串然後在步揉2 0 3被讀入並且一詞語符號$被加 至該字串。該語法解析常式然後在步驟204被叫用。該 語法解析常式係在圖3中被詳細推導出。由啓始位置30 1 (圖3 )開始,計數器i, id,違反計數器、圖形结構 化堆叠G以及樹狀結構T係在步驟302被啓始化,並 且元素vQ傺披加至集合U0,0 —--------------- -----裝------.玎------線 (請先閲讀背面之注意事項再填寫本頁> 經濟部中央標準局貝工消贷合作.fif!·,;.: i d = 0 -78- 卜氏:乂乂又通用中國國家丨字準(CNS) T 4现丨各(210 X 297公釐) 82.6. 40,000 3 0 S 6 5 Ο Α6 Β6 經濟部中夹標孕局ΚΪ工消合作ii印a 五、發明説明() 違反計數器=〇 G = 0 T = 0 U 0,0 = { vO} 被提供以語法資料的第一基元aQ亦在此步驟自該字 串被讀入。 目前的基元 a 0 ( * a r t i c 1 e [ S I N G 3】) 計數器然後在步驟303被啓始化為0,集合R, Re 和 tl被啓始化成空集合並且集合 A被令為等於UQ,Q:A ={vO}j = 〇 R = R e = Q = { } A = { v 0 } -7 9 - (請先閲讀背面之注意事項再堉寫本頁) .裝. 訂. 線 本紙值尺度通闱中國國家悻準(CNS)甲4規彳各(210 X 297 W釐〉 82.6. 40,000 經濟部中夹櫺箏«ΚΪ工消费合作杜印a A6 B6 五、發明説明() 一檢査然後在步驟304被作出,以決定是否集合A 偽一空集合。由於為否(N),因此該動作常式偽被叫用 〇 該動作常式係詳示於圖4中。由啓始位置401開始 ,一元素係在步驟402中被自 A移除,並且此元素變 成為目前的節點 vc。在步驟403,動作列表中的登錄 然後被決定成與詞語”《article”和狀態 0有關。該動 作列表(其係由該文法導出)偽顯示在表9中。來自此登 錄之第一動作然後在步驟404被謓入。此得出動作" shift 5 "(移轉5 )。在步驟405, —檢査偽被作
出,以決定是否該動作為"accept # (接受)。由於此 為否(N)的話,致使步驟407檢査是否該動作為# shift s 〃(移轉s )。由於為是,致使在步揉4 0 8 , <v0,5,*article,a0> 係作為一元素被加至該集合Q Ο Q = Q{ 〈νΟ,δ,*article,a0> } 既然步驟305已經被處理,所述方法趄績步思31 0 (圖3)。在此,一檢査然後被作出,以決定是否集合 A, R和Re皆為空集合。由於為是(Y),致使步驟3 1 1叫用該移轉常式。 -80" (請先閲讀背面之注意事項再堉寫本頁) .裝. 訂. 本紙m又度通阑中国国家標準(CNS)甲4規格(210 X 297公璉) 82.6. 40,000 經濟部中*攆婆局3工;«#合作杜印a A6 B6 五、發明説明() 該移轉常式燥詳細顯示在圔5中。由啓始位置501 開始,在步驟5 0 2,集合U1,Q係被啓始化成空集合。 U 1,0 = { } 在步揉503, —狀態係被取自Q。 s = 5 f r ο π element <v0,5,幸doub 1 e,a 0> 在步驟504,計數器id然後被増加1,並且在τ 一節點傺被産生為具檩記id並被提供以有關於第零基元 的語法解析資料。 id = 1 T: 1 0 (^article [SIHG3 PLU3] aO) 在步驟505,然後下列者係被加至 G : —節點w 具標記 s = 5、一節點X具標記id=l、一邊框自^ 到X、以及一邊框自x到v 0。 G : v 0 f- X 1 ^ w 5 -8 1 - 本紙Λ又度通用ta國家標準(CNS) f 4规烙(210 X 297) 82.6. 40,000 -裝------.玎------線 (請先閲讀背面之注意事項再填寫本頁) A6 B6 五、發明説明() (請先閲讀背面之注意事項再填寫本頁) 在步驟506,具標記s的w然後被加至集合U1,0。 U 1,0 = { »5 } 在步驟507, —檢査係被作出,以決定是否仍有更 多個元素存在於 Q中。由於為否(Ν),致使所述方法 回返到該語法解析常式自此龃缠步驟312,其中該計數 器偽被增加1。 步驟3 1 3然後檢査是否U1,0為空的。由於為否( Ν ),致使步驟3 16檢査是否有下一艏基元存在。由於 為是(Υ),致使在步驟3 18被讀入。 目前的基元 al: (*noun [SIHG3] al) 然後,j, A, R, Re以及Q在步SE303被啓始化 經濟部中央縹導Λ A工消费合作钍印a -82- 本纸依又度通用t國园家標準(CNS)甲4規格(210 X 297公货) 82.6. 40,000 經濟部中典標導局β工消费合祚社印54 A6 B6 五、發明説明() A = U 1 , 0 = { w5 } R = Re = Q = { } 步驟304然後檢査是否該 A為空的。由於為否( N) , A當然含有該元素h5 ,致使該動作常式在步驟3 0 5被叫用。 由啓始位置401開始,此元素係在步驟402被自 A中取出並披令為目前的節點vc。 v c = w5 在步驟403,有關於目前的詞語之動作列表的登錄 以及有關於vc之狀態然後被決定出,並且第一動作自此 被讀出。此産生了 shift 8(移轉8)。步驟405然後 檢査是否該動作被#接受〃。由於為否(N),所以步驟 407檢査是否該動作為一移轉動作。是的,s具有值8 。該元素<«5,8,11(}1111,31>然後在步驟4〇8被加至0。 -83- ---------------------------裝------,玎------^ (請先閲讀背面之注意事項再塡寫本頁) 本纸任又度過用中囷园家揉準(CNS)甲4規丨各(210 X 297公货) 82.6. 40,000 A6 B6 五、發明説明(
Q 有 ί 另否 否為 是於 定由 決 〇 以中 ,綠 出登 作的 被定 3 決 1 所 4 3 驟 ο 步 4 在驟 後步 然由 査在 檢作 一 動 傾 否 , 是} 定 Ν 決 < 以否 *為 出此 作於 被由 5 0 1 元 4 基 驟的 步前 在目 後予 然定 査指 檢被 1 已 以語 所詞 , 艟 下 N 下所 到 返 回 法 方 述 所 且 並 Ρ 7 1 〇 4 5 置 ο 位 3 束揉 结步 達之 到式 式常 常析 作解 動法 該語 以該 自此繼續,步驟3 10檢査是否該等集合 A, R以及 Re 為空的。由於是的(Y),所以該移轉常式偽在步琛 3 1 1被叫用。 (請先閲讀背面之注意事項再填寫本頁) -裝 訂
經濟部中喪律導局3工消费合件钍印S 由啓始位置50 1開始,步驟502將集合U2,0啓 始化為空集合。 U 2 , 0 = { }步驟503然後自Q之一 tuple取一狀態。 s=ll,自元素 <w5,8,noun,al> 8 4 * 本紙張尺度通用國家律準(CNS)甲4说格(210 X 297公釐) 82.6. 40,000 A6 B6 五、發明説明()
步驟504然後將id增加1並且一節點偽被加至T 〇 id = 2 T: 1 0 («article [SING3 PLU3] aO) 2 0 («noun [SIHG3] al) 下列者然後在步驟505被加至 G : —節點 w具標 記s = 8, —節點 X具標記id=2, —邊框自w到 X以及 一邊框自JC到 w 5。 G: vO f- xl w5 x2 w8
在步驟506,具標記 s 的w然後被加至集合U 2,0 = U 2,0 = U 2,0 { w8 }
經濟部中夹標婆局工消费合作社印S (請先閱讀背面之注意事項再填寫本頁) —裝‘ 步驟507檢査是否有多個元素存在於 Q中。由於 為否(N ),因此所述方法回返到該語法解析常式。 -85- 本紙張尺度適用中國S家樣準(CNS)甲4規烙(210 X 297公货) 82.6. 40,000 A6 B6 308659 五、發明説明() 所述方法繼續步驟3 1 2,其中該計數器 i偽被增 加1。 步驟3 1 3然後檢査是否該集合U2,Q為空的。由於 為否(N),因此步揉3 16檢査是否有下一個基元存在 。由於為是(Y),因此所述方法进績步驟3 17,其中 接下來的基元受成為目前的基元。 目前的字组:a2 (*verb [SING3] a2) 然後在步驟303. j· A, R, Re和 Q被啓始化。 A = U 2 , 0 = { w8 } R = Re = Q = { } 步驟304然後檢査是否該集合 A為空的。由於為 否(N),因此該動作常式在步驟305被叫用。 -86* ------------------------裝------.玎------線 (請先閲讀背面之注意事項再塡寫本頁) 本斌張尺廋遢用中Η國家棵準(CNS)甲4规格(210 X 297公釐) 82.6. 40,000 A6 B6 五、發明説明() 由啓始位置401開始,一元素在步驟402自 A 中被取出:vc = w8。在步驟403,該登錄在有関於目 前的詞語(亦即 verb)和 vc (亦即8)之狀態的動作 列表中被決定出,此時,一存在於此處的第一動作係被讀 入。此産生出動作〃 reduce 0〃 (減降 0)。步驟405 然後檢査是否該動作為被"接受"。由於為否(N),此 時,步驟407檢査是否該動作為〃 shift s 〃(移轉s )。由於亦為非,因此在步驟40 9 —檢査然後被作出, 以決定是否該動作為Λ reduce p # (減降p)。是的(γ )。一檢査然後被作出,以決定是否規則 〇為具一空的 右手邊部分之産生規則。由於為否,因此在步驟4 12, 對於 G 中 vc 之每一個直接後趙者 X ,—形態為 <vc,x,p,cat,a2>的元索係被加至集合R。 R = { <w8,x2,〇,verb,a2> } 步驟413然後檢査是否有下一個動作在由步驟40 3所決定的登錄中。由於為否(N),所以該動作常式到 逹該結束位置415並且所述方法回返至該語法解析常式 之步驟3 0 7。 自此ϋ镰,步驟3 1 0檢査是否該等集合A, R以及 Re為空的。此為否(Ν),因為R不是空的。步驟30 -87 - 本紙ft尺Λ遍,中國困家汴芈(CNS)甲4规格(210 X 297公梦) 82.6. 40,000 (請先閲讀背面之注意事項再填寫本頁) —裝. 訂. .線. A6 B6 五、發明説明() (請先閲讀背面之注意事項再填寫本頁) 7然後經由步驟304和306而達到。該減降常式在步 驟307被叫用。由啓始位置601開始,一元素係自R 中被取出並且在步驟602被謓入。在步驟603,規則 0之左手邊部分然後被指定予受數K。 N = HP(Getal) 有關規則之整合係發生在步驟6 0 5。 自啓始位置701逛缠,步驟702藉由決定在右手 邊部分的毎一個所宣告的特擻指示與對應之目前的特徴指 示的交集,而決定出有效的特徽指示。 NP(Getal) : «articleCGetal), *noun(Getal) F d e c 1 111111 111111 111111 Fact 001000 001000 Fvalidated 001000 001000 步驟7 0 3 於為是(Y ), 然後檢査是否所獲得的交集皆非空的。由 因此步驟705被執行。在步驟705, -8 8 - 本纸ft又度嬝用中國a家棵準(CNS)甲4規格(訂0 X 297公) 82.6. 40.000 經濟#♦***屬癱工消^印51 A6 B6_ 五、發明説明() 藉由決定出所有屬於該纟且群之有效的的持德[指示之交集, 一整合的待擻指示然後係對在右手邊部分之每一傾被宣告 乙次以上的待徽組群被決定出〇在目前的例子中,有一個 組群,即組群"GETAL 〃。此得出整合(GETAL) = 0 0 1 0 0 0 。步驟7 0 6然後檢査是否在先前步驟中所獲得整合的特 徴指示並非空的。由於為是(Y) »因此關於該等特徵指 示之間的一致性並無發現到違反。所述方法然後繼缥步SE 7 0 8,其中Ptenpl係藉由在所有於先前步驟中所獲得 整合的待徴指示以及存在於右手邊部分之獨特的有效恃徴 指示上執行一邏輯OR運算而決定出。此得出 Ftenpl = 0 0 1 0 0 0 。步驟709然後被執行,其中該待徴指示
Ftenip2 俱藉由對所有來自右手邊部分之所宣告的待擻指 示之組合取負號而決定出。
Fteinp2 = 0000 步驟710然後對左收邊部分決定出目前的特徵指示 F(Getal)act = (001000 OR 000000) AND 111111 = 001000 步驟7 1 1然後檢査是否在步驟7 1 0所獲得的所有 目前的持徽指示偽非空的。由於為是(Υ ),因此關於持 -89- -----------------I------裝------、玎------線 (請先閲讀背面之注意事項再塡寫本頁) ' 本紙張又廑遶两中困a家棵準(CNS)甲4规格(210 X 297公货) 82.6. 40,000 308659 嬈濟#t*·*4麄工消 ί#社_* A6 B6 五、發明説明() 擻之傳送無發現到違反。结束位置713然後達到並且所 述方法回返到該減降常式之步驟5 〇 5。 所述方法鏺缠執行步驟606,其中一檢査係被作出 ,以決定是否該違反計數器有一超過該變數threshold 之計數。由於為否(N),因此步驟6 16被執行。 在步爨6 16,那些為是(Y)者偽被決定出,對此 在G中有一自xc (亦即χ2)到y長度2*2-2之路徑 。此産生出 y = xl。第一健 y然後在步思6 1 2被取出並 被指定予荽數JTC。 y c = X10 步驟613然後藉由自所減降規則之右手邊部分取屬 ' 於該等語辭的id而決定了 L。 L = (1,2) 在步驟614,所有的中態 s傜被決定出,對此有 一 w致使該w傜yc之一直接後繼者,以及亦致使該狀 態s偽在g 01 〇列表(其係由屬於該w之狀態和對應於 目前規則之左收邊部分的語辭所決定出)之登錄中找到。 -9 0 - 本紙ΛΑΛ邊國國家律準(CNS)甲4規格(2丨0 X 297父货) 82.6. 40,000 ---------------------------裝------,玎------線 (請先《讀背面之注意事項再填寫本頁) A6 B6 五、發明説明() 査詢G將顯示出有yc之一直接後繼者,亦卽vO。所隨 附的狀態偽 s = 0。對狀態s = 0 (有關於W的狀態)和語 辭H P査詢g 〇 t 〇列表得出s = 4。此狀態在步驟6 1 5被 令為目前的狀態sc。 s c = 4 步驟6 1 6然後指定w = vO作為一元素予集合W。 W = { vO } 步驟6 1 7然後檢査是否有一 u為集合U2,0之一 元素以及是否有翻於U的狀態係等於sc。由於為否(N ),因此步驟618偽被執行。在步驟618, id 偽被 增加1 ,並且在 T中一節點偽被産生具一標記id ,左 手邊部分之語辭具特徵以及一指到其他id之指標(在步 驟6 1 3中所決定)。 id = 3 T: 1 0 (^article [SING3 PLU3] aO] 2 0 (* η ο α n [SING3] al) -9 1 - 本紙Λ尺度適明中aa家棵準(CNS)甲4規格(210 X 297公;¢) 82.6. 40,000 (請先閲讀背面之注意事項再填寫本頁) 丨裝- 訂· .線· Α6 Β6 五、發明説明() 3 Ο (ΝΡ [SING3] (1,2)) 然後自 G移除在步驟6 1 1中對yc所決定的路徑 ,並且有一具標記sc = 4之節點u、一具擦記id = 3之節 點z、一自u到z之邊框、自z到w之邊框、W中所 有w被加至G,以及具標記sc = 4之u係被加至集合 A 和 U 2 , 0。 G: v 0 ζ 3 — u 4 A = { u4 } U 2,0 = { w8 u4 } 步驟624然後檢査是否多個狀態 s在步驟6 1 4 中被找到。由於為否(N),因此所述常式續行步驟62 6,在此處一檢査係被作出,以決定是否步铤6 1 1找到 了多痼y。此亦為否(N),因此結束位置628達到, 其中所述方法回返到該語法解析常式之步驟307。自步 驟307繼鑕,步驟310細逹到,其中一檢査傜被作出 ,以決定是否集合A, R以及Re為空的。A並非空的, 因此步驟3 0 5繼續作步驟3 04中所作的檢査。 -92- 本娬ft尺及嬝*肀《3家播準(CNS)甲4规ΙΜ210 X 297公货) 82.6. 40,000 ------------------------裝------ΪΓ------線 (請先閲讀背面之注意事喟再埸寫本頁) A6 B6 五、發明説明() 該動作常式係在此步驟被叫用。由啓始位置40 1繼 缅,一元素係自 A被移除並且此元素傜被令為目前的節 點vc 0 v c = u4 步驟4 0 3然後對有關於目前的字組"works"(亦 卽動詞)和對由關於 vc (亦即4)之狀態決定出登錄, 此時,在步驟404第一指定的動作係自此被讀入。此得 出w shift 7〃 (移轉7)。在步琛405 (N)和步揉 407 (N)已被執行之後,步驟408乃被執行。元素 < u 4 , 7 , <= v e r b , a 2 >傜被加至集合R。 R = { <u4,7,J!!verb,a2> } 步驟4 1 3和步驟4 1 5之後,結束位置4 1 7達到 並且所述方法回返至該語法解析常式之步驟3 0 5。 在步驟3 10之一檢査顯示出集合A, R和Re為空 的,致使步驟3 1 1係被執行。 -9 3 - ——-----------------------裝------.玎------線 {請先閲讀背面之注意事項再填寫本頁) 本紙值又度邊《中困a家樣準(CNS)甲4规烙(210 X 297公») 82.6. 40,000 A6 B6 五、發明説明( 該移轉常式偽在步驟3 1 1被叫用。在此情況下,該 移轉常式之結果偽一新的節點被加至 T以及兩健新的節 點被加至 G。 id T: 1 0 (^article [SIHG3 PLU3] aO) 2 0 (*noun [SIHG3] al)
3 0 (HP
[SIMG3] (1,2)) 4 0 (*verb [SING3] works) -------------------------------裝------,玎------線 (請先閲讀背面之注意事項再塡寫本頁) G: v 0 — z 3 — u 4 x 4 w 7 U 3, { »7 移轉常式之後,在步驊3 1 2計數i係被增加:i = 3 。步铤3 1 3然後檢査是否U3,0是空的。由於為否(N ),此時,步驟3 16檢査是否有下個基元存在。由於為 是(Y) •因此此下一鏡基元傜在步驟3 18被取出:” -9 4 - 82.6. 40,000 本紙ft尺度邊,中®國家捸準(CN*S)甲4規烙(210 X 297公;t ) 嫌濟# t*屬廉工消f鏵社印黧 A6 B6 五、發明説明() *etidaiark”。在步驟3 0 3, j 再次被啓始化為零,R, Re和Q被啓始化為空集合,以及A被啓始化為U3,0( 即 U7})。由於A並非空的,該動作常式係在步驟30 5被叫用。在動作常式中,該動作列表係對基元( *endaark)和狀態 7作讀取。此得出# r educ β 4” (減 降4)。在動作常式的步驟4 10, —檢査偽被作出,以 決定是否規則 4傜一空的産生規則。由於為否(Ν ), 因此步驟412然後披執行,其中 R 傜被提供以元素 <H7,x4,4,#endaark>a3> : i? = { < w 7 , X 4 , 4,* & n d π a r k · a 3 > } 由於無接下來的動作被指定,因此動作常式回返到該 語法解析常式。該減降常式然後在該語法解析常式中被叫 用。在該減降常式中,規則 4的左手邊部分係在步驟6 0 3被決定。此為〃 VP(GETAL)"。持擻傺被宣告於此規 則中,以致該整合常式係在步驟6 0 5被叫用。自啓始位 置70 1開始,步驟702決定了在右手邊部分的有效持 徴指示。 NP(GETAL) : «verb(GETAL), NP(GETAL)
Fdec1 111111 111111 111111 -95- ------------------------裝------#------線 (請先閲讀背面之注意事項再埸寫本頁) 本斌ΛΑΛ遍《中aa家樣準(CNS)甲4規丨各(210 X 297公梦) 82.6- 40,000 A6 B6 五、發明説明()
Fact 001000 001000
Fvalidated 001000 001000 此等並非空的(一在步驟704被測試的特徵),因 此所述方法龃缠步驟7 0 5。在此步驟中,對於在右手邊 部分中每一項披宣告多於乙次的待擻組群,一整合的特徴 指示係藉由決定出所有屬於該組群之有效的的特徴指示之 交集而被決定出。在目前的例子中,有一餹組群,即组群 "GETAL 〃。此得出整合(GETAL ) = 001000。步驟 7 0 6然後檢査每否在先前步思中所獲得整合的特撖指示 並非空的。由於為是(Y),因此翻於該等特擻指示之間 的一致性並無發現到違反。步琛708然後藉由在所有於 先前步驟中所獲得整合的特戡指示以及存在於右手邊部分 之獨待的有效特徴指示上,執行一邏輯OR蓮算而決定出 ?1811?1。此得出?18〇1?1 = 0〇1〇〇〇。步驟7 0 9 然後被 執行,其中該持激指示Fteap2偽藉由對所有來自右手邊 部分之所宣告的待徴指示之組合取負號而決定出。
Fteap2 = 0000 步驟710然後對左收邊部分決定出目前的持擻指示 -9 6 - 泰城ΛΑ-度邊《中國a家播準(CNS〉甲4觇格(210 X 297公璉) 82.6. 40,000 ------------------------裝------.玎------^ (請先閲讀背面之注意事項再塡寫本頁) 303659 A6 B6 五、發明説明() F(Getal)act = (001000 OR 〇〇〇〇〇〇) AND 111111 = 001000 步驟7 1 1然後檢査是否在步驟7 1 0所獲得的所有 目前的特徵指示偽非空的。由於為是(Υ),因此關於特 徽之傳送無發現到遠反。结束位置713然後達到並且所 述方法回返到該減降常式之步驟5 0 5。 所述方法龃續執行步驟606,其中一檢査偽被作出 ,以決定是否該違反計數器有一超過該變數threshold 之計數。由於為否(N),因此步驟6 16被執行。在步 驟616,那些為是(Y)者係被決定出,對此在 <3中 有一自xc (亦卽K4)到y長度2|p丨-2 = 2之路徑。 此得出 y = z3。步驟6 1 3然後決定出有関於來自目前規 則右手邊部分之符號的 id。此得出L=(4,3h步驟6 1 4一628然後以先前已描述的方式被執行,給出下列结 果: sc = GOTO(STATE(w),N) = G0T0 (0,VP) = 3 W = { v0 } -97- 本娬ft又廋邊明中國國家惲準(CNS)甲4规格(210 X 297公货) 82.6. 40,000 ---------------------------裝------iT------線 4. (請先閲讀背面之注意事項再填寫本頁) A6 B6 五、發明説明( id = 5 T: 1 0 (*article [SING3 PLU3] al) 2 0 (* η 〇 u η [SIHG3] a2)
3 0 (HP
[SING3] (1,2)) [SINS3] a3)
0 (VP
[SI NG3 ] (4,3)) S: vO z5 u3 { u3 —---------------------裝------.玎------線 (請先閲讀背面之注意事項再填寫本頁) 經濟工消 f*ti_w U 3 , 0 = { u3 } 所述方法然後回返到該語法解析常式,其中,由於A 並非空的,在步驟3 0 5之動作常式係被叫用。 對此,在步驟4 0 3 ,動作列表査詢字組"*endnark 〃以及狀態3。此得出〃 r e d u c e 1 "(減降1),因為集 -98- 本娬ftXJt遍《中aa家棵準(CNS) r 4规烙(210 X 297公釐) 82.6. 40,000 A6 B6_ 五、發明説明() 合 R 變成為:R = {<u3,z5,l,*endnark,a3>}。所述方法 然後回返到該語法解析常式,在此,由於 R並非空的, 該減降常式現被叫用。在該減降常式中,左手邊部分偽首 先對有關用於減降的規則被決定。此為N = S。步驟60 4然後檢査是否有待戡被宣告於此規則中。由於為是(Y ),因此整合常式被叫用。由啓始位置701開始,有效 的恃徵指示在步驟7 0 2中右邊被決定。 S : VP(GETAI) 〇 Fdec 1 111111
Fact 001000
Fun i 0 0 1 0 0 0 此等並非空的(一在步驟703被測試的特徵),因 此所述方法逛續步驟7 0 5。由於在右手邊部分中沒有與 相同的组群有関的數個特徵指示,因此步驟705和70 6没有作用。Fteapl 係在步驟7 ◦ 8被決定。F t e b p 1 = 0 0 1 0 0 0 。在步驟 7 Ο 9 , Ftemp2 被決定出:Ftenp2 = 000000。在步驟6 1 0,對左手邊的部分,目前的特徽指 示然後被決定出。在左邊無任何特徵已被宣告,所以對此 -9 9- 本紙值尺·度嬝中家埭準(CNS)甲4規格(210 X 297公皱) 82.6. 40,000 ------------------------裝------.玎------線 (請先閲讀背面之注意事項再蜞寫本頁) 經濟 #♦*«♦«·工请 印« A6 B6 五、發明説明() 無目前的特徴須被決定而且步驟710和711無作用。 結束位置71〇然後達到•其中所述方法係回返到該減降 常式。. 在此,步隳604檢査是否該違反計數器已超過該 受數 threshold。由於為否,因此常式趄續步缀6 1 1 。在此步驟,所有的y係被決定出/對此在G中有一自 xc ( = z5)到 y 長度2|p| -2 = 2之路徑。此得出 y=z5。步驟6 1 3然後決定出有關於來自目前規則右手邊 部分之符號的 id。此得出L=(5)。步驟5 1 3-529 然後以先前己描述的方式被執行,給出下列結果: sc = G0T0(STATE(w) ,N) = GOTO(VO,S) = 2 W = { vO } ’ id = 6 τ: 1 0 («article [SING3 FLU3] al) 2 0 («noun [SING3] a2) 30 (NP [SING3] (1,2)) -1 0 0 - 本纸ΛΛΛ遍《中a困家捸準(CNS)甲4規格(210 x 297公釐) 82.6. 40,000 ------------------------裝------ΤΓ------線 (請先閲讀背面之注意事項再填寫本頁) A6 B6
五、發明説明() 4 0 («verb 5 0 (VP 6 0 (S
[SING3] a3) [SING3] (4,3)) (5)) (請先閲讀背面之注意事項再項寫本頁) 嫌濟部中喪鑼瘳爲工消i#社印w A = { u 2 } U 3,0 = { u2 } 所述方法然後回返到該語法解析常式,其中,由於A 並非空的·在步驟305之動作常式係被叫用。 在此動作常式中,動作列表査詢字組# *endnark 〃 以及狀態2。此得出〃 s h i f t 6 "(移轉6 ),因此Q = {u2,6,*endiaark,a3}。所述方法然後自該動作常式回返 到該語法解析常式,其中該移轉常式係在步驟3 1 1被叫 用。在此,在步驟502, U4,0首先被啓始化成空集合 ,之後.接下來的步驟503 — 509得出下列结果: -1 0 1 - 本纸ΛΑΛ遍*中as家律苹(CNS)甲4規格(210 X 297公釐) 82.6. 40,000 A6 B6 五、發明説明() id = 7 T: 1 0 (^article [SING3 PLU3] al) 2 0 (*noun [SING3] a2)
3 Ο (NP
[SING3] (1,2)) 4 0 («verb [SING3] a3)
5 0 (VP
[SING3] (4,3)
6 0 (S (5)) 7 0 («endmark a4 ) ------------------------裝------.玎------線 (請先閲讀背面之注意事項再填寫本頁) 經濟部t*蠓攀屬晨工消#« G: vO 4- z 6 u2 f- x 7 w6 U 4,0 = { w6 所述方法然後回返到該語法解析常式,在其步驟31 2 ,計數i偽被增加1以得出i = 4。步驟3 1 3然後檢 査是否U4,0是空的。由於為否(N),此時,步驟3 1 -1 0 2 - 本娬»人廋遍期中國a家標準(CNS)甲4规格(210 X 297公釐) 82.6. 40,000 A6 B6 «濟部t**♦屬·工潙ί #社_« 五、發明説明() 6檢査是否有一基元。該结束符號仍然存在(Y),因此 結束符號$偽在步驟318被讀入。一些啓始化然後出現 在步驟303,以及 A =U4,0={wS}。由於 A並非空的 ,該動作常式係在步驟305被叫用。在步驟403査詢 動作列表得減降 3 之後,在步驟412, R 受成為 {<w6 , x7 , 3 , end s y π bo 1, a 4 > },之後,所述方法經由步驟 417回返到該語法解析常式。在後者中,由於 R並非 空的,該減降常式像在步驟307被叫用。在該減降常式 的步驟603,有關規則的左手邊部分係決定出:N = TOP。該減降常式之進一步蓮作最後得出: i d = 8 T: 1 0 («article 2 0 (^noun 3 0 (NP 4 0 («verb 5 0 (VP -1 0 3 - [SING3 PLU3] al) [SING3] a2) [SING3】(1,2)) [SIHG3] a3) [SING3] (4,3)) ------------------------裝------tr------線 (請先閲讀背面之注意事項再塡寫本頁) 本纸张尺廑遴明中國國家攆孕(CNS)甲巩烙(210 X 297公货) 82.6. 40,000 A6 _B6_ 五、發明説明() 6 〇 (S (5)) 7 0 (*endnark a4 ) 8 0 (TOP (6,7)) G:V〇 — Z6 <r U2 <r 28 ir ul U 4 , 0 = { u 1 } 所述方法回返到該語法解析常式,並然後在執行步揉 310、 304之後,該動作常式被叫用。在步驟304 ,動作列表被對結束符號"$"和狀態 1作査詢。此得 出動作#接受# (accept)以及節點ul亦被指定定予變 數r和id 8被指定予變數result。所述方法經由步揉 413和415回返到該語法解析常式。該移轉常式傜在 該語法解析常式之步驟311被叫用。然而,由於該集合 Q偽空的,因此該移轉常式無作用並且步驟3 1 3係達到 。在此,一檢査然後被作出,以決定是否U5,0為空的。 由於為否,此畤,步驟316檢査是否有一基元或是一結 束符號存在。此為否(N )。在步驟3 1 7 ,所獲得的分 -104- 本斌張AJt*«中B國家攆準(CNS)甲4規格(210 X 297公釐) 82.6. 40,000 ------------------------裝------.玎------線 (請先閲讀背面之注意事項再塡寫本頁) 308659 A6 B6 五、發明説明() (請先閲讀背面之注意事項再埸寫本頁) 析然後以一括弧結構的形態被寫出,與所找出分析有關的 id偽被指定予變數result。此得出下列者(為清楚起見 基元本身係予涵括入): result = 8
8 Θ (TOP
(S (VP [SING3] (VP [SING3] 〇article [SING3 PLU3] A) («noun [SIHG3] nan (*verb [SING3] eorks)))) 經濟♦中夹屬雇工消f鎿社印鼇 (^endmark .)) 該語法解析常式然後達到結束位置3 1 5 ,回到該語 -1 0 5 - 82.6. 40,000 本娬罹尺廋遢《中國國家律準(CNS)甲4現格(210 X 297父釐) 經濟部中*樣攀屬晨工消f #杜印· A6 B6 五、發明説明() 法解析常式的方法之後,步驟205偽達到,其中一檢査 然後被作出,以決定是否該語法解析常式已傳送出一结果 不等於零。由於為是(Y),因此一檢査然後在步琛20 9被作出,以決定是否違反計數偽等於零。由於亦為是( Y),因此所述方法停止在步驟2 1 1。 該語法解析單元關於違反機制的多樣以及適用持性現 將參照一些例子詳細描述。這些例子偽有關於自然語言處 理的領域之事實並無限制意味,如此作的原因只是因為這 些例子比較容易了解罷了。 在下述例子中,假設依據表8的文法傜可適用。吾人 假設餿至装置的信號偽被轉換單元101分段成基元宇串 :w A nan works . 〃。然後處理方式完全同於先前的例子 ,其中輸入字串為Λ A nan works.",就該文法的減降規 則 4。在此時,樹狀結構T有下列形態(為清楚起見基 元變數ai係為基元本身所取代): T: 1 〇· («article [SIHG3 PLU3] A) 2 0 (#noun 【SING3】 man) 30 (NP [sing3] (1,2)) -1 0 6 - 本紙Λ又度Λ»!中國国家棵準(CNS) τ 4规格(210 X 297公釐) 82.6. 40 000 ---------------------------裝------,玎------線 (請先閲讀背面之注意事項再塡寫本頁) 缦濟_中夹*♦屬晨X消ί鎿社印a A6 B6 五、發明説明() 4 〇 Overb [SIHG3] work) 在該文法規則 4之減降中,其中一名詞子句(NP) 和一動詞偽被減降至一動詞子句(VP),欲被減降語辭的 數目並不一致。在此情況下,待擻指示之處理偽如下: VP(Getal :NP(Getal), *verb ( Geta 1),
Fdecl 111111 111111 111111
Fact 001000 110111
Fvalidated 001000 110111 決定靥於相同組群有效持戲指示之交集乃得出一違反 ,因為該交集偽空的:
Funif (Getal) 0 0 0 0 0 0 — +1 因此關於來自右手邊部分語辭之持'戲間的一致性有一 本蛱Λ又度遠用中國國家標準(CNS) T 4规格(210 x 297 乂法 82.6. 40.000 丨—---------------------裝------.耵------線 (請先閲讀背面之注意事項再堉寫本頁) 經濟部中典«婆40工消ft合作钍印s A6 ___B6 五、發明説明() F t e a p 1之決定得出:〇 〇 〇 〇 0 0 Ftemp2之決定得出:〇〇〇〇〇〇 左手邊部分目前特徽指示之決定得出: Fact (Gatal) = ( 0 0 0 0 0 0 OR 0 0 0 0 0 0 ) AND 1 1 1 1 1 1 = 0 0 0 0 0 0 -^· +1 關於待擻之傳遞至左手邊部分的語辭一違反現亦被找 到,因此在離開整合常式時,該違反計數有計數2。 若所述方法現再度回返到該減降常式,步驟606檢 査是否該違反計數偽大於在步驟2 0 2被啓始化為零的受 數 threshold。由於為是(Y),此時,步驟6 0 7撿査 是否亦在步驟2 0 2被啓始化為零的受數new-threshold ' 係等於變數 threshold。此亦為是(Y),此時,在步驟 6 0 9, new-threshold偽被賦予值2。該減降常式不再 逛缳,所述方法回返到該語法解析常式並繼續步驟3 1 0 。所有集合A,Re和R為空的,因此在步驟3 1 1移轉 常式被叫用。集合 Q亦為空的,因為動作常式尚未被叫 用。因此,僅Ui + l,〇係在移轉常式被啓始化為空集合, 之後,结束位置5 0 9直接達到。所述方法回返到該語法 解析常式,在此,在步驟3 12,i然後被增加。步驟3 -1 0 8 - ---------------------------^------#------^ (請先閲讀背面之注意事項再填寫本頁) 本紙恨尺度適用中囷國家樣半(CNS)肀4規格(210 X 297么、釐) 82·6. 40,000 經濟部中央標準局員工消i?-<s-!vii-tii.:-: A6 B6 五、發明説明() 1 3然後檢査是否Ui,Q偽空的i此為是(Y)。在步.驟 3 14,值0然後被指定予變數result,之後,語法解 析常式到逹結束位置3 1 5。 所述方法回返到該語法解析單元之主常式,之後,步 驟2 0 5檢査是否變數result有一值不等於零。此為否 (N ),因此所述方法繼績執行步铤206。步驟206 檢查是否變數 threshold 由一值大於一預先設定的值 MAX。假設在目前的情況下 MAX具有值20.則對此問題 之解答為否(N)。在步駿2 08,受數 threshold之 值然後被固定在 2 + 1 = 3 並且值 3 亦披指定予變數 new-threshold。’該語法解析常式然後在步驟2 0 4再次 被叫用。 該語法解析常式然後由啓始化G和T而再繼缠,並 讀入第一基元。若所述方法再次到達該文法之減降規則4 ,則整合再次得出 2膣違反之計數。然而減降常式之步 驟6 0 6現顯示出計數並未大於 thireshold(N),因此所 述方法繼續執行語法解析常式的步驟6 1 1 - 628。在 步驟6 1 8加入一節點至 T之後,該違反計數器之位置 亦被指示出。此得出: i d = 5 -1 0 9 - i請先閔讀背面之注意事項再項寫本頁) I裝_ 訂· 用中國因家控半(CNS) Τ 4現烙(2ΐυ x 297 ) 82.6. 40.000 A6 經濟部中央標準局S工消f合ιτίινϊ.·:.: _ B6 五、發明説明() T: 1 0 (*artici 2 0 («noun 3 0 (NP 4 0 («verb 5 0 (VP A = { u3 } U 3,0 = { u3 } 所述方法然後回返到該語法解析常式,其中,由於A 並非空的,在步驟305之動作常式係被叫用。 所述方法谢續,該文法規則 1之減降再次顯示出一 違反,因為屬於VP之目前的特徵指示偽為零。由該違反 計數器所指示的計數因而變成為3。然而,計數仍然不大 於threshold,(其偽在步驟6 0 6檢査),致使所述方 法ϋ缅。無進一步規則之違反被發現到,因此該語法解析 -1 10- [SING3 PLU3] the) [SING3] man) [SING3] (1,2)) [SING3] work) [SING3] (4,3)) --------------------「------裝------tr------. (請先閲讀背面之注意事項再塡寫本頁) 尽適用t國國家槔苹(CNS)甲4現格(2i〇 X 29?公货) 82.6. 40,000 S0S659 A6 B6 五、發明説明( 常式最後得出下列分析結果 T : 10 Oart ic le [SING3 PLU3] the) [SIMG3] nan) 3 0 (ΝΡ [SING3] (1,2)) 4 0 ( * ν e r b [SING3] works)
5 2 (VP
[SING3] (4,3))
6 3 (S (5)) 7 0 («endmark ------------------------裝------'玎------11· (請先閲讀背面之注意事項再塡寫本頁> (6,7)) 經濟部中央標準居3工消泞合作;c:
8 3 (TOP 在步驟3 1 7, T偽被以一括弧結構形態寫出,並且 屬於所得出分析之 id係被指定予變數result。此得出 result = 8 -111 闱中國国家作·半(CNS)甲4規格(2i0 X 乂釐) 82.6· 40,000 經濟部中喪標準局員工消1Γ-合1rfi.v!l·*.: A6 _____B6_ 五、發明説明() 8 (3 TQP [] (3 S [】 (2 VP [] (〇 MP [SING3] (0 «article [SIHG3 PLU3] the) (0 *noun [SING3] Ban)) (〇 «verb [S1NG1 SING2 PLU1 PLU2 PLU3] work))) («endaark [].)) 該語法解析單元主常式之步驟2 〇 5然後檢査是否變 數result偽不等於零。此為否(n),因此所述方法趙 續步驟2 1 〇,其中一修正常式係被執行。在目前有自然 信號之處理的例子中,一此類型的修正常式可包含有一如 申請案ΕΡ-Α-0 052 459號中所描述的詞形變化修正程式 结合於依據本發明之語法解析常式。其所得出的結果可在 -112- rn司中 祕(加 8277ΊΓ( (請先《讀背面之注意事項再塡寫本頁) _裝· 訂. 經濟部中央標準局**工消ΛΗ合作a印ti A6 B6 五、發明説明() 此作有利的應用,其中對那些在其中規則之違反被找出的 減降步驟係有一指示。該語法解析單元之主常式然後達到 結束位置2 1 1 ,之後,所獲得的分析結果和所修正的信 號偽可供作進一步處理。 此例子顯示出該装置係適用於參照一糸统規則檢驗信 號,並然後參照所獲得的分析結果執行一修正動作。 在文法規則(或条統規則)確實適用於本發明方法之 前,使得這些規則形成為一適用於本發明方法之形態是必 要的,所述形態包括一動作列表、一 g 〇 t 〇列表和一特徴 列表,此特徴列表係一與該等規則聯繫的特徽指示架構。 令一語法解析程式適用於處理待定信號之程序,通常偽使 得一呈一些重寫規則(依據某一文法規範)形態之文法被 寫並然後該文法被编譯,亦即適用於由一電腦單元自動處 理的一些列表係自該文法導出。自一文法推導一動作列表 和一 g D t 0列表偽習知於此項技藝中。依據本發明推導一 特徵列表現將參照圖1 1所顯示的方法詳細描述。由啓始 位置1101開始,步驟1102自文法讀入所有定義的 持徵供作處理。每一持歡然後在步驟1 1 0 3被賦予一序 號。步驟1 104決定了持微指示披定義所需要的 N-位 元字组的號碼。此號碼係由所定義特戡的總數以及由 N 所決定。對於在程式化語言C所規劃的安装實施,以及利 用 Unix作業糸統,N = 32偽一適當選擇。具號數〇的 規則然後在步驟1 1 0 5被讀入。屬於左手邊語辭的第一 -11 3 - 冬尺^通用中SS家桴準(CNS)甲4规格(210 X 297公货) 82.6. 40 000 --------------------一------装------,玎 (請先閲讀背面之注意事項再墣寫本頁) S0S659 A6 ___B6_ 五、發明説明() (請先《讀背面之注意事項再塡寫本頁> 組群然後自步驟1 1 0 6中的規則被讀入。持擻指示然後 在步驟1 107被決定出。若此涉及到一定義在文法中的 組群,此組群所包含的特徴係參照此定義被決定。若涉及 到直接指示在該文法規則中的箪一個持徵,則由此一持歡 的名稱所指示的组群正好包括了該一特歡。此外,亦可容 許藉由增加或減除預先定義的特擻組群,而在一文法規則 中定義一组群。該特徴指示然後藉由在一長度為特戡數目 的零(zero)字串中代之以一査(one)而形成,其中毎 一値零具有一順序號碼對睡於一所涵括特歡的順序號碼。 所獲得的字串然後映射到在步驟1 1 0 4中所獲得 N-位 元字組的號碼。步驟1 1 08然後檢査是否一完金相同的 持戤指示在右手邊部分偽已知。若為是(Y),距此先前 決定的持擻指示的距離係在步驟1 1 09決定。在步驟1 1 1 0 ,所獲得的資料然後被以一適當的記憶結構( 經濟部中央標準局貝工消"合作社印5仪 下在 。一並.例 ,重的 否係 7 下入一構該同 是群 ο 有讀之結據相 査组 1 則被構弧依全 檢此 1 規 5 結括係完 後 ,驟的 1 億 一並前 然} 步前 1記為組先 1Y缠目 1 當製集至 1{繼否驟適複則加 1 是法是步一偽規被 1 為方査在 。構寫偽 驟或述檢傜 6 結重標4-步 。所 3 則 1 億一指11 。中後 1 規 1 記每 一 出辭然 1 此 1 此對中 寫語並 1 ,驟 ,係其 } 的入驟 }步中群及 re前謓步 Y 續 1 組以 tu目被 - <繼1 擻 , UC於 2} 是法表持序 tr在 1N 為方在的排 S 存 1 ί 或述示碼予 ry群 1 否 。所顯编則 Ιηα組驟為辭後偽中規 me一步若語然子其寫 82.6. 40,0( 戈通用中家桴準(CNS)甲4規烙(210 X 297公» ) A6 ____B6 五、發明説明() (請先閲讀背面之注意事項再填寫本頁) 、屬於表8文法的待戤組群。 C 表 1 1 ] ((linn) (mm) (1—111111)) (()(111111)) (()()) (()()()) ((111111) (111111) (1—111111)) 該等特徵之順序為:SING1 SING2 SIHG3 PLU1 PLU2 PLU3。籍由對编碼待戡組群提供以指到相同右手邊部分内 完金相同組群的指標,在一组群相同的所宣告持擻内,有 関符合的決定乃可加速達成。在步驟11〇9中所決定的 距離係對該指標所作。 經濟部中央標準局貝工消費合作.fi印k 依據本發明,該等特歡之處理給出了相當多的優點。 依據本發明操作之一辨識条統的設計員因而可精確地決定 出信號可辐離理想信號並仍可接受到達何種程度。此給出 了相當大的優點,特別是在進人信號為不完整或摂毀,例 如由於感測機構不精確的情況下,其中此等信號傜非常弱 ,或者是其中此等信號本來就有些許變異(例如手寫字或 語音信號)。 關於以重窝規則導入的特徵,適配於本發明依據一文 法架構所寫的文法之多樣以及適用待性將參照一些例子詳 細描述。這些例子偽有関於顯示在表1 2中的文法規則。 這些規則(其並非共同存在)僅用以顯示出依據本發明作 -115- 82.6-40,000 用中围国家柃半(CNS)甲4蚬格(210 X 29了公楚> 經濟部中喪標準马Λ工消費合作杜印夂 A6 B6 五、發明説明() 配合設計之常態文法的多樣性。其應用並非侷限於自然語 言處理。 〔表 1 2 ]
//Ftrs = SING1 SING2 SING3 PLU1 PLU2 PLU3 DUMMY //Getal = SING1 SING2 SING3 PLU1 PLU2 PLU3 //Dum : DUMMY 0 S :NP(Getal), VP(SING1+SING2+SING3+PLU1+PLU2+PLU3) 1 NP(Getal) :*det(Getal), *noun(Getal+Dum). 2 NP(PLU3) :*noun(Getal). 規則 〇顯示出一特徴組群可藉由加缌特擞而形成。 組群 Getal偽等於在VP定義的組群。此意味一測試係 對整合中對睡的目前特戡指示間符合性作出。若欲免除掉 對符合所作的測試,如規則 1中所示,偽可將一虛設的 特擻加至該組群 G e t a 1。組群” G e t a I + D u π ”不等於组群 ” Getal”並因而無符合測試被實施。在規則 2,持歡” PLU3”總是被指定予 NP。以此方式,係可導入不再需要 是與一詞語有關的特擻。 -1 1 6 - 氏尕尺Ji適用中國國家慄毕(CNS) T 4規丨各(210 X 297 ) 82.6. 40,000 -----------------------------裝------.玎------f (請先閲讀背面之注意事項再塡寫本頁)

Claims (1)

  1. 經濟部中央標準局員工消費合作社印策 六、申請專利範圍 1 · 一棰用於語法信號分析之装置,包括有: ——轉換單元(10 1)供將一輸入信號轉換成基元以及 轉換成對應於此等基元的常態ib基元; ——圖形辨識單元(102)被連至該轉換單元 > 供藉由 參照一文法提供常態化基元之字串在每一情況下的語法 分析; ——記憶體單元(1 0 3 )供儲存該文法,該文法包括有 被Μ重寫規則所排序並且亦包含對應於常態化基元之詞 語的語辭;特徴在於: 該轉換單元包括有特徵析取機構用於自一基元導出特澂、 ---- ----— 用於將自該基元所導出的特徵聯接在一起Μ形成至少一個 目前的特徵組群、以及用於將所述至少一個目前的特徵組 ' 、 一_---- - _ ,~ 群指.賦予對應於該基元的至少一個常態化基元, 一 ------ 該文法包括有隨附於該等語辭之所宣示的特激組群,Μ及 ** — - 該圖形辨識單元包括有用於目前的和所宣示的特徵組群之 丨圓〆 整合的機構。 2 ·如申請專利範圍第1項所述用於語法信號分析之 裝置,其中該圖形辨識單元高括有饑構用Κ依據目前的和 所宣告的特徵組群,將一違反計數指定予語法分析。 3 ·如申請專利範圍第2項所述用於語法信號分析之 裝置,此裝置包括有機構用於在假若該違反計數超過一臨 界值時中斷語法解析,以及有機構用於在假若該違反計數 超過該臨界值時提高該臨界值和機構用於重新啟始語法解 本纸張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) ---------一------訂------I (請先閱讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 A8 B8 C8 D8 六、申請專利範圍 析。 4 ·如申請專利範圍第2或3項所述用於語法信號分 析之装置,此装置包括有修正機構,若該違反計數不等於 零時,其係被致動。 5 ·如申請專利範圍第2或3項所述用於語法信號分 析之装置,此装置亦包括有警告機搆依據該違反計數而被 致動。 6 ·如申請專利範圍第1 — 3項中任一項所述用於語 法信號分析之装置,其中一特徴組群係K 一二進位數字表 示。 7 ·如申請專利範圍第1 一 3項中任一項所述用於語 法信號分析之装置,其中該轉換單元包含有偵測機構用Μ 將輸入信號轉換成一電子信號。 8 · —種參照儲存在一記憶體中文法之語法信號分析 方法,包括有下列步驟: —將一輸入信號轉換成基元Μ及轉換成對應於此等基元的 常態化基元; 一藉由該文法對該等常態ib基元之字串在每一情況下作語 法分析;特激在於: 該文法包括有所宣告的特徵組群,K及 --^〜 所述方法亦包括有下列步驟: —自一基元推導出目前的特徵, -结合由該基元所導出目前的特勸Μ形成至少一個目前的 -2 - 本紙張尺度適用中國國家標準(CNS ) Α4規格(210 X 297公釐) (請先閱讀背面之注意事項再填寫本頁)
    A8 B8 C8 D8 經濟部中央標隼局員工消費合作社印製 六、申請專利範圍 1 1 特 澂 組 群 1 1 | — 將 所 逑 至 少 —* 個 巨 J—C- 刖 的 特 徵 组 群 指 定 予 對 應 於 該 基 元 的 1 I 常 態 化 基 元 Μ 及 請 先 I 1 閱 I — 整 合 0 前 的 和 所 宣 告 的 特 徵 組 群 0 讀 背 1 \έ I 9 如 申 請 專 利 範 圍 第 8 項 所 述 參 照 儲 存 在 一 記 憶 體 冬 1 I 意 1 | 中 文 法 之 語 法 信 號 分 析 方 法 其 中 該 文 法 包 括 有 語 辭 Μ 重 事 項 1 I 寫 規 刖 排 序 並 對 每 -- 重 寫 規 則 分 布 於 —_. 左 手 邊 部 分 和 . 右 再 填 1 寫 手 邊 部 分 以 及 其 中 所 述 語 法 解 析 包 括 有 — 減 降 步 驟 用 以 頁 1 藉 由 依 據 一 包 含 了 一 對 應 於 該 巨 刖 語 辭 之 字 串 之 右 手 邊 部 1 1 分 的 可 適 用 重 寫 規 則 該 左 手 邊 部 分 重 寫 該 等 巨 前 語 辭 1 ! 之 字 串 以 形 成 該 語 辭 將 巨 前 語 辭 之 字 串 減 降 成 一 a 前 的 1 訂 減 降 語 辭 其 特 徵 在 於 所 宣 告 的 特 m 組 群 ί系 白 該 文 法 與 1 該 等 語 辭 结 合 在 於 對 每 減 降 步 驟 為 了 決 定 出 在 此 減 1 1 降 步 驟 中 所 獲 得 百 » t- 月 所 減 降 語 辭 之 巨 刖 的 特 徵 組 群 整 合 1 1 係 實 施 在 有 關 於 該 可 適 用 重 寫 規 則 之 語 辭 之 所 r^· 告 的 和 巨 1 前 的 特 激 組 群 上 : Μ 及 在 於 整 合 包 括 下 列 步 驟 1 | — 決 定 每 — 所 告 的 特 徵 組 群 和 對 應 之 g 前 的 特 徵 組 群 間 1 1 之 Λ*Α* 付 合 並 且 若 不 付 合 被 找 到 的 話 增 加 一 違 反 計 數 1 1 — 決 定 對 應 於 完 全 相 同 的 在 右 手 邊 部 分 中 所 宣 告 的 巨 »'« 月ϋ 1 I 特 徵 組 群 間 之 A*/V 付 合 並 且 若 不 符 合 被 找 到 的 話 增 加 該 1 1 違 反 計 數 > Η 及 1 1 — 對 每 一 宣 告 在 右 手 邊 部 分 中 持 澂 組 群 決 定 出 巨 前 的 特 徵 1 1 組 群 ί 並 且 若 巨 刖 的 特 徵 3- 組 群 不 付 合 任 何 特 激 的 話 t 1 1 1 1 本紙張尺度適用中國國家#準(CNS ) A4規格(210X 297公釐) ABCD 經濟部中央標隼局員工消費合作社印製 六、申請專利範圍 增加該違反計數= I 0 ·如申請專利範圍第9項所述參照儲存在一記憶 體中文法之語法信號分析方法,其中每一所宣告的特徵組 群和對應的目前特徵組群間符合之決定包括了藉由決定出 有關的目前的持澂組群與有關的所宣告持徽組群之邏輯交 集,而決定一有效的特激組群;對應於相互完全相同、在 右手邊部分中所宣告的特徴組群之目前特澂組群間符合之 決定包括了藉由決定出所有對應的有效特徵組群之邏輯交 集,而決定一有效的特徵組群;所述方法亦包括了下列步 驟: a ·编碼所有與一特徵組群中現在的重寫規則之右手邊部 分語辭之一者無關的特徵, b ·決定所有整合的持戤組群以及對應於在有關的重寫規 則中僅出現乙次之所宣告特徵組群之有效的特徵組群 之埵輯組合;Μ及 對每一在左手邊部分中所宣告的特徴組群,目前的特徵組 群之決定包括了: 在宣告於左手邊部分中特澂組群未被宣告在右手邊部分中 時’將所宣告的特徵组群指定予目前的特激組群。 II •如申请專利範圍第9或1 0項所述參照儲存在 一記憶體中文法之語法信號分析方法,其亦包括有下列步 驟: 一若該違反計數超過一臨界值:岔斷語法解析、將該臨界 本紙張尺度適用中國國家標準(CNS ) A4規格(210 X 297公釐) (請先閱讀背面之注意事項再填寫本f ) 訂 Λ ! ab,cd 308659 六、申請專利範圍 值增加至該違反計數與一可調值加總的值、並然後重行啟 動對常態化基元字串之語法解析。 n _ m n m m _ —L m I— _ tn n m T -'a (請先閱讀背面之注意事項再填寫本頁) 1 2 ·如申請專利範圍第9或1 0項所述參照儲存在 一記憶體中文法之語法信號分析方法,其亦包括有下列步 驟: —若經語法解析得出至少兩項解答時,選取具有最低違反 計數之解答。 1 3 ·如申請專利範園第9或1 0項所述參照儲存在 一記憶體中文法之語法信號分析方法,其亦包括有下列步 驟: —若該違反計數不等於零的話,啟動一修正動作。 14 ·如申請專利範圍第1 3項所述參照儲存在一記 憶體中文法之語法信號分析方法,其中該修正動作包括依 據由語法解析程式所傳送的分析令一基元適配3 經濟部中央標隼局員工消費合作社印製 1 5 ·如申請專利範圍第9或1 0項所述參照儲存在 一記憶體中文法之語法信號分析方法,其中若語法解析後 並未傳送一解答Μ及若該違反計數超過一可調值的話,該 警告機構係被致動。 1 6 ·如申請專利範圍第8 — 1 0項中任一項所述參 照儲存在一記憶體中文法之語法信號分析方法,其亦包括 有下列步驟:將特澂組群编碼以形成二進位數。 1 7 · —種編碼特徵之方法,包括有下列步驟: —指定一順序號碼 η予每一特徵, -5 - 本紙張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) 經濟部中央標準局員工消費合作社印製 A8 B8 C8 D8 六、申請專利範圍 一形成一代表一特徵組群並包含二進位值字串之二進位數 ,其係藉由將一第一二進位值放在該具有順序號碼對應於 該等須被涵括於該特徵組群之特澂的順序號碼之字串中所 有位置上,以及藉由將一第二二進位值放在該字串之其他 位置中。 1 8 ·如申請專利範圍第1 7項所述編碼特徵之方法 •其中該等特徵係有關涵括於一文法之重寫規則中的語辭 ,特徵在於所述方法包括有下列步驟: 對每一重寫規則Μ成組群之形態並依據該重寫規則予排序 之方式儲存编碼的特徵組群於該記憶體中,Μ及 若對每一重寫規則成組群並依據該重寫規則予排序之組群 含有一先前完全相同的编碼特徵組群的話,則加入一指標 至此先前完全相同的編碼特激姐群。 1 9 · 一種用於依據申請專利範圍第1 — 3項中任一 項所述方法作信號分析之裝置,其特澂在於: -該特徵取出機構係設計成可自一基元推導出互斥的特ί数 並將此等特徵涵括在目前的特徵組群中,以及 _該圖形辨識單元儀設計成可處理涵括在目前的特徵組群 中互斥的特徴。 2〇· 一種用於依據申請專利範圍第1— 3項中任一 項所述作語法信號分析之裝置,可適用於光學字元辨識, 其中欲由圖形辨識單元所傳送的語法分析包括有至少一個 字元供作辨識,其特激在於: 本紙張尺度適用中國國家梯準(CNS ) Α4規格(210Χ297公釐) (請先閱讀背面之注意事項再填寫本頁) 訂 A8 B8 C8 D8 經濟部中央標準局員工消費合作社印製 六、申請專利範圍 1 1 I — 該 装 置 包 含 儲 存 機 構 供 儲 存 一 有 關 於 欲 辨 識 字 元 並 由 對 1 1 | 應 於 來 自 有 關 的 _ 入 字 串 以 及 違 反 計 數 之 常 態 ib 基 元 的 1 I 基 元 所 形 成 的 字 元 影 像 請 1 1 閱 | — 該 装 置 包 含 有 m 搆 用 於 將 一 所 儲 存 的 違 反 計 數 比 較 於 一 讀 | 面 I 由 圖 形 辨 識 單 元 對 一 個 並 且 相 同 的 被 辨 識 字 元 所 決 定 的 之 1 | 意 1 | 違 反 計 數 以 及 若 該 比 較 機 搆 顯 示 出 所 儲 存 的 違 反 計 數 事 1 項 1 係 大 於 被 辨 識 字 元 的 違 反 計 數 的 話 用 於 由 一 有 關 於 一 存 填 寫 個 並 且 相 同 的 被 辨 字 元 的 字 元 影 像 蓋 寫 — 所 儲 存 的 字 本 頁 1 元 影 像 0 1 1 2 1 一 種 用 於 依 據 申 請 專 利 範 圍 第 1 — 3 項 中 任 一 1 | 項 所 述 作 語 法 信 Ocfe 分 析 之 裝 置 可 適 用 於 光 學 字 元 辨 識 » 1 訂 其 中 該 分 析 包 括 有 至 少 — 個 字 元 供 作 辨 識 其 特 徵 在 於 * 1 該 等 被 饋 入 圖 形 辨 識 單 元 之 常 能 化 基 元 字 串 各 包 含 有 一 itb 1 1 常 態 化 基 元 致 使 在 每 — 情 況 下 對 應 的 語 法 分 析 包 含 實 質 1 I 上 相 等 數 的 供 辨 識 字 元 I 2 2 如 申 請 專 利 範 圍 第 2 1 項 所 述 之 装 置 特 徵 在 1 1 於 被 饋 至 圖 形 辨 識 單 元 之 常 態 化 基 元 的 連 壤 字 串 係 相 互 叠 1 1 合 0 1 I 2 3 一 種 將 代 表 藉 由 一 光 學 掃 描 器 所 獲 得 的 文 字 線 1 I 條 之 一 影 像 元 素 圖 形 轉 換 成 適 於 供 作 圖 形 辨 識 之 基 元 和 特 1 1 ! 激 字 串 的 方 法 包 括 有 下 列 步 驟 1 1 — 將 影 像 元 素 圖 形 區 分 成 實 質 上 重 合 於 供 辨 識 文 字 行 之 平 1 I 行 的 鄰 接 段 1 | - 7- 1 1 本紙張尺度適用中國國家標準(CNS ) A4規格(210 X 297公釐) 308659 as B8 C8 D8 六、申請專利範圍 -將每一鄰接段區分成一些具有一固定影像元素圖形數目 行 一 每 予 項 類 定 指 佈 分 形 圖 素 元 像 ’ 影 行中 的行 度該 寬據 之依 基 成 形 而 起 。 1 徵 在 特 合 出 接 導 行 推 接 元 鄰 基 之 一 項 每 類 的 同 中 相 驟 予 步 賦 前 被 先 已及於 將以括 由 - 涵 藉 元 自 (請先閣讀背面之注意事項再填寫本頁) 訂 經濟部中央標準局員工消費合作社印製 本紙張尺度適用中國國家橾準(CNS ) A4規格(210X 297公釐)
TW082106458A 1993-02-19 1993-08-12 TW308659B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
NL9300310A NL9300310A (nl) 1993-02-19 1993-02-19 Inrichting en werkwijze voor syntactische signaal-analyse.
EP93200893A EP0612018B1 (en) 1993-02-19 1993-03-29 Apparatus and method for syntactic signal analysis

Publications (1)

Publication Number Publication Date
TW308659B true TW308659B (zh) 1997-06-21

Family

ID=19862082

Family Applications (1)

Application Number Title Priority Date Filing Date
TW082106458A TW308659B (zh) 1993-02-19 1993-08-12

Country Status (5)

Country Link
US (2) US5550934A (zh)
EP (1) EP0612018B1 (zh)
DE (1) DE69331044T2 (zh)
NL (1) NL9300310A (zh)
TW (1) TW308659B (zh)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5892842A (en) * 1995-12-14 1999-04-06 Xerox Corporation Automatic method of identifying sentence boundaries in a document image
US5848191A (en) * 1995-12-14 1998-12-08 Xerox Corporation Automatic method of generating thematic summaries from a document image without performing character recognition
US5850476A (en) * 1995-12-14 1998-12-15 Xerox Corporation Automatic method of identifying drop words in a document image without performing character recognition
US5870700A (en) * 1996-04-01 1999-02-09 Dts Software, Inc. Brazilian Portuguese grammar checker
US6236959B1 (en) * 1998-06-23 2001-05-22 Microsoft Corporation System and method for parsing a natural language input span using a candidate list to generate alternative nodes
US20070118358A1 (en) * 2005-11-08 2007-05-24 Tom Alexander S Phrase processor
US9633005B2 (en) 2006-10-10 2017-04-25 Abbyy Infopoisk Llc Exhaustive automatic processing of textual information
US8145473B2 (en) 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
US9047275B2 (en) 2006-10-10 2015-06-02 Abbyy Infopoisk Llc Methods and systems for alignment of parallel text corpora
US9235573B2 (en) 2006-10-10 2016-01-12 Abbyy Infopoisk Llc Universal difference measure
US8548795B2 (en) * 2006-10-10 2013-10-01 Abbyy Software Ltd. Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system
US8214199B2 (en) * 2006-10-10 2012-07-03 Abbyy Software, Ltd. Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US20080086298A1 (en) * 2006-10-10 2008-04-10 Anisimovich Konstantin Method and system for translating sentences between langauges
US8195447B2 (en) 2006-10-10 2012-06-05 Abbyy Software Ltd. Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US9645993B2 (en) 2006-10-10 2017-05-09 Abbyy Infopoisk Llc Method and system for semantic searching
US9984071B2 (en) 2006-10-10 2018-05-29 Abbyy Production Llc Language ambiguity detection of text
DE102007006084A1 (de) 2007-02-07 2008-09-25 Jacob, Christian E., Dr. Ing. Verfahren zum zeitnahen Ermitteln der Kennwerte, Harmonischen und Nichtharmonischen von schnell veränderlichen Signalen mit zusätzlicher Ausgabe davon abgeleiteter Muster, Steuersignale, Ereignisstempel für die Nachverarbeitung sowie einer Gewichtung der Ergebnisse
US8959011B2 (en) 2007-03-22 2015-02-17 Abbyy Infopoisk Llc Indicating and correcting errors in machine translation systems
US8812296B2 (en) 2007-06-27 2014-08-19 Abbyy Infopoisk Llc Method and system for natural language dictionary generation
US8219407B1 (en) 2007-12-27 2012-07-10 Great Northern Research, LLC Method for processing the output of a speech recognizer
US9262409B2 (en) 2008-08-06 2016-02-16 Abbyy Infopoisk Llc Translation of a selected text fragment of a screen
US9244902B2 (en) * 2011-10-20 2016-01-26 Zynga, Inc. Localization framework for dynamic text
US8989485B2 (en) 2012-04-27 2015-03-24 Abbyy Development Llc Detecting a junction in a text line of CJK characters
US8971630B2 (en) 2012-04-27 2015-03-03 Abbyy Development Llc Fast CJK character recognition
RU2592395C2 (ru) 2013-12-19 2016-07-20 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Разрешение семантической неоднозначности при помощи статистического анализа
RU2586577C2 (ru) 2014-01-15 2016-06-10 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Фильтрация дуг в синтаксическом графе
RU2596600C2 (ru) 2014-09-02 2016-09-10 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы обработки изображений математических выражений
US9626358B2 (en) 2014-11-26 2017-04-18 Abbyy Infopoisk Llc Creating ontologies by analyzing natural language texts

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4907285A (en) * 1984-08-24 1990-03-06 Hitachi, Ltd. Image understanding system
JPH07107694B2 (ja) * 1984-08-31 1995-11-15 株式会社日立製作所 文書処理装置
US5060277A (en) * 1985-10-10 1991-10-22 Palantir Corporation Pattern classification means using feature vector regions preconstructed from reference data
US4773099A (en) * 1985-10-10 1988-09-20 The Palantir Corporation Pattern classification means for use in a pattern recognition system
US5077807A (en) * 1985-10-10 1991-12-31 Palantir Corp. Preprocessing means for use in a pattern classification system
US4754489A (en) * 1985-10-15 1988-06-28 The Palantir Corporation Means for resolving ambiguities in text based upon character context
US5261009A (en) * 1985-10-15 1993-11-09 Palantir Corporation Means for resolving ambiguities in text passed upon character context
US5133023A (en) * 1985-10-15 1992-07-21 The Palantir Corporation Means for resolving ambiguities in text based upon character context
US4837842A (en) * 1986-09-19 1989-06-06 Holt Arthur W Character and pattern recognition machine and method
US4887212A (en) * 1986-10-29 1989-12-12 International Business Machines Corporation Parser for natural language text
WO1990001198A1 (en) * 1988-07-20 1990-02-08 Fujitsu Limited Character recognition apparatus
JPH0261763A (ja) * 1988-08-29 1990-03-01 Sharp Corp 機械翻訳装置
DE68928230T2 (de) * 1988-09-15 1998-02-05 Oce Tech Bv System zur grammatikalischen Verarbeitung eines aus natürlicher Sprache zusammengesetzten Satzes
AU624205B2 (en) * 1989-01-23 1992-06-04 General Electric Capital Corporation Variable length string matcher
US5125039A (en) * 1989-06-16 1992-06-23 Hawkins Jeffrey C Object recognition system
US5020112A (en) * 1989-10-31 1991-05-28 At&T Bell Laboratories Image recognition method using two-dimensional stochastic grammars
NL9100849A (nl) * 1991-05-16 1992-12-16 Oce Nederland Bv Werkwijze voor het met behulp van een computersysteem corrigeren van een fout in een, in een natuurlijke taal gestelde zin, alsmede een inrichting geschikt voor het uitvoeren van deze werkwijze.
US5343537A (en) * 1991-10-31 1994-08-30 International Business Machines Corporation Statistical mixture approach to automatic handwriting recognition
US5359673A (en) * 1991-12-27 1994-10-25 Xerox Corporation Method and apparatus for converting bitmap image documents to editable coded data using a standard notation to record document recognition ambiguities
US5317647A (en) * 1992-04-07 1994-05-31 Apple Computer, Inc. Constrained attribute grammars for syntactic pattern recognition

Also Published As

Publication number Publication date
NL9300310A (nl) 1994-09-16
US5550934A (en) 1996-08-27
EP0612018B1 (en) 2001-10-31
EP0612018A1 (en) 1994-08-24
US5784489A (en) 1998-07-21
DE69331044D1 (de) 2001-12-06
DE69331044T2 (de) 2002-06-06

Similar Documents

Publication Publication Date Title
TW308659B (zh)
Lopresti et al. A tabular survey of automated table processing
US7580828B2 (en) Automatic or semiautomatic translation system and method with post-editing for the correction of errors
Green et al. Multiword expression identification with tree substitution grammars: A parsing tour de force with french
Andersen et al. Spelling in the Hebrew Bible: Dahood memorial lecture
US20150127324A1 (en) Natural language parsers to normalize addresses for geocoding
Bayraktar et al. An analysis of english punctuation: The special case of comma
JP2008282366A (ja) 質問応答装置、質問応答方法、質問応答プログラム並びにそのプログラムを記録した記録媒体
Vydrin Mande languages
Joyce Constructing a Large-Scale Database of Japanese Word Associations.
Loftsson et al. Developing a PoS-tagged corpus using existing tools
CN101499056A (zh) 倒排参考句型语言分析方法
Nagata Language family relationship preserved in non-native english
Freschi The Role of paribhāṣā s in Mīmāṃsā: Rational Rules of Textual Exegesis
POPOVIČ et al. Processing of documents and queries in a Slovene language free text retrieval system
Krause et al. Lemmatizing German newspaper texts with the aid of an algorithm
List Computational historical linguistics
KR101080880B1 (ko) 외래어의 자동 음차 표기 방법 및 장치
ABBAS Semi-Semantic Annotation: A guideline for the URDU. KON-TB treebank POS annotation
Roochnik COMPUTER-BASED SOLUTIONS TO CERTAIN LINGUISTIC PROBLEMS ARISING FROM THE ROMANIZATION OF ARABIC NAMES.(VOLUMES I AND II)
Peters Prescription and normativity in the evolution of inner-circle Englishes
Kamal et al. Improve Academic Query Resolution through BERT-based Question Extraction from Images
Schilder et al. A Flexible Table Parsing Approach
Anderl et al. Some Reflections on the Mark-up and Analysis of Dūnhuáng Manuscripts: Exemplified by the Platform Sūtra
Hu et al. An MT-Oriented Study of Corresponding Lexical Chunks in Business Correspondences from English to Chinese

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees