TW201435625A - 專業領域辭典電腦輔助撰寫方法及系統 - Google Patents
專業領域辭典電腦輔助撰寫方法及系統 Download PDFInfo
- Publication number
- TW201435625A TW201435625A TW102107958A TW102107958A TW201435625A TW 201435625 A TW201435625 A TW 201435625A TW 102107958 A TW102107958 A TW 102107958A TW 102107958 A TW102107958 A TW 102107958A TW 201435625 A TW201435625 A TW 201435625A
- Authority
- TW
- Taiwan
- Prior art keywords
- index
- professional
- aforementioned
- vocabulary
- academic
- Prior art date
Links
Landscapes
- Machine Translation (AREA)
Abstract
一種專業領域辭典電腦輔助撰寫方法及系統,其系統包含:一處理單元、一資料庫群組、一專業詞彙生成子系統、一詞彙釋明子系統及一輸出單元,並執行下列步驟:先匯入教科書索引資料表,並自前述教科書索引資料表擷取複數索引詞,接著將前述索引詞作為文件搜尋關鍵字,搜尋下載複數筆與前述索引詞相關之學術文件,並自前述學術文件擷取語言單位,再將前述語言單位進行詞頻統計,以得出複數專業詞彙,接著以前述專業詞彙作為一說明搜尋關鍵字,搜尋下載與前述專業詞彙相關之說明資料,以達到建置具通用性、正確性及實用性專業領域辭典之目的。
Description
本發明係有關於一種專業領域辭典電腦輔助撰寫方法及系統,尤指辭典的詞彙及索引詞的建置係利用多筆學術文件進行詞頻統計而成,以增進專業詞彙及辭典索引詞的通用性及正確性,有效提昇辭典的實用性。
隨著近年來時代的快速變遷及科技知識的日新月異,在各個專業領域中,經常會產生新的專業詞彙,或是詞彙字義解釋改變、增加,但專業詞彙的使用通常較不廣泛,業者並不易收錄。
為此遂有如中華民國專利公開號201104462之「客製化辭典生成系統及其方法」,其至少包含:一接收模組,用以接收至少一辭典項目與該些辭典項目各自之一資料,其中該些辭典項目分別對應一關聯定義;一設定模組,用以依據該些辭典項目建立其各自之至少一設定區塊,以供設定該些辭典項目各自之至少一格式;一生成模組,用以依據該些辭典項目各自對應之該關聯定義將該些辭典項目與其各自之該資料生成一辭典資料檔;一提取生成模組,用以提取該些辭典項目各自之該些格式,並且將該些辭典項目與其各自之該些格式生成一格式配置檔;及一輸出單元,用以將該辭典資料檔與該格式配置檔輸出為一辭典檔。
上述先前技術,係透過不同用戶所提供的設定及資料進行辭典的建置,以解決業者不易蒐集、整理專業詞彙的問題,但仍有不足處有待改善,主要原因在於:
1.專業詞彙本身的正確性、通用性及解釋完整性的則僅能仰賴用戶的專業程度,然而,就專業領域而言,各種專業詞彙定義的解釋及使用,也往往會有因人而異的狀況,所產生新專業詞彙的解釋往往尚未有共識,若僅由個人或少數人自行編撰不免流於偏狹,而不具代表性,影響辭典的實用性,但若參考多人意見或是更為多元的資料,卻又過於繁雜、耗時。
2.再者,辭典僅由個人或少數人自行編撰時,也不易選用適合的索引詞,由於辭典索引詞選用的主要原則在於,索引詞與詞彙必須具備明顯的關聯性,方有助於使用者查閱、瀏覽,並能讓使用者清楚瞭解各詞彙的所屬領域、範疇。
爰此,為提昇專業領域辭典的代表性、實用性,以及簡化專業領域辭典建置流程,並能以更佳的索引詞來對詞彙進行分類、編排,本發明人致力於研究,提出一種專業領域辭典電腦輔助撰寫系統,包括:
一處理單元;
一資料庫群組,係連結前述處理單元,包含一索引表資料庫、一索引詞資料庫、一學術文件資料庫、一專業詞彙資料庫及一釋明資料庫,前述索引資料庫係至少匯入一專業領域之教科書索引表,前述教科書索引表係含有複數索引詞,前述索引詞資料庫係供匯入前述索引詞;
一專業詞彙生成子系統,係內建於前述處理單元,包含一文件蒐集模組、一擷取模組及一文件詞頻統計模組,前述文件蒐集模組係將前述索引詞作為一文件搜尋關鍵字,並上傳至一第一網際網路搜尋引擎,以自前述第一網際網路搜尋引擎下載複數筆學術文件至前述學術文件資料庫,前述擷取模組係自前述學術文件擷取複數語言單位,前述文件詞頻統計模組係統計前述複數筆學術文件之前述語言單位出現的頻率,以得出複數專業詞彙並匯入前述專業詞彙資料庫;
一詞彙釋明子系統,內建於前述處理單元,係將前述專業詞彙作為一詞彙搜尋關鍵字,並上傳至第二網際網路搜尋引擎,以自前述第二網際網路搜尋引擎蒐集下載一說明資料,並匯入前述釋明資料庫;
一輸出單元,係連結前述處理單元,以透過前述處理單元自前述資料庫群組輸出前述索引詞及前述專業詞彙。
進一步,前述教科書索引表的數量為複數個,又進一步包含一辭典索引詞生成子系統,係內建於前述處理單元,前述辭典索引詞生成子系統包含一索引詞詞頻統計模組,前述索引詞詞頻統計模組係用以統計前述教科書索引表所含索引詞出現的頻率,以選出通用的索引詞。
進一步,前述學術文件的種類係為一期刊文件、一專利文件、一學位論文文件、一研討會論文文件或一雜誌文件之任一或組合,又進一步包含一資料來源設定介面,係連結前述處理單元,前述資料來源設定介面係提供一種類選項,用以設定前述學術文件的種類,以匯入前述學術文件資料庫。
進一步,前述專業詞彙生成子系統進一步包含一斷詞模組及一過濾模組,用以將前述學術文件進行分段斷詞,以供前述擷取模組擷取前述語言單位,前述過濾模組係用以設定一排除詞彙及一字串長度設定選項,以過濾前述語言單位,前述排除詞彙係為一冠詞、一介詞或一自訂排除詞之任一或組合,前述字串長度設定選項係用以設定一字串長度之上限值,以過濾字串長度過長的語言單位。
進一步,前述學術文件為一學術文件簡介資料表,前述語言單位為前述學術文件簡介資料表所含之複數關鍵詞。
進一步,前述說明資料可為一詞彙發音資料、一詞彙翻譯資料或一詞彙解釋資料之任一或組合,而前述專業詞彙解釋資料係為一文字資料、一圖片資料、一音訊資料或一影片資料之任一或組合。
並提供一種專業領域辭典電腦輔助撰寫方法,係應用於一電腦系統,係包含下列步驟:
A.至少匯入一教科書索引資料表,前述教科書索引資料表係含有複數索引詞;
B.將前述索引詞作為一文件搜尋關鍵字,並上傳至一第一網際網路搜尋引擎,以自前述第一網際網路搜尋引擎搜尋下載複數筆與前述索引詞相關之學術文件;
C.自前述學術文件擷取複數語言單位;
D.將前述語言單位進行詞頻統計,以得出複數專業詞彙;
E.以前述專業詞彙作為一說明搜尋關鍵字,並上傳至第二網際網路搜尋引擎,以自前述第二網際網路搜尋引擎搜尋下載與前述專業詞彙相關之一說明資料。
A.至少匯入一教科書索引資料表,前述教科書索引資料表係含有複數索引詞;
B.將前述索引詞作為一文件搜尋關鍵字,並上傳至一第一網際網路搜尋引擎,以自前述第一網際網路搜尋引擎搜尋下載複數筆與前述索引詞相關之學術文件;
C.自前述學術文件擷取複數語言單位;
D.將前述語言單位進行詞頻統計,以得出複數專業詞彙;
E.以前述專業詞彙作為一說明搜尋關鍵字,並上傳至第二網際網路搜尋引擎,以自前述第二網際網路搜尋引擎搜尋下載與前述專業詞彙相關之一說明資料。
進一步,前述教科書索引資料表的數量為複數個,並將前述各教科書書目資料所含的前述索引詞進行詞頻統計,以得出通用之索引詞。
進一步,前述學術文件為一學術文件簡介資料表,前述語言單位為前述學術文件簡介資料表所含之複數關鍵詞。
又提供一種專業領域辭典電腦輔助撰寫方法,係應用於一電腦系統,係包含下列步驟:
A.匯入複數筆學術文件,係對前述學術文件依序進行分段斷字及詞頻統計,以擷取複數索引詞,再依據前述索引詞一併出現的機率,以得出一關聯強度,再依據前述關聯強度的高低對前述索引詞進行分類,以建置具樹狀分類結構之複數索引詞;
B.將前述索引詞作為一文件搜尋關鍵字,並上傳至一第一網際網路搜尋引擎,以自前述第一網際網路搜尋引擎搜尋下載複數筆與前述索引詞相關之學術文件;
C.自前述學術文件擷取複數語言單位;
D.將前述語言單位進行詞頻統計,以得出複數專業詞彙;
E.以前述專業詞彙作為一說明搜尋關鍵字,並上傳至第二網際網路搜尋引擎,以自前述第二網際網路搜尋引擎搜尋下載與前述專業詞彙相關之一說明資料。
A.匯入複數筆學術文件,係對前述學術文件依序進行分段斷字及詞頻統計,以擷取複數索引詞,再依據前述索引詞一併出現的機率,以得出一關聯強度,再依據前述關聯強度的高低對前述索引詞進行分類,以建置具樹狀分類結構之複數索引詞;
B.將前述索引詞作為一文件搜尋關鍵字,並上傳至一第一網際網路搜尋引擎,以自前述第一網際網路搜尋引擎搜尋下載複數筆與前述索引詞相關之學術文件;
C.自前述學術文件擷取複數語言單位;
D.將前述語言單位進行詞頻統計,以得出複數專業詞彙;
E.以前述專業詞彙作為一說明搜尋關鍵字,並上傳至第二網際網路搜尋引擎,以自前述第二網際網路搜尋引擎搜尋下載與前述專業詞彙相關之一說明資料。
本發明的功效在於:
1.本發明之系統將彙整特定專業領域的大量學術文件,並快速從中擷取具通用性、代表性的專業詞彙,藉此有效提昇專業領域辭典的實用性,並讓專業領域辭典的建置更為簡易、迅速。
2.本發明之系統,係依據教科書索引詞設定的辭典索引詞搜尋下載相關的學術文件,藉此確保辭典索引詞與專業詞彙具有高度的關聯性,以便於使用者清楚瞭解各專業詞彙的所屬領域、範疇,並增進查閱、瀏覽的方便性,以進一步提昇專業辭典的實用性。
3.本發明之系統,係將前述專業詞彙上傳至網際網路搜尋引擎,藉此搜尋下載豐富、多元的專業詞彙說明資料,幫助使用者快速瞭解專業詞彙的意義。
(100)...專業領域辭典電腦輔助撰寫系統
(1)...處理單元
(2)...資料庫群組
(21)...索引表資料庫
(22)...索引詞資料庫
(23)...學術文件資料庫
(24)...專業詞彙資料庫
(25)...釋明資料庫
(3)...辭典索引詞生成子系統
(31)...索引詞詞頻統計模組
(4)...專業詞彙生成子系統
(41)...文件蒐集模組
(42)...擷取模組
(43)...文件詞頻統計模組
(44)...斷詞模組
(45)...過濾模組
(46)...過濾設定介面
(461a)...排除詞彙設定欄位
(461b)...字串長度設定欄位
(461c)...詞彙類型設定欄位
(5)...資料來源設定介面
(51)...種類選項
(6)...詞彙釋明子系統
(7)...輸出模組
(8)...瀏覽檢索介面
(A)...教科書索引表
(B)...學術文件
[第一圖]係為本發明之系統架構圖。
[第二圖]係為本發明之步驟流程示意圖。
[第三圖]係為本發明另一實施例之系統架構示意圖。
[第四圖]係為本發明專業詞彙生成子系統之使用介面示意圖。
[第五圖]係為本發明過濾設定介面之使用介面示意圖一。
[第六圖]係為本發明過濾設定介面之使用介面示意圖二。
[第七圖]係為本發明過濾設定介面之使用介面示意圖三。
[第八圖]係為本發明資料來源設定介面之使用介面示意圖。
[第九圖]係為本發明瀏覽檢索介面之使用介面示意圖。
[第十圖]係為本發明以索引詞於作為文件搜尋關鍵字搜尋之彙整分析表。
[第十一圖] 係為本發明以索引詞於作為文件搜尋關鍵字搜尋之彙整分析圖。
[第二圖]係為本發明之步驟流程示意圖。
[第三圖]係為本發明另一實施例之系統架構示意圖。
[第四圖]係為本發明專業詞彙生成子系統之使用介面示意圖。
[第五圖]係為本發明過濾設定介面之使用介面示意圖一。
[第六圖]係為本發明過濾設定介面之使用介面示意圖二。
[第七圖]係為本發明過濾設定介面之使用介面示意圖三。
[第八圖]係為本發明資料來源設定介面之使用介面示意圖。
[第九圖]係為本發明瀏覽檢索介面之使用介面示意圖。
[第十圖]係為本發明以索引詞於作為文件搜尋關鍵字搜尋之彙整分析表。
[第十一圖] 係為本發明以索引詞於作為文件搜尋關鍵字搜尋之彙整分析圖。
綜合上述技術特徵,本發明專業領域辭典電腦輔助撰寫系統(100)的主要功效將可於下述實施例清楚呈現。
本發明請先參閱第一圖所示,包含:
一處理單元(1)。
一資料庫群組(2),係連結前述處理單元(1),包含一索引表資料庫(21)、一索引詞資料庫(22)、一學術文件資料庫(23)、一專業詞彙資料庫(24)及一釋明資料庫(25),前述索引資料庫(21)係匯入複數筆專業領域之教科書索引表(A),前述教科書索引表(A)係含有複數索引詞,前述索引詞資料庫(22)係供匯入前述索引詞〔以企業資源規劃(ERP)的教科書為例:索引詞包含電子商務(EC)、顧客關係管理(CRM)、供應鏈管理(SCM)、生產管理(PM)、財務管理(FM)等〕。
一辭典索引詞生成子系統(3),係內建於前述處理單元(1),前述辭典索引詞生成子系統(3)包含一索引詞詞頻統計模組(31),前述索引詞詞頻統計模組(31)係用以統計前述教科書索引表(A)所含索引詞出現的頻率,以選出通用的索引詞,並供匯入前述索引詞資料庫(22),又前述索引詞係具備樹狀分類結構,以便於供後述專業詞彙生成子系統(4)之文件蒐集模組(41)的各類學術文件(B)擷取與詞頻處理,並供使用者以後述的瀏覽檢索介面(8)進行瀏覽及查詢字詞使用;
要特別說明的是:索引詞的選擇不僅能夠利用前述複數筆教科書索引表(A)的索引詞統計而成,亦能利用學術文件(B)的題目、關鍵字或摘要來進行依序進行分段斷字及詞頻統計,以擷取複數索引詞,再依據前述索引詞一併出現的機率,以得出一關聯強度,再依據前述關聯強度的高低對前述索引詞進行分類,以建置具樹狀分類結構之複數索引詞;
一專業詞彙生成子系統(4)(請配合參閱第四圖),係內建於前述處理單元(1),包含一文件蒐集模組(41)、一擷取模組(42)及一文件詞頻統計模組(43),前述文件蒐集模組(41)係將前述索引詞作為一文件搜尋關鍵字〔例如分別以企業資源規劃(ERP)的教科書為例:索引詞包含電子商務(EC)、顧客關係管理(CRM)、供應鏈管理(SCM)、生產管理(PM)、財務管理(FM)作為文件搜尋關鍵字,請配合參閱第十圖及第十一圖,係為本發明以顧客關係管理(CRM)實際搜尋期刊之彙整分析圖及彙整分析表,排名依序為顧客關係管理、顧客忠誠度、關係行銷等,而碩博中文關鍵字的排名則依序為顧客關係管理、顧客滿意度、服務品質等,藉此即可獲得複數專業詞彙〕,並上傳至一第一網際網路搜尋引擎,以自前述第一網際網路搜尋引擎下載複數筆學術文件(B)至前述學術文件資料庫(23),又前述學術文件(B)的種類係為一期刊文件、一專利文件、一學位論文文件、一研討會論文文件或一雜誌文件之任一或組合,前述擷取模組(42)係自前述學術文件(B)擷取複數語言單位,前述文件詞頻統計模組(43)係統計前述複數筆學術文件(B)之前述語言單位出現的頻率,以得出複數專業詞彙並匯入前述專業詞彙資料庫(24);
要特別說明的是:前述學術文件(B)在本實施例中,最佳的是直接取用學術文件簡介資料表,而前述語言單位便是選自前述學術文件簡介資料表所含之複數關鍵詞(例如:結合多類型字典與條件隨機域之中文斷詞與詞性標記系統研究之論文,研究生:羅永聖,在全國博碩士論文網提供的論文基本資料中,除了提供論文名稱、研究生姓名、學位類別、校院名稱等各項基本資料外,尚提供有中文關鍵詞:中文斷詞、詞性標記、字典、條件隨機域、語言規則),由於前述關鍵詞係由學術文件(B)的作者所提供,因此通常與學術文件(B)內容極為相關,也通常是較具通用性、普遍性的專業詞彙,藉此提昇前述語言單位擷取的精確性,並精簡前述語言單位的程序、時間,以進一步加快專業領域辭典建置的速度;
於另一實施例中,請配合參閱第三圖,而前述專業詞彙的生成則亦可利用學術文件(B)的全文,以讓資料來源更為豐富,前述專業詞彙生成子系統(4)則是進一步包含一斷詞模組(44)及一過濾模組(45),用以將前述學術文件(B)進行分段斷詞,以供前述擷取模組(42)擷取前述語言單位,前述過濾模組(45)係用以過濾前述語言單位,前述過濾模組(45)係連結一過濾設定介面(46)(請配合參閱第五圖至第七圖),前述過濾設定介面(46)係提供複數設定欄位,前述設定欄位係為一排除詞彙設定欄位(461a)、一字串長度設定欄位(461b)或一詞彙類型設定欄位(461c)之任一或組合,前述排除詞彙設定欄位(461a)為複數個,係分別用以過濾冠詞、介詞或自訂排除詞之任一或組合,前述字串長度設定欄位(461b)係用以設定一字串長度之上限值,以過濾字串長度過長的語言單位,前述詞彙類型設定欄位(461c)係用以設定所需的語言單位為單字類型或片語類型之任一或組合。
一資料來源設定介面(5)(請配合參閱第八圖),係連結前述處理單元(1),前述資料來源設定介面(5)係提供一種類選項(51),用以設定前述學術文件(B)的種類,以匯入前述學術文件資料庫(23),舉例說明:前述學術文件(B)的來源可以僅選擇論文文件作為資料來源,亦可利用論文文件、期刊文件及專利文件作為資料來源。
一詞彙釋明子系統(6),內建於前述處理單元(1),係將前述專業詞彙作為一詞彙搜尋關鍵字,並上傳至第二網際網路搜尋引擎,以自前述第二網際網路搜尋引擎蒐集下載一說明資料,並匯入前述釋明資料庫(25),前述說明資料可為一詞彙發音資料、一詞彙翻譯資料或一詞彙解釋資料之任一或組合,而前述專業詞彙解釋資料係為一文字資料、一圖片資料、一音訊資料或一影片資料之任一或組合。
一輸出單元(7),係連結前述處理單元(1),以透過前述處理單元(1)自前述資料庫群組(2)輸出前述索引詞及前述專業詞彙。
一瀏覽檢索介面(8),係連結前述處理單元(1),以供檢索前述專業詞彙及瀏覽前述索引詞、前述專業詞彙及前述專業詞彙之說明資料,又瀏覽檢索介面(8)另提供前述辭典索引詞生成子系統(3)所產生之索引分類或是教科書索引表(A)(請配合參閱第九圖),該可以即時顯示教科書的封面資訊,並提供教科書索引表(A)的中文、英文或中英文同步的翻譯功能。
實際使用之情況,復請參閱第二圖並配合第一圖,係先將複數筆教科書索引資料表匯入資料庫群組(2)之索引表資料庫(21),並擷取前述教科書索引資料表之索引詞,再令辭典索引詞生成子系統(3)之索引詞詞頻統計模組(31)對前述索引詞進行詞頻統計,以得出多本專業領域之教科書皆通用之索引詞,再將前述索引詞匯入索引詞資料庫(22);
接著令專業詞彙生成子系統(4)之文件蒐集模組(41)以前述索引詞作為一文件搜尋關鍵字,並上傳至一第一網際網路搜尋引擎(例如:Google開放的API),以自前述第一網際網路搜尋引擎搜尋下載複數筆與前述索引詞相關之學術文件(B),並將前述學術文件(B)匯入學術文件資料庫(23);
再以專業詞彙生成子系統(4)之擷取模組(42)自前述學術文件資料庫(23)之學術文件(B)擷取複數語言單位,前述學術文件(B)在本實施例中,最佳的是直接取用學術文件簡介資料表,而前述語言單位便是選自前述學術文件簡介資料表所含之複數關鍵詞,並將前述語言單位進行詞頻統計,以得出複數專業詞彙;
隨後令詞彙釋明子系統(6)以專業詞彙作為一說明搜尋關鍵字,並上傳至第二網際網路搜尋引擎(例如:Google開放的API),以自前述第二網際網路搜尋引擎搜尋下載與前述專業詞彙相關之一說明資料,再以輸出單元(7)透過前述處理單元(1)自前述資料庫群組(2)輸出前述索引詞及前述專業詞彙。
如此,使用者係可利用本系統彙整特定專業領域的大量學術文件(B),並快速從中擷取具通用性、代表性的專業詞彙,將能有效提昇專業領域辭典的實用性,並讓專業領域辭典的建置更為簡易、迅速,再者,依據教科書索引詞設定的辭典索引詞所搜尋下載之學術文件(B),將能確保辭典索引詞與專業詞彙具有高度的關聯性,以便於使用者清楚瞭解各詞彙的所屬領域、範疇,並增進查閱、瀏覽的方便性,以進一步提昇專業辭典的實用性。
綜合上述實施例之說明,當可充分瞭解本發明之操作、使用及本發明產生之功效,惟以上所述實施例僅係為本發明之較佳實施例,當不能以此限定本發明實施之範圍,即依本發明申請專利範圍及發明說明內容所作簡單的等效變化與修飾,皆屬本發明涵蓋之範圍內。
(100)...專業領域辭典電腦輔助撰寫系統
(1)...處理單元
(2)...資料庫群組
(21)...索引表資料庫
(22)...索引詞資料庫
(23)...學術文件資料庫
(24)...專業詞彙資料庫
(25)...釋明資料庫
(3)...辭典索引詞生成子系統
(31)...索引詞詞頻統計模組
(4)...專業詞彙生成子系統
(41)...文件蒐集模組
(42)...擷取模組
(43)...文件詞頻統計模組
(5)...資料來源設定介面
(6)...詞彙釋明子系統
(7)...輸出模組
(8)...瀏覽檢索介面
(A)...教科書索引表
(B)...學術文件
Claims (10)
- 一種專業領域辭典電腦輔助撰寫系統,包括:
一處理單元;
一資料庫群組,係連結前述處理單元,包含一索引表資料庫、一索引詞資料庫、一學術文件資料庫、一專業詞彙資料庫及一釋明資料庫,前述索引資料庫係至少匯入一專業領域之教科書索引表,前述教科書索引表係含有複數索引詞,前述索引詞資料庫係供匯入前述索引詞;
一專業詞彙生成子系統,係內建於前述處理單元,包含一文件蒐集模組、一擷取模組及一文件詞頻統計模組,前述文件蒐集模組係將前述索引詞作為一文件搜尋關鍵字,並上傳至一第一網際網路搜尋引擎,以自前述第一網際網路搜尋引擎下載複數筆學術文件至前述學術文件資料庫,前述擷取模組係自前述學術文件擷取複數語言單位,前述文件詞頻統計模組係統計前述複數筆學術文件之前述語言單位出現的頻率,以得出複數專業詞彙並匯入前述專業詞彙資料庫;
一詞彙釋明子系統,內建於前述處理單元,係將前述專業詞彙作為一詞彙搜尋關鍵字,並上傳至第二網際網路搜尋引擎,以自前述第二網際網路搜尋引擎蒐集下載一說明資料,並匯入前述釋明資料庫;
一輸出單元,係連結前述處理單元,以透過前述處理單元自前述資料庫群組輸出前述索引詞及前述專業詞彙。 - 如請求項1所述專業領域辭典電腦輔助撰寫系統,其中,前述教科書索引表的數量為複數個,又進一步包含一辭典索引詞生成子系統,係內建於前述處理單元,前述辭典索引詞生成子系統包含一索引詞詞頻統計模組,前述索引詞詞頻統計模組係用以統計前述教科書索引表所含索引詞出現的頻率,以選出通用的索引詞。
- 如請求項1所述專業領域辭典電腦輔助撰寫系統,其中,前述學術文件的種類係為一期刊文件、一專利文件、一學位論文文件、一研討會論文文件或一雜誌文件之任一或組合,又進一步包含一資料來源設定介面,係連結前述處理單元,前述資料來源設定介面係提供一種類選項,用以設定前述學術文件的種類,以匯入前述學術文件資料庫。
- 如請求項1所述專業領域辭典電腦輔助撰寫系統,其中,前述專業詞彙生成子系統進一步包含一斷詞模組及一過濾模組,用以將前述學術文件進行分段斷詞,以供前述擷取模組擷取前述語言單位,前述過濾模組係用以設定一排除詞彙及一字串長度設定選項,以過濾前述語言單位,前述排除詞彙係為一冠詞、一介詞或一自訂排除詞之任一或組合,前述字串長度設定選項係用以設定一字串長度之上限值,以過濾字串長度過長的語言單位。
- 如請求項1所述專業領域辭典電腦輔助撰寫系統,其中,前述學術文件為一學術文件簡介資料表,前述語言單位為前述學術文件簡介資料表所含之複數關鍵詞。
- 如請求項1所述專業領域辭典電腦輔助撰寫系統,其中,前述說明資料可為一詞彙發音資料、一詞彙翻譯資料或一詞彙解釋資料之任一或組合,而前述專業詞彙解釋資料係為一文字資料、一圖片資料、一音訊資料或一影片資料之任一或組合。
- 一種專業領域辭典電腦輔助撰寫方法,係應用於一電腦系統,係包含下列步驟:
A.至少匯入一教科書索引資料表,前述教科書索引資料表係含有複數索引詞;
B.將前述索引詞作為一文件搜尋關鍵字,並上傳至一第一網際網路搜尋引擎,以自前述第一網際網路搜尋引擎搜尋下載複數筆與前述索引詞相關之學術文件;
C.自前述學術文件擷取複數語言單位;
D.將前述語言單位進行詞頻統計,以得出複數專業詞彙;
E.以前述專業詞彙作為一說明搜尋關鍵字,並上傳至第二網際網路搜尋引擎,以自前述第二網際網路搜尋引擎搜尋下載與前述專業詞彙相關之一說明資料。 - 如請求項7所述之專業領域辭典電腦輔助撰寫方法,前述教科書索引資料表的數量為複數個,並將前述各教科書書目資料所含的前述索引詞進行詞頻統計,以得出通用之索引詞。
- 如請求項7所述之專業領域辭典電腦輔助撰寫方法,其中,前述學術文件為一學術文件簡介資料表,前述語言單位為前述學術文件簡介資料表所含之複數關鍵詞。
- 一種專業領域辭典電腦輔助撰寫方法,係應用於一電腦系統,係包含下列步驟:
A.匯入複數筆學術文件,係對前述學術文件依序進行分段斷字及詞頻統計,以擷取複數索引詞,再依據前述索引詞一併出現的機率,以得出一關聯強度,再依據前述關聯強度的高低對前述索引詞進行分類,以建置具樹狀分類結構之複數索引詞;
B.將前述索引詞作為一文件搜尋關鍵字,並上傳至一第一網際網路搜尋引擎,以自前述第一網際網路搜尋引擎搜尋下載複數筆與前述索引詞相關之學術文件;
C.自前述學術文件擷取複數語言單位;
D.將前述語言單位進行詞頻統計,以得出複數專業詞彙;
E.以前述專業詞彙作為一說明搜尋關鍵字,並上傳至第二網際網路搜尋引擎,以自前述第二網際網路搜尋引擎搜尋下載與前述專業詞彙相關之一說明資料。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW102107958A TW201435625A (zh) | 2013-03-06 | 2013-03-06 | 專業領域辭典電腦輔助撰寫方法及系統 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW102107958A TW201435625A (zh) | 2013-03-06 | 2013-03-06 | 專業領域辭典電腦輔助撰寫方法及系統 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW201435625A true TW201435625A (zh) | 2014-09-16 |
Family
ID=51943366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW102107958A TW201435625A (zh) | 2013-03-06 | 2013-03-06 | 專業領域辭典電腦輔助撰寫方法及系統 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TW201435625A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109918632A (zh) * | 2019-02-26 | 2019-06-21 | 维正科技服务有限公司 | 基于场景模板的文献撰写辅助方法 |
-
2013
- 2013-03-06 TW TW102107958A patent/TW201435625A/zh unknown
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109918632A (zh) * | 2019-02-26 | 2019-06-21 | 维正科技服务有限公司 | 基于场景模板的文献撰写辅助方法 |
CN109918632B (zh) * | 2019-02-26 | 2022-12-06 | 维正科技服务有限公司 | 基于场景模板的文献撰写辅助方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107180045B (zh) | 一种互联网文本蕴含地理实体关系的抽取方法 | |
US8135669B2 (en) | Information access with usage-driven metadata feedback | |
CN103473369A (zh) | 基于语义的信息采集方法及系统 | |
AU2010210014A1 (en) | Systems, Methods and Apparatus for Relative Frequency Based Phrase Mining | |
CN103678412A (zh) | 一种文档检索的方法及装置 | |
Nguyen et al. | Digital library research (1990-2010): A knowledge map of core topics and subtopics | |
Li et al. | Text mining and visualization of papers reviews using R language | |
Kurniawan et al. | Indonesian Lexicon-Based Sentiment Analysis of Online Religious Lectures Review | |
Liu et al. | Event-based cross media question answering | |
Alfrjani et al. | A new approach to ontology-based semantic modelling for opinion mining | |
Dijkshoorn et al. | Using linked data to diversify search results a case study in cultural heritage | |
Park et al. | Application of semi-automatic metadata generation in libraries: Types, tools, and techniques | |
Fung et al. | Discover information and knowledge from websites using an integrated summarization and visualization framework | |
TW201435625A (zh) | 專業領域辭典電腦輔助撰寫方法及系統 | |
Magdy et al. | A summarization tool for time-sensitive social media | |
Singh et al. | A Content-based eResource Recommender System to augment eBook-based Learning | |
Kumar et al. | Semantic search via entity-types: The semannorex framework | |
Li et al. | Enhancing news organization for convenient retrieval and browsing | |
Přichystal | Mobile application for customers’ reviews opinion mining | |
Ramezani et al. | Automated text summarization: An overview | |
Cherichi et al. | Big data analysis for event detection in microblogs | |
Tsapatsoulis | Web image indexing using WICE and a learning-free language model | |
JP2004206571A (ja) | 文書情報提示方法及び装置並びにプログラム及び記録媒体 | |
Thanadechteemapat et al. | Thai word segmentation for visualization of thai web sites | |
Luo et al. | Multimedia news exploration and retrieval by integrating keywords, relations and visual features |