JP2018538615A - 文章を解析するための方法およびシステム - Google Patents
文章を解析するための方法およびシステム Download PDFInfo
- Publication number
- JP2018538615A JP2018538615A JP2018525475A JP2018525475A JP2018538615A JP 2018538615 A JP2018538615 A JP 2018538615A JP 2018525475 A JP2018525475 A JP 2018525475A JP 2018525475 A JP2018525475 A JP 2018525475A JP 2018538615 A JP2018538615 A JP 2018538615A
- Authority
- JP
- Japan
- Prior art keywords
- block units
- computer
- implemented method
- sentence
- unique
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000012545 processing Methods 0.000 claims abstract description 9
- 230000006870 function Effects 0.000 description 7
- 230000003252 repetitive effect Effects 0.000 description 4
- 230000008520 organization Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B7/00—Electrically-operated teaching apparatus or devices working with questions and answers
- G09B7/02—Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/226—Validation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Business, Economics & Management (AREA)
- Educational Technology (AREA)
- Educational Administration (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
Description
Claims (17)
- 文章を解析するためのコンピュータ実装方法であって、
前記文章の1つまたは複数の文字を、各々が少なくとも1つの文字を含む1つまたは複数のブロック単位に切断する段階と、
前記1つまたは複数のブロック単位を1つまたは複数の一意的なブロック単位に分類する段階と、
前記1つまたは複数の一意的なブロック単位を等級付けデータベースと比較することにより、前記1つまたは複数の一意的なブロック単位の各々に等級を割り当てる段階とを備える方法。 - 前記1つまたは複数の一意的なブロック単位の各々の割り当てられた前記等級を出力する段階を更に備える、請求項1に記載のコンピュータ実装方法。
- 割り当てられた前記等級または割り当てられた各等級における前記1つまたは複数の一意的なブロック単位の総数を出力する段階を更に備える、請求項1または2に記載のコンピュータ実装方法。
- 前記1つまたは複数の一意的なブロック単位の各々に割り当てられた前記等級のうち1つまたは複数に基づいて、前記文章の全体的等級を決定する段階を更に備える、請求項1から3のいずれか一項に記載のコンピュータ実装方法。
- 前記分類する段階の後に、前記1つまたは複数の一意的なブロック単位の各々を1つまたは複数の特性フィールドと関連付ける段階を更に備える、請求項1から4のいずれか一項に記載のコンピュータ実装方法。
- 1つまたは複数の特性フィールドと関連付けられた前記1つまたは複数の一意的なブロック単位を、前記等級付けデータベースの複数のフィールドセットと比較する段階であって、前記複数のフィールドセットは、前記1つまたは複数の特性フィールドに従って類別される、比較する段階を更に備える、請求項5に記載のコンピュータ実装方法。
- 前記1つまたは複数の特性フィールドは、一意的なブロック単位の構造、意味、性質および発音のうち少なくとも1つを含む1つまたは複数の特性に関する、請求項5または6に記載のコンピュータ実装方法。
- 前記1つまたは複数の特性は、1つまたは複数の特性データベースからのデータにより定義される、請求項7に記載のコンピュータ実装方法。
- 各等級の各特性フィールドにおける前記1つまたは複数の一意的なブロック単位の総数を出力する段階を更に備える、請求項5から8のいずれか一項に記載のコンピュータ実装方法。
- 前記文章の前記文字は、第1の所定の文字数Nの複数のブロック単位に切断され、前記複数のブロック単位は、請求項1から9のいずれか一項に従って処理され、Nは整数であり、Nは1より大きいかまたはそれに等しい、請求項1に記載のコンピュータ実装方法。
- 前記文章の前記文字は次に、第2の所定の文字数Mの複数のブロック単位に切断され、前記複数のブロック単位は、請求項1から10のいずれか一項に従って処理され、前記第2の所定の数Mは、整数を含み、第1の所定の数Nよりサイズが大きい、請求項10に記載のコンピュータ実装方法。
- 前記文章の前記全体的等級は、前記文章をより大きなブロック単位へと連続的に切断すること、および、請求項1から10のいずれか一項に従って係るブロック単位を連続的に処理することから導き出される、請求項4に記載のコンピュータ実装方法。
- 前記段階は、コンピュータデバイスのプロセッサにより実装される、請求項1から12のいずれか一項に記載のコンピュータ実装方法。
- 前記段階は、ネットワークサーバにより実装される、請求項1から12のいずれか一項に記載のコンピュータ実装方法。
- 前記関連付ける段階から得られた結果をメモリユニットに記憶する段階を更に備える、請求項5に記載のコンピュータ実装方法。
- プロセッサに請求項1から15のいずれか一項に記載のコンピュータ実装方法を実行させるためのプログラム。
- データを記憶するためのメモリと、コンピュータ可読命令を実行するためのプロセッサとを備えるシステムであって、前記プロセッサは、実行されているときに請求項1から15のいずれか一項に記載のコンピュータ実装方法を実装する前記コンピュータ可読命令により構成される、システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
HK15111493.2A HK1210371A2 (en) | 2015-11-20 | 2015-11-20 | A method and system for analyzing a piece of text |
HK15111493.2 | 2015-11-20 | ||
PCT/CN2016/079003 WO2017084238A1 (en) | 2015-11-20 | 2016-04-11 | A method and system for analyzing a piece of text |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018538615A true JP2018538615A (ja) | 2018-12-27 |
JP6693032B2 JP6693032B2 (ja) | 2020-05-13 |
Family
ID=55747663
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018525475A Active JP6693032B2 (ja) | 2015-11-20 | 2016-04-11 | 文章を解析するための方法、プログラムおよびシステム |
Country Status (10)
Country | Link |
---|---|
US (1) | US10755594B2 (ja) |
JP (1) | JP6693032B2 (ja) |
CN (1) | CN106776533B (ja) |
CA (1) | CA2926953C (ja) |
HK (1) | HK1210371A2 (ja) |
MY (1) | MY195702A (ja) |
PH (1) | PH12018550064A1 (ja) |
SG (1) | SG10201509744UA (ja) |
TW (1) | TWI686714B (ja) |
WO (1) | WO2017084238A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190317979A1 (en) * | 2017-12-14 | 2019-10-17 | Sang C. Lee | Tripartite poetry paradigm |
CN111914093A (zh) * | 2019-05-09 | 2020-11-10 | 深圳中兴飞贷金融科技有限公司 | 数据处理方法和装置,存储介质和电子设备 |
Family Cites Families (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995034038A1 (en) * | 1994-06-03 | 1995-12-14 | Synopsys, Inc. | Method and apparatus for context sensitive text displays |
US5724498A (en) * | 1995-06-07 | 1998-03-03 | Adobe Systems Incorporated | Method and apparatus for concealing character modifications made for text composition purposes |
US5794177A (en) * | 1995-07-19 | 1998-08-11 | Inso Corporation | Method and apparatus for morphological analysis and generation of natural language text |
US6154757A (en) * | 1997-01-29 | 2000-11-28 | Krause; Philip R. | Electronic text reading environment enhancement method and apparatus |
TW364966B (en) * | 1997-07-15 | 1999-07-21 | Inventec Corp | Automatic syntax analysis method for Chinese |
US6120297A (en) * | 1997-08-25 | 2000-09-19 | Lyceum Communication, Inc. | Vocabulary acquistion using structured inductive reasoning |
JP3612597B2 (ja) * | 1998-11-05 | 2005-01-19 | 日本電信電話株式会社 | 文書重要文ランキング方法、文書重要文ランキング装置、及び文書重要文ランキングプログラムを記録した記録媒体 |
US7069508B1 (en) * | 2000-07-13 | 2006-06-27 | Language Technologies, Inc. | System and method for formatting text according to linguistic, visual and psychological variables |
US6658377B1 (en) * | 2000-06-13 | 2003-12-02 | Perspectus, Inc. | Method and system for text analysis based on the tagging, processing, and/or reformatting of the input text |
US7165264B1 (en) * | 2001-07-26 | 2007-01-16 | Digeo, Inc. | Client-side tool for splitting or truncating text strings for interactive television |
US7103848B2 (en) * | 2001-09-13 | 2006-09-05 | International Business Machines Corporation | Handheld electronic book reader with annotation and usage tracking capabilities |
US7313513B2 (en) * | 2002-05-13 | 2007-12-25 | Wordrake Llc | Method for editing and enhancing readability of authored documents |
US20050069849A1 (en) * | 2003-09-30 | 2005-03-31 | Iode Design | Computer-based method of improving reading comprehension |
CN1673996A (zh) * | 2004-03-24 | 2005-09-28 | 无敌科技股份有限公司 | 一种识别语言文本难易度的系统及其方法 |
JP4304146B2 (ja) | 2004-12-01 | 2009-07-29 | 株式会社東芝 | 辞書登録装置、辞書登録方法および辞書登録プログラム |
US8608477B2 (en) * | 2006-04-06 | 2013-12-17 | Vantage Technologies Knowledge Assessment, L.L.C. | Selective writing assessment with tutoring |
JP2008129475A (ja) * | 2006-11-23 | 2008-06-05 | Osamu Asai | 音声教材 |
TW200825778A (en) * | 2006-12-12 | 2008-06-16 | Inventec Besta Co Ltd | Hand-held reading device and the reading assistant method thereof |
GB2446427A (en) * | 2007-02-07 | 2008-08-13 | Sharp Kk | Computer-implemented learning method and apparatus |
US20090228777A1 (en) * | 2007-08-17 | 2009-09-10 | Accupatent, Inc. | System and Method for Search |
US8306356B1 (en) * | 2007-09-28 | 2012-11-06 | Language Technologies, Inc. | System, plug-in, and method for improving text composition by modifying character prominence according to assigned character information measures |
US8136034B2 (en) * | 2007-12-18 | 2012-03-13 | Aaron Stanton | System and method for analyzing and categorizing text |
CN101539923A (zh) * | 2008-03-18 | 2009-09-23 | 北京搜狗科技发展有限公司 | 从文档中提取正文片段的方法及装置 |
CN101540041B (zh) | 2008-03-21 | 2012-06-27 | 中国科学院计算技术研究所 | 一种扫描文档浏览适配方法 |
US8463594B2 (en) * | 2008-03-21 | 2013-06-11 | Sauriel Llc | System and method for analyzing text using emotional intelligence factors |
US8320674B2 (en) | 2008-09-03 | 2012-11-27 | Sony Corporation | Text localization for image and video OCR |
US8606796B2 (en) * | 2008-09-15 | 2013-12-10 | Kilac, LLC | Method and system for creating a data profile engine, tool creation engines and product interfaces for identifying and analyzing files and sections of files |
JP2010256821A (ja) * | 2009-04-28 | 2010-11-11 | Sci-Tec:Kk | 学習支援システム |
US20100311030A1 (en) * | 2009-06-03 | 2010-12-09 | Microsoft Corporation | Using combined answers in machine-based education |
US20110123967A1 (en) * | 2009-11-24 | 2011-05-26 | Xerox Corporation | Dialog system for comprehension evaluation |
US8892421B2 (en) * | 2010-12-08 | 2014-11-18 | Educational Testing Service | Computer-implemented systems and methods for determining a difficulty level of a text |
JP2012208143A (ja) * | 2011-03-29 | 2012-10-25 | Hideki Aikawa | オンライン学習システム |
CN102497270B (zh) | 2011-12-24 | 2014-07-16 | 桂林电子科技大学 | 一类规范化文档的加密方法 |
CN103186911B (zh) | 2011-12-28 | 2015-07-15 | 北大方正集团有限公司 | 一种处理扫描书数据的方法及装置 |
CN102662952B (zh) | 2012-03-02 | 2015-04-15 | 成都康赛信息技术有限公司 | 一种基于层次的中文文本并行数据挖掘方法 |
CN104462207B (zh) * | 2014-11-03 | 2017-07-11 | 陕西师范大学 | 面向分布式学习环境的多片段学习资源标注方法 |
RU2580424C1 (ru) * | 2014-11-28 | 2016-04-10 | Общество С Ограниченной Ответственностью "Яндекс" | Способ выявления незначащих лексических единиц в текстовом сообщении и компьютер |
US9563613B1 (en) * | 2015-01-23 | 2017-02-07 | Sprint Communications Company L.P. | System and method for dynamic portable document file generation |
CN104615772B (zh) * | 2015-02-16 | 2017-11-03 | 重庆大学 | 一种用于电子商务的文本评价数据专业程度分析方法 |
CN107291683A (zh) * | 2016-04-11 | 2017-10-24 | 珠海金山办公软件有限公司 | 一种拼写检查方法及装置 |
US11615104B2 (en) * | 2016-09-26 | 2023-03-28 | Splunk Inc. | Subquery generation based on a data ingest estimate of an external data system |
US11210622B2 (en) * | 2016-09-26 | 2021-12-28 | Splunk Inc. | Generating augmented process models for process analytics |
US11604795B2 (en) * | 2016-09-26 | 2023-03-14 | Splunk Inc. | Distributing partial results from an external data system between worker nodes |
US11748358B2 (en) * | 2018-09-28 | 2023-09-05 | Splunk Inc. | Feedback on inferred sourcetypes |
-
2015
- 2015-11-20 HK HK15111493.2A patent/HK1210371A2/xx not_active IP Right Cessation
- 2015-11-26 SG SG10201509744UA patent/SG10201509744UA/en unknown
- 2015-12-01 TW TW104140236A patent/TWI686714B/zh active
- 2015-12-16 CN CN201510953092.XA patent/CN106776533B/zh active Active
-
2016
- 2016-04-11 WO PCT/CN2016/079003 patent/WO2017084238A1/en active Application Filing
- 2016-04-11 JP JP2018525475A patent/JP6693032B2/ja active Active
- 2016-04-11 MY MYPI2018701910A patent/MY195702A/en unknown
- 2016-04-12 CA CA2926953A patent/CA2926953C/en active Active
- 2016-04-15 US US15/130,761 patent/US10755594B2/en active Active
-
2018
- 2018-05-16 PH PH12018550064A patent/PH12018550064A1/en unknown
Also Published As
Publication number | Publication date |
---|---|
CN106776533A (zh) | 2017-05-31 |
HK1210371A2 (en) | 2016-04-15 |
PH12018550064A1 (en) | 2018-11-12 |
CA2926953C (en) | 2022-08-09 |
CN106776533B (zh) | 2021-05-07 |
SG10201509744UA (en) | 2017-06-29 |
WO2017084238A1 (en) | 2017-05-26 |
MY195702A (en) | 2023-02-06 |
TWI686714B (zh) | 2020-03-01 |
US10755594B2 (en) | 2020-08-25 |
TW201719450A (zh) | 2017-06-01 |
US20170148337A1 (en) | 2017-05-25 |
CA2926953A1 (en) | 2017-05-20 |
JP6693032B2 (ja) | 2020-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10755185B2 (en) | Rating difficulty of questions | |
US10169706B2 (en) | Corpus quality analysis | |
US10713571B2 (en) | Displaying quality of question being asked a question answering system | |
US9864744B2 (en) | Mining multi-lingual data | |
US7983902B2 (en) | Domain dictionary creation by detection of new topic words using divergence value comparison | |
US10474752B2 (en) | System and method for slang sentiment classification for opinion mining | |
US9646512B2 (en) | System and method for automated teaching of languages based on frequency of syntactic models | |
JP6693032B2 (ja) | 文章を解析するための方法、プログラムおよびシステム | |
Duran et al. | Some issues on the normalization of a corpus of products reviews in Portuguese | |
Putri et al. | Software feature extraction using infrequent feature extraction | |
CN112559711A (zh) | 一种同义文本提示方法、装置及电子设备 | |
JP2017021523A (ja) | 用語意味コード判定装置、方法、及びプログラム | |
JP6351177B2 (ja) | 学習単元間の親子関係を特定する学習教材分析プログラム、装置及び方法 | |
CN116685966A (zh) | 调整查询生成模式 | |
EP4239515A1 (en) | A method and system for analyzing a piece of text comprising chinese characters | |
JP2018055620A (ja) | 情報処理装置及びプログラム | |
Bannò et al. | Back to grammar: Using grammatical error correction to automatically assess L2 speaking proficiency | |
Li | Journal Profile Based on Feature Words Extracting and Feature Co-occurrence Analyzing | |
JP5363178B2 (ja) | 修正候補取得装置、修正候補取得システム、修正候補取得方法、修正候補取得プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180919 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190731 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190903 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200317 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200326 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6693032 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |