WO2024025184A1 - 동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템 및 그것을 기록한 매체 - Google Patents

동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템 및 그것을 기록한 매체 Download PDF

Info

Publication number
WO2024025184A1
WO2024025184A1 PCT/KR2023/009308 KR2023009308W WO2024025184A1 WO 2024025184 A1 WO2024025184 A1 WO 2024025184A1 KR 2023009308 W KR2023009308 W KR 2023009308W WO 2024025184 A1 WO2024025184 A1 WO 2024025184A1
Authority
WO
WIPO (PCT)
Prior art keywords
sentence
word
speech
verb
meaning
Prior art date
Application number
PCT/KR2023/009308
Other languages
English (en)
French (fr)
Inventor
최선종
Original Assignee
최선종
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020220168379A external-priority patent/KR20240014999A/ko
Application filed by 최선종 filed Critical 최선종
Publication of WO2024025184A1 publication Critical patent/WO2024025184A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/06Foreign languages

Definitions

  • the present invention relates to a system for providing English learning services by sentence form of verb and part of speech of word. More specifically, it relates to a system for providing English learning services by sentence form of verb and part of speech of word. This relates to a system for providing English interpretations for each part of speech and the media that records them.
  • Parts of speech are generally classified into one category of words with similar characteristics.
  • POS Parts Of Speech
  • WC Wood Classes
  • Representative parts of speech in English are classified into eight parts of speech, which include nouns, pronouns, verbs, adjectives, adverbs, prepositions, conjunctions, and interjections.
  • sentence elements which are classified as elements that make up a sentence, are a classification of elements necessary for language to form a single sentence unit, and can be considered a general category of school grammar to be classified into subject, verb, object, complement, and modifier.
  • Korean Registered Utility Model No. 20-0488695 (announced on March 7, 2019) and Korean Registered Patent No. 10 -No. 2345818 (announced on December 31, 2021) provides a structure that provides English words and parts of speech on English word cards, provides a mind map by providing words of the targeted parts of speech from the text, and sets the target part of speech in the sentence.
  • a configuration that searches for a target word corresponding to a target part of speech, analyzes the frequency and connectivity of the target word, and provides the information is disclosed.
  • verbs are divided into be verbs and general verbs.
  • the be verb is limited to cases where it is used in the meaning of 'is, is', and the sentence form that be verb is created by combining with other verbs, that is, 'be verb infinitive + ing'. I, 'be going to + infinitive verb', etc. are treated as idioms for general verbs.
  • This learning method is a simple rote learning method, and in order to increase comprehension, it is necessary to provide interpretation of each sentence form of the verb, but the current system does not do this, so it is true that the learning effect is low.
  • the present invention to solve this problem is to determine the part of speech in a sentence containing an English word when providing an English word, and provide the meaning that varies depending on the part of speech along with the part of speech, thereby ensuring that even the same word varies depending on the part of speech or sentence components.
  • By providing collocations so that learners can learn the characteristics of delexical verbs, which have an arbitrary use whose meaning is conveyed by the word that is combined with it rather than by the meaning of the verb itself, it provides collocations rather than the meaning of the word.
  • the purpose is to provide an English interpretation system for each verb sentence type and word part of speech that allows learning words in relation to the parts of speech, and a medium for recording them.
  • the present invention provides an interpretation section for each sentence type of the verb when providing an English word, and when providing an English word containing a verb, an interpretation section that varies depending on the sentence type of the verb can be provided for each sentence type of the verb and part of speech of the word. Another purpose is to provide a system for providing English interpretations and media recording them.
  • an embodiment of the present invention when outputting at least one word, outputs it together with a sentence containing the word, and according to the part of speech previously mapped and stored to the word in the sentence.
  • a user terminal that outputs the meaning of the changing word, a database unit that maps and stores at least one word and a sentence containing at least one word, a part-of-speech sentence form tagging unit that tags the part of speech that is a component in the sentence of at least one word, and a user It includes a learning service providing server that includes a display unit that displays at least one word together with a sentence in the terminal, and a component meaning provision unit that outputs a meaning that varies depending on the part of speech when outputting at least one meaning of at least one word in the user terminal. do.
  • the user terminal when the user terminal outputs at least one verb, it outputs it together with the sentence containing the verb, outputs the meaning of the word in alphabetical order depending on the sentence pattern already mapped and stored to the verb in the sentence, and the learning service providing server
  • This can be achieved by mapping and storing at least one verb and a sentence pattern containing at least one verb, and configuring the user terminal to output a meaning that varies depending on the sentence shape when outputting at least one meaning of at least one verb. .
  • the part of speech in a sentence containing the English word is identified, and the meaning that varies depending on the part of speech is provided along with the part of speech, so that even if the same word is used, the part of speech or sentence component Collocations are provided so that learners can learn the characteristics of delexical verbs, which have arbitrary uses whose meaning is conveyed by the word combined with them rather than by the meaning of the verb itself. By doing so, you can learn words in relation to their parts of speech rather than their meaning.
  • the present invention deals with the entire sentence form that one verb can bring. Therefore, there is an effect of learning verbs in relation to sentence patterns rather than the meaning of the verb.
  • Figure 1 is a diagram illustrating a system for providing English interpretation by sentence form of a verb and part of speech of a word according to an embodiment of the present invention.
  • FIG. 2 is a block diagram illustrating a learning service providing server included in the system of FIG. 1.
  • Figure 3 is a diagram for explaining an embodiment in which a system for providing English interpretations for each sentence form of a verb and each part of speech of a word is implemented.
  • Figure 4 is a diagram illustrating an example in which a part-of-speech-based English learning service is implemented according to an embodiment of the present invention.
  • Figure 5 is a diagram illustrating an example in which a sentence pattern-based English learning service is implemented according to an embodiment of the present invention.
  • Figure 6 is a flowchart illustrating a method of providing English interpretation by sentence form of a verb and part of speech of a word according to an embodiment of the present invention.
  • an embodiment of the present invention when outputting at least one word, outputs it together with a sentence containing the word, and stores the text previously mapped to the word in the sentence.
  • a user terminal that outputs the meanings of words that vary depending on the part of speech in alphabetical order; and a database unit that maps and stores at least one word and a sentence containing the at least one word, a part-of-speech tagging unit that tags the part of speech in the sentence of the at least one word, and a part-of-speech form tagging unit that tags the at least one word in the sentence.
  • It includes a learning service providing server that includes a display unit that displays together with the sentence, and a component meaning provision unit that outputs a meaning that varies depending on the part of speech when the user terminal outputs the at least one meaning of the at least one word. .
  • 'part' includes a unit realized by hardware, a unit realized by software, and a unit realized using both. Additionally, one unit may be realized using two or more pieces of hardware, and two or more units may be realized using one piece of hardware.
  • ' ⁇ part' is not limited to software or hardware, and ' ⁇ part' may be configured to reside in an addressable storage medium or may be configured to reproduce one or more processors. Therefore, as an example, ' ⁇ part' refers to components such as software components, object-oriented software components, class components, and task components, processes, functions, properties, and procedures. , subroutines, segments of program code, drivers, firmware, microcode, circuits, data, databases, data structures, tables, arrays, and variables.
  • components and 'parts' may be combined into a smaller number of components and 'parts' or may be further separated into additional components and 'parts'. Additionally, components and 'parts' may be implemented to regenerate one or more CPUs within a device or a secure multimedia card.
  • some of the operations or functions described as being performed by a terminal, apparatus, or device may instead be performed on a server connected to the terminal, apparatus, or device.
  • some of the operations or functions described as being performed by the server may also be performed in a terminal, apparatus, or device connected to the server.
  • mapping or matching with the terminal mean mapping or matching the terminal's unique number or personal identification information, which is identifying data of the terminal. It can be interpreted as
  • Figure 1 is a diagram illustrating a system for providing English interpretation by sentence form of a verb and part of speech of a word according to an embodiment of the present invention.
  • the system 1 for providing English interpretations for each sentence form of a verb and each part of speech for a word includes at least one user terminal 100, a learning service providing server 300, and at least one publishing terminal 400. may include.
  • the part-of-speech-based English learning service providing system 1 of FIG. 1 is only an embodiment of the present invention, the present invention is not limitedly interpreted through FIG. 1.
  • each component of FIG. 1 is generally connected through a network (Network, 200).
  • Network Network, 200
  • at least one user terminal 100 may be connected to the learning service providing server 300 through the network 200.
  • the learning service providing server 300 may be connected to at least one user terminal 100 and at least one publishing terminal 400 through the network 200.
  • at least one publishing terminal 400 may be connected to the learning service providing server 300 through the network 200.
  • the network refers to a connection structure that allows information exchange between each node, such as a plurality of terminals and servers.
  • Examples of such networks include a local area network (LAN) and a wide area network (WAN). Wide Area Network, Internet (WWW: World Wide Web), wired and wireless data communication network, telephone network, wired and wireless television communication network, etc.
  • Examples of wireless data communication networks include 3G, 4G, 5G, 3rd Generation Partnership Project (3GPP), 5th Generation Partnership Project (5GPP), Long Term Evolution (LTE), World Interoperability for Microwave Access (WIMAX), and Wi-Fi.
  • NFC Near-Field Communication (Near-Field Communication) network, satellite broadcasting network, analog broadcasting network, and DMB (Digital Multimedia Broadcasting) network.
  • the term at least one is defined as a term including singular and plural, and even if the term at least one does not exist, each component may exist in singular or plural, and may mean singular or plural. This should be self-explanatory. In addition, whether each component is provided in singular or plural form may be changed depending on the embodiment.
  • At least one user terminal 100 may be a learner's user terminal that outputs the part of speech and meaning in a sentence when outputting a word using a part-of-speech-based English learning service-related web page, app page, program, or application. .
  • the user terminal 100 may be a learner's user terminal that outputs the sentence form and meaning within the sentence when outputting a verb using a web page, app page, program, or application related to a sentence form-based English learning service.
  • At least one user terminal 100 may be implemented as a computer capable of accessing a remote server or terminal through a network.
  • the computer may include, for example, a laptop equipped with a navigation system and a web browser, a desktop, a laptop, etc.
  • at least one user terminal 100 may be implemented as a terminal capable of accessing a remote server or terminal through a network.
  • At least one user terminal 100 is, for example, a wireless communication device that guarantees portability and mobility, and includes navigation, personal communication system (PCS), global system for mobile communications (GSM), personal digital cellular (PDC), PHS (Personal Handyphone System), PDA (Personal Digital Assistant), IMT (International Mobile Telecommunication)-2000, CDMA (Code Division Multiple Access)-2000, W-CDMA (W-Code Division Multiple Access), Wibro (Wireless Broadband Internet) ) It may include all types of handheld-based wireless communication devices such as terminals, smartphones, smartpads, and tablet PCs.
  • PCS personal communication system
  • GSM global system for mobile communications
  • PDC personal digital cellular
  • PHS Personal Handyphone System
  • PDA Personal Digital Assistant
  • IMT International Mobile Telecommunication
  • CDMA Code Division Multiple Access
  • W-CDMA Wide-Code Division Multiple Access
  • Wibro Wireless Broadband Internet
  • the learning service providing server 300 may be a server that provides a part-of-speech-based English learning service web page, app page, program, or application.
  • the learning service providing server 300 may be a server that provides a sentence-based English learning service web page, a sentence-based English learning service web page, an app page, a program, or an application.
  • the learning service providing server 300 separates the parts of speech within a sentence of at least one word and tags and stores the meaning and part of speech of the word, or distinguishes the sentence form within a sentence of at least one verb to determine the meaning and sentence shape of the verb. It may be a server that stores tags, etc.
  • the learning service providing server 300 may be a server that outputs the part of speech and the corresponding meaning in the sentence when outputting a word from the user terminal 100, or the sentence form and the corresponding meaning in the sentence when outputting the verb. there is.
  • the learning service providing server 300 may be a server that requests the publishing terminal 400 to publish English learning materials printed with words, parts of speech, verbs, sentence patterns, sentences, meanings, etc.
  • the learning service providing server 300 may be implemented as a computer that can connect to a remote server or terminal through a network.
  • the computer may include, for example, a laptop equipped with a navigation system and a web browser, a desktop, a laptop, etc.
  • At least one publishing terminal 400 receives a publication request from the learning service providing server 300 using a web page related to a part-of-speech-based English learning service, a web page related to a sentence-based English learning service, an app page, a program, or an application, and publishes it. It may be a terminal of a publisher that does .
  • At least one publishing terminal 400 may be implemented as a computer capable of accessing a remote server or terminal through a network.
  • the computer may include, for example, a laptop equipped with a navigation system and a web browser, a desktop, a laptop, etc.
  • at least one publishing terminal 400 may be implemented as a terminal capable of accessing a remote server or terminal through a network.
  • At least one publishing terminal 400 is, for example, a wireless communication device that ensures portability and mobility, and includes navigation, personal communication system (PCS), global system for mobile communications (GSM), personal digital cellular (PDC), PHS (Personal Handyphone System), PDA (Personal Digital Assistant), IMT (International Mobile Telecommunication)-2000, CDMA (Code Division Multiple Access)-2000, W-CDMA (W-Code Division Multiple Access), Wibro (Wireless Broadband Internet) ) It may include all types of handheld-based wireless communication devices such as terminals, smartphones, smartpads, and tablet PCs.
  • PCS personal communication system
  • GSM global system for mobile communications
  • PDC personal digital cellular
  • PHS Personal Handyphone System
  • PDA Personal Digital Assistant
  • IMT International Mobile Telecommunication
  • CDMA Code Division Multiple Access
  • W-CDMA Wide-Code Division Multiple Access
  • Wibro Wireless Broadband Internet
  • FIG. 2 is a block diagram for explaining the learning service providing server included in the system of FIG. 1
  • FIG. 3 is a block diagram for explaining an embodiment of an English interpretation providing system for each sentence form of a verb and part of speech of a word.
  • the drawings and FIG. 4 are diagrams for explaining an embodiment in which a part-of-speech-based English learning service is implemented according to an embodiment of the present invention.
  • the learning service providing server 300 includes a database unit 310, a part-of-speech tagging unit 320, a display unit 330, a component meaning provision unit 340, an example problem study unit 350, and a real-life It may include a utilization unit 360, a collocation learning unit 370, and a clustering unit 380.
  • the learning service providing server 300 or another server (not shown) operating in conjunction with an embodiment of the present invention provides a part-of-speech-based English learning service to at least one user terminal 100 and at least one publishing terminal 400.
  • at least one user terminal 100 and at least one publishing terminal 400 transmit a part-of-speech-based English learning service application, program, app page, web page, etc. You can install or open it.
  • the learning service providing server 300 or another server (not shown) operating in conjunction with at least one user terminal 100 and at least one publishing terminal 400 provides a sentence-based English learning service application, program, or app page.
  • at least one user terminal 100 and at least one publishing terminal 400 may install or open a sentence pattern-based English learning service application, program, app page, web page, etc.
  • a service program may be run on at least one user terminal 100 and at least one publishing terminal 400 using a script executed in a web browser.
  • a web browser is a program that allows the use of web (WWW: World Wide Web) services and refers to a program that receives and displays hypertext written in HTML (Hyper Text Mark-up Language), for example, Netscape. , Explorer, Chrome, etc.
  • an application refers to an application on a terminal and includes, for example, an app running on a mobile terminal (smartphone).
  • the database unit 310 can map and store at least one word and a sentence containing at least one word.
  • meaningful Semantic Vector Representation is very important in the development and use of neural network-based natural language understanding.
  • sentences and semantic frames have different expression systems, a vector space learning method that uses the correlation between the two expressions exists. Learning the grammatical structure of a sentence in vector form is as important as creating a meaning vector, because word order and sentence structure play an important role in determining the meaning of a sentence, just as it changes between a declarative sentence and an interrogative sentence depending on the placement of the verb.
  • an embodiment of the present invention can extend the concept of interconnectedness to sentence structure.
  • a method of learning grammar structure vector learning (Syntax Vector Representation) can be used based on the interconnection between sentences and grammar structures.
  • the database unit 310 may map and store at least one verb and sentences containing at least one verb.
  • meaningful Semantic Vector Representation is very important in the development and use of neural network-based natural language understanding. Although sentences and semantic frames have different expression systems, a vector space learning method that uses the correlation between the two expressions exists.
  • the relationship between the surface form of a sentence and the grammatical structure of the sentence is modeled.
  • the vector projection of the sentence is based on the basic concept described above, and the grammatical structure can be modeled for dependency parsing.
  • the correlation between sentences and the structural characteristics of each sentence can be defined and learned through distances in vector space.
  • a text reader can be implemented using BERT (Bidirectional Encoder Representations from Transformers) based on a pre-trained language model.
  • BERT Bidirectional Encoder Representations from Transformers
  • the input of the syntax reader is treated as a set of tags resulting from dependent parsing within the sentence.
  • dependent syntax analysis is performed on an English sentence, a dependent syntax tree appears, and the relationship between each word in the generated tree can be expressed in the form of a Label dependent phrase sentence.
  • Grammar structure reading devices can also be implemented using the pre-trained language model BERT. It is processed into a sentence in the form of Syntax Sentence and then entered as input to BERT. The input sentence is processed through the BERT tokenizer and pre-trained language model, and the final output value is expressed as the syntax vector Vy.
  • the grammar structure writing device regenerates the dependent parsing result from the sentence vector Vt generated from the sentence reading device.
  • a network is constructed to generate dependent syntactic sentence structures from vectors, and this can be implemented with RNN (Recurrent Neural Networks). Parts of speech, etc. labeled in this way can be connected as [text-part-of-speech tag].
  • the part-of-speech sentence form tagging unit 320 may tag the part of speech that is a component within a sentence of at least one word.
  • part-of-speech sentence form tagging unit 320 may tag the sentence form of at least one verb within a sentence.
  • the part-of-speech form tagging unit 320 can tag the part-of-speech of a word in a sentence or tag the sentence form of a verb in a sentence using a Part-Of-Speech (POS) tagger based on NLP (Natural Language Processing).
  • POS Part-Of-Speech
  • Partial parsing which analyzes part of a sentence instead of full parsing, is used for more efficient syntactic analysis and accurate syntactic structure selection than rule classification.
  • a shallow parsing (light parsing) method is also used, which simply searches for constituent elements and does not identify the internal structure. It is also used to analyze the syntax of dependency relationships, allowing the structure of sentences to be identified. Due to the inefficiency of full parsing, a method of generating a full parsing result using partial parsing results is widely used.
  • methods using partial analysis are used. These methods consist of two steps: partial analysis and synthesis of partial analysis results.
  • one embodiment of the present invention may use a three-step parsing method in which partial analysis is performed in two steps and then an additional step for result synthesis is performed.
  • the input sentence is divided into multiple sentence segments based on commas, and each segment is analyzed independently.
  • the syntactic structure of each division is analyzed through a two-stage analysis process.
  • the primary structure of each division is created through the first-stage analysis, and the second-stage syntactic analysis is performed on these primary structures.
  • the structure of the input sentence can be created through the third analysis process, which generates the syntactic structure of the input sentence by combining the syntactic structure of each segment separated by commas.
  • long sentences include commas, and in one embodiment of the present invention, sentence division can be performed using commas.
  • Commas are used for the purpose of separation or listing, and in one embodiment of the present invention, sentences containing only commas used for separation can be targeted.
  • Even if the segment is separated by a comma if it contains many words, the complexity of parsing increases and many structures are created, making it difficult to select the correct structure and slowing down the parsing speed.
  • a two-step analysis is performed on each segment, and a different set of rules can be applied to each segment to reduce the number of structures generated during the parsing process and improve speed.
  • syntactic rules including commas must be applied. Since the components connected by commas are very diverse, all syntactic rules expressing this structure must be applied. Not only is it very difficult to describe, but if these rules are included in the syntax rule set, the number of rules will increase significantly, greatly increasing the complexity of syntax analysis.
  • sentences consisting of commas can be parsed through sentence division by commas, and then cases in which sentences can be created by combining commas can be collected and regularized, and three steps Only these rules are used in parsing. Therefore, in the three-step syntactic analysis, the rules used in the previous two steps are not used, and only the rules for how the syntactic structure results of division and commas are combined to form sentence structures are used, reducing the complexity of analysis and reducing the complexity of commas. It is possible to include various forms that can be combined by syntax rules.
  • the first stage of syntactic analysis is the process of finding a higher-order component, a phrase, using word and part-of-speech information from sentence segmentation. Therefore, from existing syntax rules, syntax rules containing specific words and part-of-speech information (POS) are extracted. In other words, syntactic rules containing specific words or verbs are extracted from POS Symbols or Phrase Symbols on the right side (RHS) of syntactic rules written in context-free format. If a specific word is described in the condition field of a syntax rule, the rule can be judged as a rule dependent on the word.
  • POS part-of-speech information
  • the second stage of syntactic analysis combines the components of the phrase found in the first stage of analysis to create a structure for a higher-level phrase or clause.
  • the RHS consists of rules that do not contain a comma.
  • RuleClass2 the two-step syntax rules
  • the third stage of syntactic analysis is the process of generating a single sentence structure by combining the syntactic analysis results of sentence segmentation.
  • a three-level syntax rule can be constructed from rules collected through sentence analysis and rules containing commas from existing rules (AllRules).
  • the display unit 330 may display at least one word along with a sentence on the user terminal 100.
  • the component meaning providing unit 340 When outputting at least one meaning of at least one word in the user terminal 100, the component meaning providing unit 340 outputs a meaning that varies depending on the part of speech or outputs at least one meaning of at least one verb. It can be output with different meanings depending on the sentence type.
  • the user terminal 100 When outputting at least one word, the user terminal 100 outputs the sentence together with the word, and outputs the meaning of the word that varies depending on the part of speech previously mapped and stored to the word in the sentence.
  • the user terminal 100 may output the sentence together with the verb, and output the meaning of the word that varies depending on the sentence pattern previously mapped and stored to the verb in the sentence.
  • the example problem study 350 outputs at least one word from the user terminal 100, the meaning that varies depending on at least one part of speech in the sentence containing the at least one word is displayed in different sentences and output, or at least When outputting one verb, the meaning that varies depending on at least one sentence form in a sentence containing at least one verb can be displayed and output in different sentences.
  • the real life utilization unit 360 is configured to display at least one word in a sentence containing at least one word.
  • the analyzed parts of speech and meaning can be overlaid on words in the web page. For example, after a user learns A word and B sentence, if there is a word written with C part of speech and D meaning in B sentence of word A in the New York Times, it can be marked to show how the learned word is used. .
  • the real life utilization unit 360 when a web page containing at least one verb learned in the user terminal 100 is output from the user terminal 100, at least one verb in the sentence containing at least one verb is displayed. After analyzing the sentence form of the verb, the analyzed sentence form and meaning can be overlaid on the verb within the web page. For example, after a user learns A verb and B sentence, if there is a word with C sentence form and D meaning in B sentence of A verb in the New York Times, it can be marked to show how the learned verb is used. .
  • the collocation learning unit 370 analyzes the part of speech and components of the word after the verb in a sentence containing the verb, and then determines the meaning of the collocation if it is a collocation where the meaning of the verb changes. can be output.
  • collocation refers to a phenomenon in which at least two or more words form pairs and appear repeatedly and regularly in the form of chunks.
  • one factor that is important to consider is frequency, and frequency is the main criterion used to select vocabulary in the current Korean English curriculum.
  • delexical verbs are verbs that are used very frequently with other vocabularies, but whose meaning is determined by the words that follow them rather than the meaning of the verb itself, such as Do, Have, These include Make, Get, Take, Keep, etc.
  • These verbs are the types of collocations that learners have the most difficulty with and need to be given more focus for effective English learning. Accordingly, in one embodiment of the present invention, test texts from each test are collected, corpus analysis is performed, and the types and frequencies of collocations are analyzed to create a vocabulary book.
  • a lexical verb refers to a verb that is used with a noun as an object to indicate performing an action, and in this case, the verb rarely has its own meaning. For example, in the sentence He had a shower, had does not have its own meaning as a verb. Most of the meaning of this sentence is contained in the noun shower. And if you look at the example of Make a mistake, you can see that the verb make has the characteristics of a delexical verb that emphasizes the meaning of mistake, a noun with which it is collocated, rather than its own meaning. Therefore, a de-lexical verb refers to an arbitrary use in which the meaning is conveyed by the word that is combined after it rather than the meaning of the verb itself. Examples of de-lexical verbs include Do, Have, Make, Get, Take, Keep, Bring, Put, etc. there is.
  • Corpus refers to a collection of written language actually used by language users as well as spoken language converted into text that can be analyzed by a computer. Therefore, corpus analysis performed by converting actual linguistic data into text provides the advantage of analyzing information on various lexical items.
  • corpus analysis performed by converting actual linguistic data into text provides the advantage of analyzing information on various lexical items.
  • lexical verbs such as Get, Make, and Take
  • the various meanings and uses of these verbs are not systematically presented by grade.
  • the College Scholastic Ability Test has a high washback effect on Korean English education, we analyzed the corpus of the listening and reading passages used, and then analyzed the types and frequencies of delexical verb collocations that appeared in these texts. After analysis, you can create a vocabulary list.
  • Corpus-based collocational analysis can be performed on English passages from the foreign language section of the College Scholastic Ability Test.
  • various other methods such as TOEFL corpus, LSAT corpus, and TOEIC corpus can be constructed, but in one embodiment of the present invention, the description is based on the CSAT (College Scholastic Ability Test) corpus. Collect the CSAT corpus, count the total number of tokens, and extract the total number of types used.
  • AntConc provides vocabulary list creation and keyword calculation functions. It can recognize characters from almost any language through Unicode, and allows for very complex searches using regular expressions. Accordingly, the WordList function and the Concordance function can be used, and the former automatically calculates the vocabulary list, vocabulary frequency, ranking by frequency, and the number of tokens and types for the entire corpus. In the latter case, when you directly enter the word, it is a function that sorts and displays the context in which the word is used. Through this, you can analyze vocabulary that is combined left and right based on the core word, for example, Make. Additionally, if you click on the key word aligned in the center, the entire sentence including the key word you clicked is displayed, and you can understand its meaning through sentence analysis.
  • the collocation type of the verb can be analyzed by referring to the verb-related type among the lexical collocation types.
  • the meaning branch in which the verb Make is used is to perform, to do, to cause, to change the state, to produce, to create, to become, and to succeed, then create a word list in this order.
  • Example sentences can be provided. Additionally, the collocation type can also be presented.
  • the ratio was high in the order of Get+Noun, Noun+Get, Phrasal Verb+Noun, and Get+Adverb, and the meaning branches in which Get was used were change, cause, go, and come. If the order is high frequency, such as arrive, get, receive, catch, etc., you can place the example sentences and meanings in the vocabulary list in the order of high frequency meaning branches and collocation types. For example, in the case of nouns combined with Get, if 95% of the cases are used to mean obtain, receive, or catch, these can be arranged first so that users can learn the most frequently occurring ones first. .
  • the clustering unit 380 may display the words or phrases containing the at least one word in a set.
  • FIGS. 3 and 5 the operation process according to the configuration of the learning service providing server of FIG. 2 described above will be described in detail using FIGS. 3 and 5 as an example.
  • the embodiment is only one of various embodiments of the present invention and is not limited thereto.
  • the learning service providing server 300 may conduct learning so that the parts of speech of input words are automatically tagged based on NLP (natural language processing) and POS (part of speech).
  • the learning service providing server 300 may be a server that automatically outputs parts of speech and their meaning when words and sentences containing words are input without hiring a labeler, as in (c). After a user is registered, when the user's grade, type of test, etc. are entered, corresponding words and sentences are provided, but as in (d), meanings that vary depending on the part of speech and role in the sentence are provided.
  • the learning service providing server 300 provides the meaning of 'like' when 'like' is a verb, as shown in (a) of FIG.
  • the learning service providing server 300 enables learning of words that are the same word but vary depending on the part of speech, such as when as is used as a conjunction and when as is used as a preposition, and as in (b), delexical verbs, that is, verbs. Collocations whose meanings are determined by the words that follow them are also provided with sentences, (c) collocations can be learned, and (d) for this purpose, a system is built to analyze corpus-based sentences or vocabulary.
  • the learning service providing server 300 uses NLP (Natural Language Processing) and SP (Sentence pattern) Based on (sentence form), learning can be carried out so that the sentence form of the verb entered is automatically tagged.
  • the learning service providing server 300 may be a server that automatically outputs the sentence pattern and its meaning when a verb and a sentence containing the verb are input without hiring a labeler, as shown in (c). After a user is registered, when the user's grade, type of test, etc. are entered, corresponding words and sentences are provided, but as in (d), verbs and sentence patterns are provided with meanings that vary depending on the role in the sentence. .
  • the learning service providing server 300 when an adverb or prepositional phrase is added to get as shown in (a) of FIG. 5 (I will get to the bus stop), the sentence form means to arrive in form 1. Also, when an adjective is added to get (I got sick after sick), it means to become an adjective in the 2nd form, and when a noun is added to get (I got an idea), it means to get a noun in the 3rd form. This happens.
  • the learning service providing server 300 when a noun is added to make (I make an error) means to make a noun in 3 format, and when "noun + noun” is added to make (I make an error) In the 4th form (will make him a desk), it means to make a noun into a noun, and when "noun + adjective” is added to make (I will make her happy), in the 5th form it means to make a noun into an adjective. , and when "noun + noun” is added to make (I will make him a doctor), it means to make a noun into a noun in the 5th form.
  • Figure 6 is a flowchart illustrating a method of providing English interpretations by sentence form of a verb and by part of speech of a word according to an embodiment of the present invention.
  • the learning service providing server provides at least one word and at least one Sentences containing words are mapped and stored, and at least one verb and sentences containing at least one verb are mapped and stored (S110).
  • the learning service providing server tags the part of speech, which is a component within the sentence, or tags the sentence form of the sentence (S120).
  • the learning service providing server displays at least one word together with a sentence or at least one verb together with a sentence on the user terminal (S130).
  • the user terminal When the user terminal outputs at least one meaning of at least one word, it outputs a meaning that varies depending on the part of speech, and when outputting at least one verb and at least one meaning, it also outputs a meaning that varies depending on the sentence pattern (S140).
  • a method of providing an English learning service by sentence form of a verb and by part of speech of a word is a method of providing an English learning service by using a recording medium containing instructions executable by a computer, such as an application or program module executed by a computer. It can also be implemented in form.
  • Computer-readable media can be any available media that can be accessed by a computer and includes both volatile and non-volatile media, removable and non-removable media. Additionally, computer-readable media may include all computer storage media. Computer storage media includes both volatile and non-volatile, removable and non-removable media implemented in any method or technology for storage of information such as computer-readable instructions, data structures, program modules or other data.
  • the sentence form of verb or part of speech of word displayed on the terminal is printed in alphabetical order and distributed in a book or dictionary. It can be implemented.
  • the method of providing an English learning service based on the sentence form of a verb or the part of speech of a word includes an application installed by default on a terminal (this may include a program included in a platform or operating system that is installed by default on the terminal, etc.) It may be executed by an application (i.e., a program) that the user installs directly on the master terminal through an application providing server such as an application store server, an application, or a web server related to the service.
  • an application i.e., a program
  • the method of providing a part-of-speech-based English learning service is implemented as an application (i.e., a program) installed by default in the terminal or directly installed by the user and can be read by a computer such as the terminal. It can be recorded on any recording medium.
  • an application i.e., a program

Abstract

동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템 및 그것을 기록한 매체가 개시된다. 본 발명은 적어도 하나의 단어를 출력할 때, 단어가 포함된 문장과 함께 출력하고, 문장 내 단어에 기 매핑되어 저장된 품사에 따라 달라지는 단어의 뜻을 출력하는 사용자 단말 및 적어도 하나의 단어 및 적어도 하나의 단어가 포함된 문장을 매핑하여 저장하는 데이터베이스화부, 적어도 하나의 단어의 문장 내 성분인 품사를 태깅하는 품사문형태깅부, 사용자 단말에서 적어도 하나의 단어를 문장과 함께 표시하는 표시부, 사용자 단말에서 적어도 하나의 단어의 적어도 하나의 의미를 출력할 때 품사에 따라 달라지는 의미로 출력하는 성분의미제공부를 포함하는 학습 서비스 제공 서버를 포함한다.

Description

동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템 및 그것을 기록한 매체
본 발명은 동사의 문형별 및 단어의 품사별 영어 학습 서비스 제공 시스템에 관한 것으로, 보다 상세하게는 동사의 문형에 따라 또는 단어의 품사에 따라 달라지는 의미를 제공할 수 있는 동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템 및 그것을 기록한 매체에 관한 것이다.
품사란 일반적으로 유사한 특성을 지니고 있는 낱말들을 하나의 범주로 묶어서 분류해 놓은 것으로, 전통문법 범주에서는 POS(Parts Of Speech)라는 용어를 사용하고, 현대 영문법에서는 WC(Word Classes)라는 용어를 사용하기도 한다. 영어의 대표적인 품사를 8 품사로 분류하는데, 명사, 대명사, 동사, 형용사, 부사, 전치사, 접속사, 감탄사가 이에 해당한다. 반면 문장을 구성하는 요소로 분류되는 문장요소는 언어가 하나의 문장단위를 이루기 위해서 필요한 요소들 분류한 것으로 주어, 동사, 목적어, 보어, 수식어로 분류하는 것이 일반적인 학교문법의 범주라고 볼 수 있다. 이때, 영어의 단어를 암기할 때에는 이러한 품사나 문장구성요소를 전혀 고려하지 않고 의미만을 외우기도 하는데, 하나의 단어가 문장 내 어떠한 품사인지 또 문장 내에서 어떠한 구성요소로 역할을 하는지에 따라 뜻이 달라지기 때문에 의미만 외운 경우 해석이 되지 않거나 의미 자체를 이해하지 못하는 결과로 이어진다.
이때, 영단어를 제공할 때 품사와 연계하여 제공하는 방법이 연구 및 개발되었는데, 이와 관련하여, 선행기술인 한국등록실용신안 제20-0488695호(2019년03월07일 공고) 및 한국등록특허 제10-2345818호(2021년12월31일 공고)에는, 영단어 카드에 영단어 및 품사를 표기하여 제공하는 구성과, 텍스트로부터 타겟팅된 품사의 단어를 제공하여 마인드 맵을 제공하고, 문장 내 타겟 품사를 설정하며, 타겟 품사에 대응하는 타겟 단어를 검색하고, 타겟 단어의 빈도 및 연결성을 분석하여 제공하는 구성이 각각 개시되어 있다.
다만, 전자의 경우 영단어 하나에 품사를 표기하지만, 각 단어는 문장 내에서 사용되는 쓰임에 따라 의미가 달라지기 때문에, 하나의 품사에 따른 하나의 의미만 학습한다면, 동일한 단어에 품사가 달라지는 경우 해석이 전혀 되지 않는다. 후자의 경우에도 타겟 품사에 따른 단어를 제공한다고 하지만, 하나의 단어가 복수의 품사로 사용됨으로써 달라지는 의미를 제공하는 구성이 전혀 아니다. 이에, 영단어를 암기할 때 단순 서로 다른 의미만을 제공하여 암기하도록 하는 구성이 아닌, 문장 내 단어의 품사가 달라짐에 따라 달라지는 의미를 함께 제공할 수 있는 시스템의 연구 및 개발이 요구된다.
한편, 최근에는 동사를 중심으로 한 영작회화 학습프로그램이 나와 있다. 내용을 살펴보면 동사를 be동사와 일반 동사로 구분하고 있는데 be동사는 '이다, 있다'는 의미로 사용되는 경우로 한정하고 be동사가 다른 동사와 어울려 만들어내는 문형 즉, 'be 동사원형+ing' 나 'be going to + 원형동사'등은 일반 동사의 숙어(idiom)로 취급하고 있다.
이러한 학습방법은 단순 암기형 학습법으로 이해력을 높이기 위해서는 동사의 문형별 해석을 제공하여야 하는 데 현제 시스템은 그러지 못하기 때문에 학습효과가 떨어지는 것이 사실이다.
이러한 과제를 해결하기 위한 본 발명은 영단어를 제공할 때 영단어가 포함된 문장 내 품사를 파악하고, 품사에 따라 달라지는 의미를 품사와 함께 제공하도록 함으로써, 동일한 단어라도 품사나 문장성분에 따라 서로 달라지는 것을 인지하도록 하고, 동사 자체의 뜻보다는 뒤에 결합되는 단어에 의해 뜻이 전달되는 자의적인 쓰임새를 가지는 탈어휘 동사(Delexical Verb)의 특성을 학습자가 배울 수 있도록 연어(Collocation)를 제공함으로써 단어의 의미보다는 품사와 연관하여 단어를 학습할 수 있도록 하는 동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템 및 그것을 기록한 매체를 제공하는 것을 목적으로 한다.
또한 본 발명은 영단어를 제공할 때 동사의 문형별 해석편을 제공하여 동사가 포함된 영단어를 제공할 때, 동사의 문형에 따라 달라지는 해석편을 제공할 수 있는 동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템 및 그것을 기록한 매체를 제공하는 것을 다른 목적으로 한다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 일 실시예는, 적어도 하나의 단어를 출력할 때, 단어가 포함된 문장과 함께 출력하고, 문장 내 단어에 기 매핑되어 저장된 품사에 따라 달라지는 단어의 뜻을 출력하는 사용자 단말 및 적어도 하나의 단어 및 적어도 하나의 단어가 포함된 문장을 매핑하여 저장하는 데이터베이스화부, 적어도 하나의 단어의 문장 내 성분인 품사를 태깅하는 품사문형태깅부, 사용자 단말에서 적어도 하나의 단어를 문장과 함께 표시하는 표시부, 사용자 단말에서 적어도 하나의 단어의 적어도 하나의 의미를 출력할 때 품사에 따라 달라지는 의미로 출력하는 성분의미제공부를 포함하는 학습 서비스 제공 서버를 포함한다.
또한, 사용자 단말은 적어도 하나의 동사를 출력할 때, 동사가 포함된 문장과 함께 출력하고, 문장 내 동사에 기 매핑되어 저장된 문형에 따라 달라지는 단어의 뜻을 알파벳 순서로 출력하고, 학습 서비스 제공 서버는 적어도 하나의 동사 및 적어도 하나의 동사가 포함된 문형을 매핑하여 저장하고, 사용자 단말에서 적어도 하나의 동사의 적어도 하나의 의미를 출력할 때 문형에 따라 달라지는 의미로 출력하도록 구성함으로써 달성될 수 있다.
전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 영단어를 제공할 때 영단어가 포함된 문장 내 품사를 파악하고, 품사에 따라 달라지는 의미를 품사와 함께 제공하도록 함으로써, 동일한 단어라도 품사나 문장성분에 따라 서로 달라지는 것을 인지하도록 하고, 동사 자체의 뜻보다는 뒤에 결합되는 단어에 의해 뜻이 전달되는 자의적인 쓰임새를 가지는 탈어휘 동사(Delexical Verb)의 특성을 학습자가 배울 수 있도록 연어(Collocation)를 제공함으로써 단어의 의미보다는 품사와 연관하여 단어를 학습할 수 있도록 한다.
따라서, 본 발명의 동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템에 의하면, 기존의 교재가 문장의 형식별로 구성이 되었다면 본 발명은 한 동사가 가지고 올 수 있는 문장의 형식 전체를 다루어주기 때문에 동사의 의미보다는 문형과 연관하여 동사를 학습할 수 있는 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템을 설명하기 위한 도면이다.
도 2는 도 1의 시스템에 포함된 학습 서비스 제공 서버를 설명하기 위한 블록 구성도이다.
도 3은 동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템이 구현된 일 실시예를 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따른 품사 기반 영어 학습 서비스가 구현된 일 실시예를 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따른 문형 기반 영어 학습 서비스가 구현된 일 실시예를 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따른 동사의 문형별 및 단어의 품사별 영어 해석편 제공 방법을 설명하기 위한 흐름도이다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 일 실시예는, 적어도 하나의 단어를 출력할 때, 상기 단어가 포함된 문장과 함께 출력하고, 상기 문장 내 상기 단어에 기 매핑되어 저장된 품사에 따라 달라지는 단어의 뜻을 알파벳 순서로 출력하는 사용자 단말; 및 적어도 하나의 단어 및 상기 적어도 하나의 단어가 포함된 문장을 매핑하여 저장하는 데이터베이스화부, 상기 적어도 하나의 단어의 상기 문장 내 품사를 태깅하는 품사문형태깅부, 상기 사용자 단말에서 상기 적어도 하나의 단어를 상기 문장과 함께 표시하는 표시부, 상기 사용자 단말에서 상기 적어도 하나의 단어의 상기 적어도 하나의 의미를 출력할 때 상기 품사에 따라 달라지는 의미로 출력하는 성분의미제공부를 포함하는 학습 서비스 제공 서버를 포함한다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
명세서 전체에서 사용되는 정도의 용어 "약", "실질적으로" 등은 언급된 의미에 고유한 제조 및 물질 허용오차가 제시될 때 그 수치에서 또는 그 수치에 근접한 의미로 사용되고, 본 발명의 이해를 돕기 위해 정확하거나 절대적인 수치가 언급된 개시 내용을 비양심적인 침해자가 부당하게 이용하는 것을 방지하기 위해 사용된다. 본 발명의 명세서 전체에서 사용되는 정도의 용어 "~(하는) 단계" 또는 "~의 단계"는 "~ 를 위한 단계"를 의미하지 않는다.
본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다. 한편, '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, '~부'는 어드레싱 할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체 지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로 더 분리될 수 있다. 뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU들을 재생시키도록 구현될 수도 있다.
본 명세서에 있어서 단말, 장치 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말, 장치 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말, 장치 또는 디바이스에서 수행될 수도 있다.
본 명세서에서 있어서, 단말과 매핑(Mapping) 또는 매칭(Matching)으로 기술된 동작이나 기능 중 일부는, 단말의 식별 정보(Identifying Data)인 단말기의 고유번호나 개인의 식별정보를 매핑 또는 매칭한다는 의미로 해석될 수 있다.
이하 첨부된 도면을 참고하여 본 발명을 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템을 설명하기 위한 도면이다. 도 1을 참조하면, 동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템(1)은, 적어도 하나의 사용자 단말(100), 학습 서비스 제공 서버(300), 적어도 하나의 출판 단말(400)을 포함할 수 있다. 다만, 이러한 도 1의 품사 기반 영어 학습 서비스 제공 시스템(1)은, 본 발명의 일 실시예에 불과하므로, 도 1을 통하여 본 발명이 한정 해석되는 것은 아니다.
이때, 도 1의 각 구성요소들은 일반적으로 네트워크(Network, 200)를 통해 연결된다. 예를 들어, 도 1에 도시된 바와 같이, 적어도 하나의 사용자 단말(100)은 네트워크(200)를 통하여 학습 서비스 제공 서버(300)와 연결될 수 있다. 그리고, 학습 서비스 제공 서버(300)는, 네트워크(200)를 통하여 적어도 하나의 사용자 단말(100), 적어도 하나의 출판 단말(400)과 연결될 수 있다. 또한, 적어도 하나의 출판 단말(400)은, 네트워크(200)를 통하여 학습 서비스 제공 서버(300)와 연결될 수 있다.
여기서, 네트워크는, 복수의 단말 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 이러한 네트워크의 일 예에는 근거리 통신망(LAN: Local Area Network), 광역 통신망(WAN: Wide Area Network), 인터넷(WWW: World Wide Web), 유무선 데이터 통신망, 전화망, 유무선 텔레비전 통신망 등을 포함한다. 무선 데이터 통신망의 일례에는 3G, 4G, 5G, 3GPP(3rd Generation Partnership Project), 5GPP(5th Generation Partnership Project), LTE(Long Term Evolution), WIMAX(World Interoperability for Microwave Access), 와이파이(Wi-Fi), 인터넷(Internet), LAN(Local Area Network), Wireless LAN(Wireless Local Area Network), WAN(Wide Area Network), PAN(Personal Area Network), RF(Radio Frequency), 블루투스(Bluetooth) 네트워크, NFC(Near-Field Communication) 네트워크, 위성 방송 네트워크, 아날로그 방송 네트워크, DMB(Digital Multimedia Broadcasting) 네트워크 등이 포함되나 이에 한정되지는 않는다.
하기에서, 적어도 하나의 라는 용어는 단수 및 복수를 포함하는 용어로 정의되고, 적어도 하나의 라는 용어가 존재하지 않더라도 각 구성요소가 단수 또는 복수로 존재할 수 있고, 단수 또는 복수를 의미할 수 있음은 자명하다 할 것이다. 또한, 각 구성요소가 단수 또는 복수로 구비되는 것은, 실시예에 따라 변경가능하다 할 것이다.
적어도 하나의 사용자 단말(100)은, 품사 기반 영어 학습 서비스 관련 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 이용하여 단어를 출력할 때 문장 내 품사 및 의미를 함께 출력하는 학습자의 사용자의 단말일 수 있다.
또한, 사용자 단말(100)은 문형 기반 영어 학습 서비스 관련 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 이용하여 동사를 출력할 때 문장 내 문형 및 의미를 함께 출력하는 학습자의 사용자의 단말일 수 있다.
여기서, 적어도 하나의 사용자 단말(100)은, 네트워크를 통하여 원격지의 서버나 단말에 접속할 수 있는 컴퓨터로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 네비게이션, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(Desktop), 랩톱(Laptop) 등을 포함할 수 있다. 이때, 적어도 하나의 사용자 단말(100)은, 네트워크를 통해 원격지의 서버나 단말에 접속할 수 있는 단말로 구현될 수 있다. 적어도 하나의 사용자 단말(100)은, 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, 네비게이션, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말, 스마트폰(Smartphone), 스마트 패드(Smartpad), 타블렛 PC(Tablet PC) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다.
학습 서비스 제공 서버(300)는, 품사 기반 영어 학습 서비스 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 제공하는 서버일 수 있다.
또한, 학습 서비스 제공 서버(300)는, 문형 기반 영어 학습 서비스 웹 페이지, 문형 기반 영어 학습 서비스 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 제공하는 서버일 수 있다.
또한, 학습 서비스 제공 서버(300)는, 적어도 하나의 단어의 문장 내 품사를 구분하여 단어의 의미, 품사 등을 태깅하여 저장하거나, 적어도 하나의 동사의 문장 내 문형을 구분하여 동사의 의미, 문형 등을 태깅하여 저장하는 서버일 수 있다..
또한, 학습 서비스 제공 서버(300)는, 사용자 단말(100)에서 단어를 출력할 때 문장 내 품사 및 이에 따른 의미를 출력하거나 동사를 출력할 때 문장 내 문형 및 이에 따른 의미를 출력하는 서버일 수 있다.
또한, 학습 서비스 제공 서버(300)는, 출판 단말(400)로 단어, 품사, 동사, 문형, 문장, 의미 등이 함께 출력된 영어학습교재를 출판하도록 출판의뢰를 하는 서버일 수 있다.
여기서, 학습 서비스 제공 서버(300)는, 네트워크를 통하여 원격지의 서버나 단말에 접속할 수 있는 컴퓨터로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 네비게이션, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(Desktop), 랩톱(Laptop) 등을 포함할 수 있다.
적어도 하나의 출판 단말(400)은, 품사 기반 영어 학습 서비스 관련 웹 페이지, 문형 기반 영어 학습 서비스 관련 웹페이지, 앱 페이지, 프로그램 또는 애플리케이션을 이용하여 학습 서비스 제공 서버(300)의 출판의뢰를 받고 출판을 하는 출판사의 단말일 수 있다.
여기서, 적어도 하나의 출판 단말(400)은, 네트워크를 통하여 원격지의 서버나 단말에 접속할 수 있는 컴퓨터로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 네비게이션, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(Desktop), 랩톱(Laptop) 등을 포함할 수 있다. 이때, 적어도 하나의 출판 단말(400)은, 네트워크를 통해 원격지의 서버나 단말에 접속할 수 있는 단말로 구현될 수 있다. 적어도 하나의 출판 단말(400)은, 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, 네비게이션, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말, 스마트폰(Smartphone), 스마트 패드(Smartpad), 타블렛 PC(Tablet PC) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다.
도 2는 도 1의 시스템에 포함된 학습 서비스 제공 서버를 설명하기 위한 블록 구성도이고, 도 3은 동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템이 구현된 일 실시예를 설명하기 위한 도면, 그리고 도 4는 본 발명의 일 실시예에 따른 품사 기반 영어 학습 서비스가 구현된 일 실시예를 설명하기 위한 도면이다.
도 2를 참조하면, 학습 서비스 제공 서버(300)는, 데이터베이스화부(310), 품사문형태깅부(320), 표시부(330), 성분의미제공부(340), 예문제공부(350), 실생활활용부(360), 연어학습부(370) 및 군집화부(380)를 포함할 수 있다.
본 발명의 일 실시예에 따른 학습 서비스 제공 서버(300)나 연동되어 동작하는 다른 서버(미도시)가 적어도 하나의 사용자 단말(100) 및 적어도 하나의 출판 단말(400)로 품사 기반 영어 학습 서비스 애플리케이션, 프로그램, 앱 페이지, 웹 페이지 등을 전송하는 경우, 적어도 하나의 사용자 단말(100) 및 적어도 하나의 출판 단말(400)은, 품사 기반 영어 학습 서비스 애플리케이션, 프로그램, 앱 페이지, 웹 페이지 등을 설치하거나 열 수 있다.
또한, 학습 서비스 제공 서버(300)나 연동되어 동작하는 다른 서버(미도시)가 적어도 하나의 사용자 단말(100) 및 적어도 하나의 출판 단말(400)로 문형 기반 영어 학습 서비스 애플리케이션, 프로그램, 앱 페이지, 웹 페이지 등을 전송하는 경우, 적어도 하나의 사용자 단말(100) 및 적어도 하나의 출판 단말(400)은, 문형 기반 영어 학습 서비스 애플리케이션, 프로그램, 앱 페이지, 웹 페이지 등을 설치하거나 열 수 있다.
또한, 웹 브라우저에서 실행되는 스크립트를 이용하여 서비스 프로그램이 적어도 하나의 사용자 단말(100) 및 적어도 하나의 출판 단말(400)에서 구동될 수도 있다. 여기서, 웹 브라우저는 웹(WWW: World Wide Web) 서비스를 이용할 수 있게 하는 프로그램으로 HTML(Hyper Text Mark-up Language)로 서술된 하이퍼 텍스트를 받아서 보여주는 프로그램을 의미하며, 예를 들어 넷스케이프(Netscape), 익스플로러(Explorer), 크롬(Chrome) 등을 포함한다. 또한, 애플리케이션은 단말 상의 응용 프로그램(Application)을 의미하며, 예를 들어, 모바일 단말(스마트폰)에서 실행되는 앱(App)을 포함한다.
도 2를 참조하면, 데이터베이스화부(310)는, 적어도 하나의 단어 및 적어도 하나의 단어가 포함된 문장을 매핑하여 저장할 수 있다. 이때, 신경망 기반의 자연어 이해 개발 및 이용에 있어 유의미한 Semantic Vector Representation이 매우 중요한데, 문장과 의미틀은 서로 다른 표현체계를 갖지만 두 표현 사이의 관계성인 상호 연관성을 이용한 벡터공간 학습방법을 존재한다. 문장의 문법적 구조를 벡터 형태로 배워내는 것도 의미벡터를 만드는 것만큼 중요한데, 동사의 배치에 따라 평서문과 의문문으로 달라지는 것처럼 단어 순서나 문장구조는 문장의 의미를 결정하는 데 중요한 역할을 하기 때문이다. 이에 본 발명의 일 실시예는, 상호연관성의 개념을 문장구조로 확장할 수 있다. 즉, 문장 및 문법구조 간의 상호연관성에 기반하여 문법구조 벡터학습(Syntax Vector Representation)을 배우는 방법을 이용할 수 있다.
또한, 데이터베이스화부(310)는, 적어도 하나의 동사 및 적어도 하나의 동사가 포함된 문장을 매핑하여 저장할 수 있다. 이때, 신경망 기반의 자연어 이해 개발 및 이용에 있어 유의미한 Semantic Vector Representation이 매우 중요한데, 문장과 의미틀은 서로 다른 표현체계를 갖지만 두 표현 사이의 관계성인 상호 연관성을 이용한 벡터공간 학습방법을 존재한다.
이를 위하여, 첫 번째로 문장의 구조를 설명할 수 있는 표현체계인 의존 구문분석을 검토하고, 두 번째로 각 표현체계를 문장벡터와 같은 공간에서 연관성 비교를 하기 위한 투사(Projection) 방법을 설명하고, 세 번째로, 학습을 통해 문장의 구조적 특징이 유사한 개체들이 같은 공간에 배치될 수 있도록 하는 구문벡터 학습방법을 설명한다.
<기본개념>
딥러닝 기반 자연어 이해 분야에서 각종 응용을 위해 언어에 대한 의미적, 구조적 정보들에 대한 깊은 이해가 필요하다. 언어 이해 분야에 있어 표현학습(Representation Learning)은 주로 심층신경망의 입력으로 들어가는 정보를 다양한 방식으로 벡터화시키는 방향으로 연구를 진행해왔다. 문장 임베딩(Sentence Embedding) 중 문장의 구조적 특징을 파악할 수 있는 기법이 있었는데, 트리 기반의 신경망을 이용하여 문장의 의미를 해석하며 가치있는 구문분석 정보를 이용하는 방식이 존재한다. 또, 단어의 구조적 정보를 다차원 벡터로 표현하는 방법도 존재하며, RNN을 이용하여 문장 간 구문 유사도를 측정하여 문장의 구문적 의미를 추출하기도 한다. 또는 Tree-LSTM을 사용하여 문장의 구조를 표현하기도 한다.
또한, 딥러닝 기반 자연어 이해 분야에서 문장 간 의미 유사도 기술을 구현한 방법이 있는데, 의미 유사도에 기반한 의도파악을 하거나, 문장과 의미틀이 서로 다른 표현체계를 갖지만 두 표현 사이의 관계성인 상호연관성을 이용한 학습방법을 제시하여 같은 의미를 가진 문장이 서로 같은 벡터공간에 배치되는 방법을 이용하기도 한다. 또, 문장 및 의미틀 인코더를 사전학습 언어모델 BERT로 구현하여 의도파악 기술을 향상시키기도 한다. 이때, 본 발며의 일 실시예는 상술한 기본개념을 바탕으로 문장의 구조, 즉 문장구조에 대한 상호 연관성을 학습하는 방법을 이용하기로 한다.
<유사구조 벡터 학습방법>
본 발명의 일 실시예에서는 문장의 표층 형태와 문장의 문법적 구조의 연관성을 모델링한다. 여기서 문장의 벡터 프로젝션은 상술한 기본개념을 기반으로 하고, 문법적 구조는 의존 구문분석(Dependency Parsing)에 대해 모델링을 수행할 수 있다. 문장과 각 문장의 구조적 특성 사이의 상호 연관성을 벡터 공간상에서의 거리 등으로 정의하고 학습할 수 잇다.
<문장 읽기장치(Text Reader)>
문장 읽기장치(Text Reader)는 사전학습(Pre-trained) 언어모델 기반 BERT(Bidirectional Encoder Representations from Transformers)를 이용하여 구현할 수 있다. 입력된 문장 X=x1,x2...xn은 길이가 n인 단어로 BERT의 Tokenizer에 의해 분리되고, 각 토큰에 대해 임베딩 값을 계산하여 최종 출력값은 문장 벡터 Vt로 표시한다.
<문법구조 읽기장치(Syntax Reader)>
문법구조 읽기장치(Syntax Reader)의 입력은 문장 내 의존 구문분석 결과의 태그 셋으로 취급된다. 영어문장에 대해 의존 구문분석을 수행할 경우 의존 구문트리가 나오고, 생성된 트리에서 각 단어 간 관계인 Label 의존 구문 문장형태로 표현할 수 있다. 문법구조 읽기 장치 또한 사전학습 언어모델 BERT를 이용하여 구현할 수 있다. Syntax Sentence 형태의 문장으로 가공한 뒤 BERT의 입력으로 들어가게 된다. 입력된 문장은 BERT tokenizer 및 사전학습 언어모델을 통해 처리되며, 최종 출력값은 구문벡터 Vy로 표시된다.
<문법구조 쓰기 장치(Syntax Writer)>
문법구조 쓰기 장치(Syntax Writer)는 문장 읽기 장치로부터 생성된 문장 벡터 Vt로부터 의존 구문분석 결과가 다시 생성된다. 벡터로부터 의존 구문 문장구조를 생성해내기 위한 네트워크가 구성되고, 이는 RNN(Recurrent Neural Networks)으로 구현할 수 있다. 이렇게 라벨링된 품사 등은 [텍스트-품사태그]와 같이 연결될 수 있다.
품사문형태깅부(320)는, 적어도 하나의 단어의 문장 내 성분인 품사를 태깅할 수 있다.
또한, 품사문형태깅부(320)는, 적어도 하나의 동사의 문장 내 문형을 태깅할 수 있다.
품사문형태깅부(320)는, NLP(Natural Language Processing) 기반 POS(Part-Of-Speech) 태거(Tagger)를 이용하여 문장 내 단어의 품사를 태깅하거나 문장 내 동사의 문형을 태깅할 수 있다.
<3 단계 영어문장 분석 알고리즘>
규칙의 분류보다 효율적인 구문분석과 정확한 구문 구조 선정을 위해 전체 구문분석(Full Parsing) 대신 문장의 일부를 분석하는 부분 분석(Partial Parsing) 방법이 사용되고 있다. 또한 단순히 구성 성분만을 찾고 내부 구조를 파악하지 않는 얕은 파싱(Shallow Parsing, Light Parsing) 방법도 사용되고 있는데, 의존 관계 구문분석에 사용함으로써 문장의 구조를 파악할 수 있도록 하기도 한다. 전체 구문분석의 비효율성 때문에 부분 파싱 결과를 이용하여 전체 구문분석 결과를 생성하는 방법이 널리 이용되고 있다. 또, 전체 구문분석의 비효율성을 극복하기 위해 부분 분석을 이용하는 방법을 이용하기도 하는데, 이들 방법들은 부분 분석과 부분 분석 결과 합성을 위한 2 단계로 구성된다.
이에 본 발명의 일 실시예는, 부분 분석을 2 단계로 수행한 후 결과 합성을 위한 추가의 단계를 수행하는 3 단계 구문분석방법을 이용할 수 있다. 입력 문장은 쉼표를 기준으로 복수의 문장 분할(Segment)로 나뉘고, 각 분할은 독립적으로 분석된다. 각 분할은 2 단계 분석 과정을 통해 분할의 구문 구조가 분석되는데, 1 단계 분석을 통해 각 분할의 1 차 구조가 생성되고 이들 1 차 구조를 대상으로 2 단계 구문분석이 수행된다. 마지막으로 쉼표에 의해 분리된 각 분할의 구문 구조를 결합하여 입력 문장의 구문 구조를 생성하는 3 번째 분석 과정을 통해 입력 문장의 구조가 생성될 수 있다.
일반적으로 긴 문장은 쉼표를 포함하게 되며, 본 발명의 일 실시예에서는, 쉼표에 의해 문장 분할을 수행할 수 있다. 쉼표는 분리(Separation) 또는 나열(List)의 용도로 사용되는데 본 발명의 일 실시예에서는 분리 용도로 사용된 쉼표만을 포함한 문장을 대상으로 할 수 있다. 쉼표에 의해 분리된 분할이라 하더라도 많은 단어를 포함하는 경우, 구문분석의 복잡도가 높아지고 많은 구조가 생성되므로 정확한 구조 선정이 어렵고 구문분석 속도가 저하된다. 이러한 문제를 해결하기 위해 각 분할에 대해서 2 단계 분석을 수행하며, 각각 다른 규칙의 집합을 적용하여 구문분석 과정에서 생성되는 구조의 수를 줄이고 속도를 개선할 수 있다. 각 분할의 결과를 합성하여 전체 문장의 구조를 생성하는 3 단계 구문분석에서는 쉼표를 포함하는 구문 규칙을 적용해야 하는데, 쉼표가 연결하는 구성 성분은 매우 다양하기 때문에 이러한 구조를 표현하는 구문 규칙을 모두 기술하는 것은 매우 어려울 뿐만 아니라 이들 규칙들이 구문 규칙 집합에 포함되면 규칙의 수가 매우 많아져 구문분석의 복잡도를 크게 높일 수 있다.
본 발명의 일 실시예에서는 이러한 문제를 해결하기 위해 쉼표로 구성된 문장들을 쉼표에 의한 문장 분할을 통해 구문분석 한 후, 쉼표와 결합하여 문장을 만들 수 있는 경우를 수집하여 규칙화할 수 있고, 3 단계 구문분석에서는 이들 규칙만을 사용한다. 따라서 3 단계 구문분석에서는 앞의 두 단계에서 사용한 규칙은 사용하지 않으며, 분할의 구문 구조 결과들과 쉼표가 어떻게 결합하여 문장 구조를 형성하는지에 대한 규칙들만을 사용하기 때문에 분석의 복잡도를 줄이면서 쉼표에 의해 결합될 수 있는 다양한 형식을 구문 규칙으로 포함할 수 있게 된다.
첫 단계 구문분석은 문장 분할의 단어와 품사 정보를 이용하여 보다 상위 구성 성분인 구(Phrase)를 찾는 과정이다. 따라서 기존 구문 규칙 중 특정 단어(Word)와 품사 정보(Part-of-Speech: POS)가 포함된 구문 규칙을 추출한다. 즉 문맥 자유 형식으로 기술된 구문 규칙의 오른편(RHS)에 품사 기호(POS Symbol)나 구 기호(Phrase Symbol) 중에서 특정 단어나 동사를 포함하는 구문 규칙을 추출한다. 구문 규칙의 조건 영역(Condition Field)에 특정 단어가 기술되었다면 해당 규칙은 단어에 종속적인 규칙으로 판단할 수 있다.
두 번째 단계의 구문분석은 첫 단계 분석에서 찾은 구의 구성 성분을 결합하여 보다 상위의 구나 절(Clause)에 대한 구조를 생성하는 단계이다. 전체 구문 규칙(AllRules)에서 RulesClass1을 제외한 규칙들 중 RHS가 쉼표(Comma)를 포함하지 않는 규칙들로 구성된다. 2 단계 구문 규칙(RulesClass2)을 정의한 후, 두 번째 단계가 종료되면 입력 문장 각각의 문장 분할에 대한 구조 분석이 완료된다. 세 번째 단계의 구문분석은 문장 분할의 구문분석 결과들을 합성하여 하나의 문장 구조를 생성하는 과정이다. 문장 분석을 통해 수집한 규칙들과 기존 규칙(AllRules)에서 쉼표를 포함하는 규칙들로 3 단계 구문 규칙을 구성할 수 있다.
표시부(330)는, 사용자 단말(100)에서 적어도 하나의 단어를 문장과 함께 표시할 수 있다.
성분의미제공부(340)는, 사용자 단말(100)에서 적어도 하나의 단어의 적어도 하나의 의미를 출력할 때 품사에 따라 달라지는 의미로 출력하거나 또는 적어도 하나의 동사의 적어도 하나의 의미를 출력할 때 문형에 따라 달라지는 의미로 출력할 수 있다.
사용자 단말(100)은, 적어도 하나의 단어를 출력할 때, 단어가 포함된 문장과 함께 출력하고, 문장 내 단어에 기 매핑되어 저장된 품사에 따라 달라지는 단어의 뜻을 출력할 수 있다.
또한, 사용자 단말(100)은, 적어도 하나의 동사를 출력할 때, 동사가 포함된 문장과 함께 출력하고, 문장 내 동사에 기 매핑되어 저장된 문형에 따라 달라지는 단어의 뜻을 출력할 수 있다.
예문제공부(350)는, 사용자 단말(100)에서 적어도 하나의 단어를 출력할 때, 적어도 하나의 단어가 포함된 문장 내 적어도 하나의 품사에 따라 달라지는 의미를 서로 다른 문장 내 표시하여 출력하거나 적어도 하나의 동사를 출력할 때 적어도 하나의 동사가 포함된 문장 내 적어도 하나의 문형에 따라 달라지는 의미를 서로 다른 문장 내 표시하여 출력할 수 있다.
실생활활용부(360)는, 사용자 단말(100)에서 학습한 적어도 하나의 단어가 포함된 웹페이지가 사용자 단말(100)에서 출력되는 경우, 적어도 하나의 단어가 포함된 문장 내 적어도 하나의 단어의 품사를 분석한 후, 웹페이지 내 단어에 분석된 품사 및 의미를 오버레이(Overlay)할 수 있다. 예를 들어 사용자가 A 단어와 B 문장을 학습한 후, 뉴욕타임즈 내 A 단어의 B 문장 내 C 품사 및 D 의미로 쓰인 단어가 존재한다면 이에 표시를 해줌으로써 배운 단어가 어떻게 쓰이고 있는지를 보여줄 수 있다.
또한, 실생활활용부(360)는, 사용자 단말(100)에서 학습한 적어도 하나의 동사가 포함된 웹페이지가 사용자 단말(100)에서 출력되는 경우, 적어도 하나의 동사가 포함된 문장 내 적어도 하나의 동사의 문형을 분석한 후, 웹페이지 내 동사에 분석된 문형 및 의미를 오버레이(Overlay)할 수 있다. 예를 들어 사용자가 A 동사와 B 문장을 학습한 후, 뉴욕타임즈 내 A 동사의 B 문장 내 C 문형 및 D 의미로 쓰인 단어가 존재한다면 이에 표시를 해줌으로써 배운 동사가 어떻게 쓰이고 있는지를 보여줄 수 있다.
연어학습부(370)는, 적어도 하나의 단어가 동사인 경우, 동사가 포함된 문장 내 동사 뒤 단어의 품사 및 성분을 분석한 후, 동사의 의미가 달라지는 연어(Collocation)인 경우, 연어의 의미를 출력할 수 있다. 이때, 연어란, 최소 2 개 이상의 단어들이 쌍을 이루어서 덩어리(Chunks) 형태로 반복적이고 규칙적으로 나타나는 현상을 뜻한다. 연어능력을 향상시키기 위해서 수 많은 어휘 중 어떤 어휘를 선정하여 암기를 위한 단어장에 넣어야 할 것인가에 대한 고민이 필요하다. 이때, 중요하게 고려되는 한 요인이 빈도(Frequency)인데, 빈도는 현재 한국 영어 교과과정의 어휘 선정에 사용되는 주된 기준이 된다.
특히, 연어학습과 관련하여 고빈도 동사 중 탈어휘 동사(Delexical Verbs)는 다른 어휘와 매우 빈번하게 사용되기는 하나 동사 자체의 뜻보다는 뒤에 결합되는 단어에 의해 뜻이 결정되는 동사로, Do, Have, Make, Get, Take, Keep 등이 이에 속한다. 이러한 동사는 학습자들이 가장 어려움을 겪는 연어유형으로 효과적인 영어학습을 위해 더 중점적으로 다루어질 필요가 있다. 이에 따라, 본 발명의 일 실시예에서는 각 시험에서 출제된 시험 텍스트를 모아 코퍼스 분석을 실시하고, 연어의 유형 및 빈도를 분석하여 단어장을 만드는데 이용할 수 있다.
<고빈도 동사 및 탈어휘 동사>
탈어휘 동사는 어떤 행동을 수행하는 것을 나타내기 위한 목적어로서의 명사와 함께 사용되는 동사를 지칭하며, 이때 동사는 거의 동사 고유의 의미를 지니지 않는다. 예를 들어, He had a shower라는 문장에서 had는 동사 고유의 의미를 가지지 않는다. 이 문장의 대부분의 의미는 명사인 shower가 가지고 있다. 그리고 Make a mistake라는 예를 보면, make 동사는 자체의 의미보다는 함께 연어관계를 이루고 있는 명사인 mistake의 의미를 두드러지게 하는 탈어휘 동사(Delexical Verb)의 특성을 지니고 있음을 알 수 있다. 따라서, 탈어휘 동사란 동사 자체의 뜻보다는 뒤에 결합되는 단어에 의해 뜻이 전달되는 자의적인 쓰임새를 지칭하며, 탈어휘 동사로는 Do, Have, Make, Get, Take, Keep, Bring, Put 등이 있다.
<코퍼스 기반 어휘 분석>
코퍼스(Corpus)란 언어 사용자들에 의해 실제로 사용된 문자언어 뿐만 아니라, 음성언어를 컴퓨터로 분석가능한 텍스트로 변환하여 모아놓은 것을 의미한다. 따라서, 실제적인 언어자료를 텍스트화하여 수행된 코퍼스 분석은 여러가지 어휘 항목에 정보를 분석할 수 있는 이점을 제공한다. Get, Make, Take 등의 탈어휘 동사의 연어를 분석해보면, 이들 동사의 다양한 의미와 용법이 학년별로 체계적으로 제시되지 못하고 있다. 이때, 대학수학능력시험은 한국 영어교육에 대한 역효과(Washback Effect)가 높으므로, 이에 사용된 듣기와 독해지문을 대상으로 코퍼스를 분석한 후, 이들 텍스트에서 나타난 탈어휘 동사 연어의 유형 및 빈도를 분석한 후 단어장을 생성하도록 할 수 있다.
<분석대상 텍스트>
대학수학능력시험의 외국어 영역의 영어지문을 대상으로 코퍼스 기반 연어분석을 실시할 수 있다. 수능 코퍼스 외에도 토플 코퍼스, LSAT 코퍼스, 토익 코퍼스 등 다양하게 구축할 수 있으나 본 발명의 일 실시예에서는 수능(대학수학능력시험)의 코퍼스를 기준으로 설명한다. 수능 코퍼스를 모아 전체 토큰(Token)의 수를 카운팅하고, 전체 사용된 타입(Type) 수를 추출한다.
<알고리즘 툴>
텍스트 파일로 구축한 수능코퍼스 분석을 위하여 AntConc이라는 분석 프로그램을 툴로 사용할 수 있다. AntConc는 어휘목록작성과 키워드 산출기능을 제공하는데, 유니코드를 통해 거의 모든 언어의 문자를 인식할 수 있고, 정규 표현식을 사용하여 매우 복잡한 검색도 가능하게 해준다. 이에 따라, WordList 기능과 Concordance 기능을 사용할 수 있는데, 전자는 어휘 목록, 어휘 빈도수, 빈도수에 의한 순위, 코퍼스 전체에 대한 토큰 수와 타입 수를 자동으로 산출해준다. 후자의 경우, 해당 단어를 직접 입력하면 해당 단어가 사용되는 문맥을 정렬하여 보여주는 기능으로, 이를 통하여 중심어, 예를 들어 Make를 기준으로 좌우로 결합되는 어휘를 분석할 수 있다. 또한, 가운데 정렬된 중심어를 클릭하면, 클릭한 중심어를 포함한 전체 문장을 보여주는데, 문장 분석을 통하여 그 의미도 파악할 수 있다.
<분석>
고빈도 동사 중 탈어휘 동사를 추출하고, 탈어휘 동사와 함께 나타나서 의미를 이루는 결합어를 파악하여 연어의 유형 및 빈도를 살피고 중심어의 의미갈래를 파악할 수 있다. 이를 위하여 어휘적 연어 유형 중 동사와 관련된 유형을 참조하여 탈어위 동사의 연어 유형을 분석할 수 있다. 그 결과 예를 들어, Make 동사가 사용된 의미갈래는 수행하다, 행하다, 야기하다, 상태를 변화시키다, 생산하다, 창조하다, ~ 가 되다, 성공하다 순으로 사용되었다면, 이 순서대로 단어장을 만들고 예문을 제공할 수 있다. 또, 연어 유형도 함께 제시해줄 수 있는데, Make+Noun 유형이 가장 많이 나타났다면 이 유형을 가장 먼저 배치하고, Make+Adverb 유형이 가장 낮게 나타났다면 표시하지 않거나 가장 마지막에 배치하여 단어장을 제공할 수 있다. 어휘적 연어 유형 분석 기준은 이하 표 1과 같을 수 있다.
어휘적 연어 유형 분석 기준
1.Verb+Noun Verb+Pronoun
Verb+Noun
2. Phrasal Verb + Noun
3. Verb + Adverb(Not Particle)
4. Noun + Verb
또, 예를 들어, Get의 경우 Get+Noun, Noun+Get, Phrasal Verb+Noun, Get+Adverb 순서로 비율이 높게 나타났고, Get이 사용된 의미갈래로는, 바꾸다, 야기하다, 가다, 오다, 도착하다, 얻다, 받다, 잡다 등으로 순서로 고빈도이면, 고빈도인 의미갈래 및 연어 유형 순서로 단어장에 예문과 의미를 배치할 수 있다. 예를 들어, Get과 결합한 명사의 경우, 얻다, 받다, 잡다의 의미로 사용된 경우가 전체의 95%를 차지한다면, 이를 가장 먼저 배열하여 사용자들이 가장 다수로 빈출되는 것들을 먼저 익히도록 할 수 있다. 만약, Ticket과 Get의 결합이 4 번째로 많이 나타났다면, 단어장에 buy the tickets라는 표현 이외에 get the tickets와 같은 중 결합 연어 표현을 사용하도록 제시함으로써 연어 표현에 익숙해질 수 있도록 할 수 있다. 연어의 의미는 개별 단어의 의미만으로 유추하기 힘들기 때문에 대부분의 학습자들은 연어 학습에 부담을 느낄 수 있다. 따라서, 본 발명의 일 실시예에 따른 방법으로 코퍼스 분석 프로그램을 각 시험별로 활용하여 연어 유형 및 용례와 유사한 예문을 제시해줌으로써 사용자가 준비하려는 시험 또는 학년에 맞는 연어 유형 및 용례를 통해 연어의 특성 및 결합 방식을 학습하게 할 수 있다.
군집화부(380)는, 적어도 하나의 단어가 분석되는 품사에 따라 어절 또는 어구로 군집화(Clustering)되는 경우, 적어도 하나의 단어가 포함된 어절 또는 어구를 세트(Set)로 묶어 표시할 수 있다.
이하, 상술한 도 2의 학습 서비스 제공 서버의 구성에 따른 동작 과정을 도 3 및 도 5를 예로 들어 상세히 설명하기로 한다. 다만, 실시예는 본 발명의 다양한 실시예 중 어느 하나일 뿐, 이에 한정되지 않음은 자명하다 할 것이다.
도 3을 참조하면, (a) 학습 서비스 제공 서버(300)는 NLP(자연어처리) 및 POS(품사)에 기반하여 입력되는 단어의 품사가 자동으로 태깅되도록 학습을 진행할 수 있다. (b) 이에 따라 학습 서비스 제공 서버(300)는 라벨러를 고용하지 않고도 단어와 단어가 포함된 문장이 입력되는 경우, 자동으로 품사와 그 의미가 출력되도록 하는 서버일 수 있고, (c)와 같이 사용자가 등록된 후, 사용자의 학년, 준비하는 시험의 종류 등이 입력되는 경우, 이에 대응하는 단어 및 문장을 제공하되 (d)와 같이 품사와 문장 내 역할에 따라 달라지는 의미를 함께 제공한다. 학습 서비스 제공 서버(300)는, 도 4의 (a)와 같이 like가 동사인 경우 좋아한다의 뜻이지만, like가 전치사로 쓰인 경우 ~ 처럼의 뜻으로 변경되는 것을 품사와 함께 제공하는 것이다. 학습 서비스 제공 서버(300)는, as가 접속사로 쓰인 경우와 as가 전치사로 쓰인 경우 등과 같이 동일한 단어이지만 품사에 따라 달라지는 단어들을 학습할 수 있도록 하고, (b)와 같이 탈어휘 동사, 즉 동사 뒤에 위치하는 단어에 의해 의미가 결정되는 연어도 문장과 함께 제공하며, (c) 연어를 학습할 수 있도록 하고, (d) 이를 위하여 코퍼스 기반 문장이나 어휘를 분석하는 시스템을 구축한다.
이와 같은 도 2 내지 도 4의 품사 기반 영어 학습 서비스 제공 방법에 대해서 설명되지 아니한 사항은 앞서 도 1을 통해 품사 기반 영어 학습 서비스 제공 방법에 대하여 설명된 내용과 동일하거나 설명된 내용으로부터 용이하게 유추 가능하므로 이하 설명을 생략하도록 한다.
또한, 도 3과 도 5의 문형 기반 영어 학습 서비스가 구현된 일 실시예를 설명하기 위한 도면을 참조하면, (a) 학습 서비스 제공 서버(300)는 NLP(자연어처리) 및 SP(Sentence pattern)(문형)에 기반하여 입력되는 동사의 문형이 자동으로 태깅되도록 학습을 진행할 수 있다. (b) 이에 따라 학습 서비스 제공 서버(300)는 라벨러를 고용하지 않고도 동사와 동사가 포함된 문장이 입력되는 경우, 자동으로 문형과 그 의미가 출력되도록 하는 서버일 수 있고, (c)와 같이 사용자가 등록된 후, 사용자의 학년, 준비하는 시험의 종류 등이 입력되는 경우, 이에 대응하는 단어 및 문장을 제공하되 (d)와 같이 동사와 문형이 문장 내 역할에 따라 달라지는 의미를 함께 제공한다.
학습 서비스 제공 서버(300)는, 도 5의 (a)와 같이 get에 부사 또는 전치사구가 부가될 경우( I will get to the bus stop)에는 문형은 1형식으로 도착하다란 뜻이 된다. 또한 get에 형용사가가 부가될 경우(I got sick after sick)에는 2형식으로 ~형용사하게 되다란 뜻이고, get에 명사가 부가될 경우(I got an idea)에는 3형식으로 명사를 얻다라는 뜻이 된다.
또한, 학습 서비스 제공 서버(300)는, make에 명사가 부가될 경우(I make an error)애는 3형식으로 명사를 만들다라는 뜻이 되고, make에 "명사+명사"가 부가될 경우(I will make him a desk)에는 4형식으로 명사에게 명사를 만들어주다라는 뜻이 되고, make에 "명사+형용사"가 부가될 경우(I will make her happy)에는 5형식으로 명사를 형용사하게 만들다라는 뜻이 되고, make에 "명사+명사"가 부가될 경우(I will make him a doctor)에는 5형식으로 명사를 명사로 만들다라는 뜻이 된다.
이와 같은 도 2 내지 도 5의 동사의 문형별 및 단어의 품사별 영어 학습 서비스 제공 방법에 대해서 설명되지 아니한 사항은 앞서 도 1을 통해 동사의 문형별 및 단어의 품사별 영어 학습 서비스 제공 방법에 대하여 설명된 내용과 동일하거나 설명된 내용으로부터 용이하게 유추 가능하므로 이하 설명을 생략하도록 한다.
이하, 상술한 장치를 이용한 본 발명의 해석편 제공 방법을 설명한다.
도 6은 본 발명의 일 실시예에 따른 동사의 문형별 및 단어의 품사별 영어 해석편 제공 방법을 설명하기 위한 흐름도로서, 도시된 바와 같이 학습 서비스 제공 서버는, 적어도 하나의 단어 및 적어도 하나의 단어가 포함된 문장을 매핑하여 저장하고, 또한 적어도 하나의 동사 및 적어도 하나의 동사가 포함된 문장을 매핑하여 저장한다(S110).
이후, 학습 서비스 제공서버는 문장 내 성분인 품사를 태깅하거나 또는 문장의 문형을 태깅한다(S120).
그리고, 학습 서비스 제공 서버는, 사용자 단말에서 적어도 하나의 단어를 문장과 함께 표시하거나 또는 적어도 하나의 동사를 문장과 함께 표시한다(S130).
사용자 단말에서 적어도 하나의 단어의 적어도 하나의 의미를 출력할 때 품사에 따라 달라지는 의미로 출력하고, 적어도 하나의 동사와 적어도 하나의 의미를 출력할 때 문형에 따라 달라지는 의미도 출력한다(S140).
상술한 단계들(S110~S140)간의 순서는 예시일 뿐, 이에 한정되지 않는다. 즉, 상술한 단계들간의 순서는 상호 변동될 수 있으며, 이중 일부 단계들은 동시에 실행되거나 삭제될 수도 있다.
이와 같은 도 6의 동사의 문형별 및 단어의 품사별 영어 학습 서비스 제공 방법에 대해서 설명되지 아니한 사항은 앞서 도 1 내지 도 5를 통해 품사 기반 영어 학습 서비스 제공 방법에 대하여 설명된 내용과 동일하거나 설명된 내용으로부터 용이하게 유추 가능하므로 이하 설명을 생략하도록 한다.
도 6을 통해 설명된 일 실시예에 따른 동사의 문형별 및 단어의 품사별 영어 학습 서비스 제공 방법은, 컴퓨터에 의해 실행되는 애플리케이션이나 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.
또한, 도 6을 통해 설명된 일 실시예에 따른 동사의 문형별 및 단어의 품사별 영어 학습 서비스 제공 방법에서 단말기에 표시되는 동사의 문형 또는 단어의 품사를 알파벳 순으로 인쇄하여 서적이나 사전으로도 구현될 수 있다.
전술한 본 발명의 일 실시예에 따른 동사의 문형 또는 단어의 품사 기반 영어 학습 서비스 제공 방법은, 단말기에 기본적으로 설치된 애플리케이션(이는 단말기에 기본적으로 탑재된 플랫폼이나 운영체제 등에 포함된 프로그램을 포함할 수 있음)에 의해 실행될 수 있고, 사용자가 애플리케이션 스토어 서버, 애플리케이션 또는 해당 서비스와 관련된 웹 서버 등의 애플리케이션 제공 서버를 통해 마스터 단말기에 직접 설치한 애플리케이션(즉, 프로그램)에 의해 실행될 수도 있다. 이러한 의미에서, 전술한 본 발명의 일 실시예에 따른 품사 기반 영어 학습 서비스 제공 방법은 단말기에 기본적으로 설치되거나 사용자에 의해 직접 설치된 애플리케이션(즉, 프로그램)으로 구현되고 단말기에 등의 컴퓨터로 읽을 수 있는 기록매체에 기록될 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (6)

  1. 적어도 하나의 단어를 출력할 때, 상기 단어가 포함된 문장과 함께 출력하고, 상기 문장 내 상기 단어에 기 매핑되어 저장된 품사에 따라 달라지는 단어의 뜻을 알파벳 순서로 출력하는 사용자 단말; 및
    적어도 하나의 단어 및 상기 적어도 하나의 단어가 포함된 문장을 매핑하여 저장하는 데이터베이스화부, 상기 적어도 하나의 단어의 상기 문장 내 성분인 품사를 태깅하는 품사문형태깅부, 상기 사용자 단말에서 상기 적어도 하나의 단어를 상기 문장과 함께 표시하는 표시부, 상기 사용자 단말에서 상기 적어도 하나의 단어의 적어도 하나의 의미를 출력할 때 상기 품사에 따라 달라지는 의미로 출력하는 성분의미제공부를 포함하는 학습 서비스 제공 서버;
    를 포함하는, 동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템.
  2. 제 1항에 있어서,
    상기 사용자 단말은
    적어도 하나의 동사를 출력할 때, 상기 동사가 포함된 문장과 함께 출력하고, 상기 문장 내 상기 동사에 기 매핑되어 저장된 문형에 따라 달라지는 단어의 뜻을 알파벳 순서로 출력하고,
    상기 학습 서비스 제공 서버는
    적어도 하나의 동사 및 상기 적어도 하나의 동사가 포함된 문형을 매핑하여 저장하고, 상기 적어도 하나의 동사의 상기 문장 내 문형을 태깅하고, 상기 사용자 단말에서 상기 적어도 하나의 동사의 상기 적어도 하나의 의미를 출력할 때 상기 문형에 따라 달라지는 의미로 출력하는, 동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템.
  3. 제 1항 또는 제 2항에 있어서,
    상기 학습 서비스 제공 서버는
    상기 사용자 단말에서 상기 적어도 하나의 단어를 출력할 때, 상기 적어도 하나의 단어가 포함된 문장 내 적어도 하나의 품사에 따라 달라지는 의미를 서로 다른 문장 내 표시하여 출력하거나,
    또는 상기 사용자 단말에서 상기 적어도 하나의 동사를 출력할 때, 상기 적어도 하나의 동사가 포함된 문장 내 적어도 하나의 문형에 따라 달라지는 의미를 서로 다른 문장 내 표시하여 출력하는 예문제공부;
    를 더 포함하는 것을 특징으로 하는 동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템.
  4. 제 1항 또는 제 2항에 있어서,
    상기 학습 서비스 제공 서버는
    상기 사용자 단말에서 학습한 적어도 하나의 단어가 포함된 웹페이지가 상기 사용자 단말에서 출력되는 경우, 상기 적어도 하나의 단어가 포함된 문장 내 상기 적어도 하나의 단어의 품사를 분석한 후, 상기 웹페이지 내 단어에 분석된 품사 및 의미를 오버레이(Overlay)하거나,
    또는 상기 사용자 단말에서 학습한 적어도 하나의 동사가 포함된 웹페이지가 상기 사용자 단말에서 출력되는 경우, 상기 적어도 하나의 동사가 포함된 문장 내 상기 적어도 하나의 동사의 문형을 분석한 후, 상기 웹페이지 내 동사에 분석된 문형 및 의미를 오버레이(Overlay)하는 실생활활용부;
    를 더 포함하는 것을 특징으로 하는 동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템.
  5. 제 1 항 또는 제 2항에 있어서,
    상기 학습 서비스 제공 서버는
    상기 적어도 하나의 단어가 동사인 경우, 상기 동사가 포함된 문장 내 상기 동사 뒤 단어의 품사 및 성분을 분석한 후, 상기 동사의 의미가 달라지는 연어(Collocation)인 경우, 상기 연어의 의미를 출력하는 연어학습부; 및
    상기 적어도 하나의 단어가 분석되는 품사에 따라 어절 또는 어구로 군집화(Clustering)되는 경우, 상기 적어도 하나의 단어가 포함된 어절 또는 어구를 세트(Set)로 묶어 표시하는 군집화부;
    를 더 포함하는 것을 특징으로 하는 동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템.
  6. 제 1항 내지 제 5항 중 어느 한 항의 시스템으로 구현되어 단말기에 표시되는 동사의 문형 또는 단어의 품사를 알파벳 순으로 기록한 매체.
PCT/KR2023/009308 2022-07-26 2023-07-03 동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템 및 그것을 기록한 매체 WO2024025184A1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2022-0092444 2022-07-26
KR20220092444 2022-07-26
KR10-2022-0168379 2022-12-06
KR1020220168379A KR20240014999A (ko) 2022-07-26 2022-12-06 동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템 및 그것을 기록한 매체

Publications (1)

Publication Number Publication Date
WO2024025184A1 true WO2024025184A1 (ko) 2024-02-01

Family

ID=89706721

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2023/009308 WO2024025184A1 (ko) 2022-07-26 2023-07-03 동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템 및 그것을 기록한 매체

Country Status (1)

Country Link
WO (1) WO2024025184A1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR940022312A (ko) * 1993-03-15 1994-10-20 김영택 기계번역장치 및 방법
KR100530154B1 (ko) * 2002-06-07 2005-11-21 인터내셔널 비지네스 머신즈 코포레이션 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
KR20120131480A (ko) * 2011-05-25 2012-12-05 에스케이텔레콤 주식회사 단어 학습 서비스 제공 시스템 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR940022312A (ko) * 1993-03-15 1994-10-20 김영택 기계번역장치 및 방법
KR100530154B1 (ko) * 2002-06-07 2005-11-21 인터내셔널 비지네스 머신즈 코포레이션 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
KR20120131480A (ko) * 2011-05-25 2012-12-05 에스케이텔레콤 주식회사 단어 학습 서비스 제공 시스템 및 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Let’s Make the Meaning Appear When you Hover your Mouse Over an English Word on Chrome! Tooltip Dictionary, Naver English Dictionary", 22 August 2016 (2016-08-22), Retrieved from the Internet <URL:https://blog.naver.com/aufcl856/220793975351> *
ANONYMOUS: "[Hidden Pearl of the Internet] Naver English Dictionary", 7 April 2011 (2011-04-07), XP093134163, Retrieved from the Internet <URL:https://www.etnews.com/201104070052> *

Similar Documents

Publication Publication Date Title
Davydov et al. Information system for translation into Ukrainian sign language on mobile devices
Brill Some advances in transformation-based part of speech tagging
Davydov et al. Mathematical method of translation into Ukrainian sign language based on ontologies
Priyadarshi et al. Towards the first Maithili part of speech tagger: Resource creation and system development
Dien et al. POS-tagger for English-Vietnamese bilingual corpus
Mishra et al. Context based NLP framework of textual tagging for low resource language
WO2024025184A1 (ko) 동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템 및 그것을 기록한 매체
Farrar et al. An ontology for linguistic annotation
Wang et al. Named entity recognition for Chinese telecommunications field based on Char2Vec and Bi-LSTMs
Amri et al. Amazigh POS tagging using TreeTagger: a language independant model
CN103164396A (zh) 汉维哈柯电子辞典及其自动转译汉维哈柯语的方法
Tran et al. Named entity recognition for vietnamese spoken texts and its application in smart mobile voice interaction
Bhagat et al. Wordprep: Word-based preposition prediction tool
KR20240014999A (ko) 동사의 문형별 및 단어의 품사별 영어 해석편 제공시스템 및 그것을 기록한 매체
Talpur et al. Researching on Analysis and creating Corpus from Primary level Sindhi language Book for Sindhi
Cheng et al. MTNER: a corpus for Mongolian tourism named entity recognition
Almansor et al. Translating dialectal Arabic as low resource language using word embedding
Theivendiram et al. Named-entity-recognition (ner) for tamil language using margin-infused relaxed algorithm (mira)
Kameyama Information extraction across linguistic barriers
Oudah et al. Studying the impact of language-independent and language-specific features on hybrid Arabic Person name recognition
Nunsanga et al. Part-of-speech tagging in Mizo language: a preliminary study
Priyadarshi et al. A study on the importance of linguistic suffixes in Maithili POS tagger development
WO2021182828A1 (ko) 기계학습, 자연어처리 및 패턴기반 참조 라이브러리 기반 탐색 언어학습 시스템 및 방법
Adelia et al. The analysis of errors made by the third year students of English Department in translating narrative text
Jiacuo et al. Tibetan Case Grammar Error Correction Method Based on Neural Networks

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23846843

Country of ref document: EP

Kind code of ref document: A1