WO2016076622A1 - 문서 선택에 따른 가이드라인 제공방법, 이를 수행하기 위한 프로그램이 기록된 컴퓨터 판독가능한 기록 매체 및 매체에 저장된 단말장치용 어플리케이션 - Google Patents

문서 선택에 따른 가이드라인 제공방법, 이를 수행하기 위한 프로그램이 기록된 컴퓨터 판독가능한 기록 매체 및 매체에 저장된 단말장치용 어플리케이션 Download PDF

Info

Publication number
WO2016076622A1
WO2016076622A1 PCT/KR2015/012096 KR2015012096W WO2016076622A1 WO 2016076622 A1 WO2016076622 A1 WO 2016076622A1 KR 2015012096 W KR2015012096 W KR 2015012096W WO 2016076622 A1 WO2016076622 A1 WO 2016076622A1
Authority
WO
WIPO (PCT)
Prior art keywords
word
document
words
information
test
Prior art date
Application number
PCT/KR2015/012096
Other languages
English (en)
French (fr)
Inventor
박창섭
Original Assignee
브로콜릭 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020150025568A external-priority patent/KR101618600B1/ko
Application filed by 브로콜릭 주식회사 filed Critical 브로콜릭 주식회사
Priority to JP2017526591A priority Critical patent/JP2018503853A/ja
Publication of WO2016076622A1 publication Critical patent/WO2016076622A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Definitions

  • the present invention relates to a method for providing a guideline for easily reading a foreign language document, and more particularly, to determine whether a user's selected document is suitable for reading using a word included in the foreign language document, and to include it in the selected foreign language document.
  • the present invention relates to a method for providing a guideline according to document selection, by providing an optimized wordbook optimized for a word, which makes it easier to read a foreign language document.
  • Korean Patent Publication No. 2011-0024419 extracts a word from a sentence and provides the user with the meaning of the extracted word so that the user can easily translate the sentence. Furthermore, the word is provided in consideration of the user's vocabulary level. It suggests how to recommend.
  • the existing technology determines the user's vocabulary level based on the dictionary difficulty of the word selected by the user, and can be determined only when certain data is accumulated for the user.
  • the present invention also relates to a method for providing a guideline according to a document selection, by which a word included in a selected foreign language document can be extracted to customize a word book by a user's selection.
  • the present invention relates to a method for providing a guideline according to a document selection when displaying a document selected by a user on a client terminal device together with displaying semantic information of a word included in the displayed document based on the customized wordbook.
  • a guideline providing method if a document written in a first language is selected, the frequency of use is extracted by extracting a word included in the selected document And calculating a difficulty level, displaying a test word based on the frequency of use and difficulty level, and determining a suitability for the selected document based on a test result for the test word.
  • the words included in the document may be selected and displayed according to the frequency of use or the difficulty in the order of low or high, or may be selectively displayed for each number of difficulty.
  • the method may further include providing a goodness of fit for the document based on the test result.
  • the test result may be calculated by grouping the difficulty levels of the test word, and the providing of the fitness may provide learning word information for reading the document based on the test result calculated by grouping the difficulty levels. .
  • the method may further include receiving memorization target word information from the learning word information, and generating a vocabulary from the memorization target word information.
  • the method may further include generating a first wordbook from the memorization target word information of the word group extracted based on the frequency of use or the difficulty.
  • the generated first vocabulary includes at least one of dictionary meaning information, part-of-speech information, word circular information, semantic information and sentence sentence information used in the document, memorization hint information, difficulty level, frequency of use, and a learning problem. Can be provided.
  • the generated first vocabulary may be managed by dividing each memorized target word into a word to be memorized, a known word or a completed word, or separately storing the words.
  • the method may further include displaying the document, and displaying semantic information with respect to a word included in the selected wordbook among words included in the displayed document.
  • Receiving a search word for the document and providing a document list including documents matching the search word, wherein the number of words to be memorized, the share of use of the words to be memorized, the number of words to be known,
  • the document list may be sorted according to the use of the word, sales volume, rating order, release date or price.
  • the method may further include displaying the document, wherein the display of the semantic information may be omitted for a word included in a preset exception word list among words included in the displayed document.
  • the meaning of the words contained in the wordbook among the words included in the displayed portion can be displayed together so that it can be easily read without a separate search.
  • FIG. 1 is an exemplary view schematically showing a guideline providing method according to document selection according to an embodiment of the present invention.
  • FIG. 2 is a flowchart illustrating a guideline providing method according to document selection according to an embodiment of the present invention.
  • 3 to 8 are flowcharts illustrating a guideline providing method according to document selection according to another embodiment of the present invention.
  • FIG. 9 is a block diagram of a guideline providing system according to document selection according to an embodiment of the present invention.
  • FIG. 10 is a block diagram of a guideline providing system according to a document selection according to another embodiment of the present invention.
  • FIG. 11 is an exemplary diagram illustrating data and information flow of a method for providing a guideline according to document selection according to an embodiment of the present invention.
  • FIG. 12 is an exemplary view showing data and information flow of a guideline providing method according to document selection according to another embodiment of the present invention.
  • FIG. 13 is an exemplary view schematically showing a word group generated by a method for providing a guideline according to a document selection according to an embodiment of the present invention.
  • FIG 14 is an exemplary view showing a document displayed on the client terminal by the guideline providing method according to the document selection according to another embodiment of the present invention.
  • a guideline providing method according to document selection according to an embodiment of the present invention is shown.
  • the frequency of use and difficulty may be calculated by extracting a word included in a document written in each first language (S10).
  • FIG. 1 shows a connection relationship for service provision by a guideline providing system (hereinafter referred to as a providing system) according to document selection according to an embodiment of the present invention
  • FIG. 7 is a configuration diagram of the providing system according to the present embodiment.
  • server 10 the providing system may be implemented as a computer system capable of executing a program for providing a guideline according to document selection.
  • a user who wants to select and read a document written in a foreign language can access a server 10 in which various foreign language documents are registered through a network using a client terminal device (not shown).
  • a client terminal device not shown
  • a case where a foreign language document is registered in the server 10 has been described as an example.
  • the present invention is not limited thereto, and the foreign language document may be stored and managed in the client terminal device. Therefore, a service may be provided in a form of directly selecting a foreign language document from a client terminal without access to a separate server 10.
  • the term "document” may be a concept including both a document file in text or binary form or an image file including text information of an image of the document.
  • the server 10 may be hardware in the same configuration as a typical web server, a web application server, or a web server, or a WAP server.
  • a web application server or a web server
  • a WAP server or a WAP server.
  • C C
  • C ++ Java You can include program modules that can be implemented in any language, including PHP, .Net, Python, Ruby, and more.
  • the server 10 may be connected to a client terminal device such as a computer, a mobile terminal, or another server 10 through a network, whereby the server 10 may work on the client terminal device or another server 10. It may refer to a computer system that receives a request for performance and derives and provides a work result thereof, or computer software (server program) installed for the computer system.
  • the server 10 has a broad concept including a series of application programs that operate on the server 10 in addition to the above-described server program, and, in some cases, various databases built internally or externally. It should be understood that content, various information and data can be stored and managed in a database.
  • the database may be implemented inside or outside the server 10.
  • the client terminal device refers to a machine and a device for performing a computing operation including not only a general PC such as a desktop or a notebook, but also a mobile terminal such as a smartphone, a tablet PC, a PDA, and the like.
  • the network is a network connecting the server 10 and the client terminal device, and may be a closed network such as a local area network (LAN), a wide area network (WAN), or an open type network such as the Internet. It may be a network.
  • the Internet may mean a global open computer network structure that provides various services existing in the TCP / IP protocol and its upper layer, and includes a mobile terminal such as a smart phone, a tablet PC, a PDA, and a smart phone.
  • the network may further include a wireless access network such as a mobile communication network or a Wi-Fi network.
  • various documents written in a foreign language may be registered in the server 10.
  • various documents written in a foreign language may be stored and managed in the client terminal device.
  • These documents include electronically documented books, articles and articles, as well as documents in all fields, including novels, magazines, technical books, poetry, fairy tales, educational texts, periodicals, newspapers, papers, articles, etc., distributed online or offline. It may be included, and may be a file of various formats such as DOC, HWP, ePub, BeBB, AZW, PDF, PPT, XLS, TXT, RTF.
  • identification information that can be directly identified or inferred from the document, such as the title of the document, the author, the publisher, the release date, the price, the sales amount, the rating or a set of randomly assigned symbols and numbers. Can be.
  • the document may be stored and managed in a database in association with the identification information.
  • the first language is a specific language typically used in the preparation of the document, and may be any kind of language such as English, Japanese, Chinese, German, French, Italian, and Arabic.
  • English becomes the first language.
  • the words included in the registered document are extracted from the word analysis module 100 and classified into a plurality of grades according to a predetermined difficulty classification method, and the number of times the words belonging to each of the plurality of grades are used in the document.
  • the frequency of use can be calculated.
  • the predetermined difficulty classification method may be a method of classifying English words in a specific dictionary according to a difficulty level of the dictionary, and the predetermined difficulty classification criteria may be stored in the database in advance.
  • the scope of the present invention is not limited thereto, and may be a difficulty classification standard arbitrarily set by an administrator of the providing system.
  • the difficulty classification method may be regularly updated by the providing system administrator or automatically by the providing system at regular intervals.
  • the word analysis module 100 may determine the number of words corresponding to each of the plurality of grades, the utilization rate of words included in each of the plurality of grades, and the plurality of grades, respectively. Word usage status information including information on the number of use of the included words may be provided.
  • the difficulty of the words included in the document and the frequency of use may be stored in the database in association with the identification information of the document, and may be provided to the client terminal device through the transmission / reception module 130.
  • the word analysis module 100 may not be provided in the server 10 but may be disposed in the client terminal device. In this case, in performing the word analysis task in the word analysis module 100, communication with the server 10 may be omitted.
  • a document list including the document may be provided (S20).
  • the display module 120 may be provided in the form of a list or icon platform so that the registered document can be selected on the screen of the client terminal device accessing the server 10, but is not limited thereto.
  • the document list may be generated directly in the client terminal device without accessing the server 10.
  • the display module 120 may be provided at the client side to provide a service.
  • the platform can be implemented in various languages, plug-ins, and graphic technologies such as html, Css, javaScript, Visualbasic Script, PHP, JSP, ASP, ASP.net, Document Object Model, CGI, SVG, Canvas API, Flash, Shockwave, Java, etc. .
  • the identification information of the user who accesses the service can be received and stored in a database.
  • the identification information is information that can be directly identified or inferred from the user.
  • the name, ID, password, age, gender, address, and telephone number An e-mail address, an SNS address, a homepage address, a credit card number, a social security number, or a set of randomly assigned symbols and numbers.
  • information on the selected document may be directly provided by the client terminal device or received from the server 10 (S30).
  • a test word may be displayed based on the difficulty and the frequency of use among words included in the selected document (S40).
  • test word is selected according to the order of low or high difficulty among words in a first language included in the selected document.
  • the frequency of use is selected in the order of low or high, it may be displayed on the client terminal device through the display module 120.
  • the test word may be selected and displayed by a predetermined number for each difficulty level.
  • test words may be selected according to selection criteria arbitrarily set by an administrator of the providing system.
  • the selected test word may extract a sentence actually applied to the selected document to make the extracted sentence itself a test word.
  • the user may input the meaning of the test word displayed on the client terminal device in the second language.
  • the user may directly input semantic information, and may select and input any one of a plurality of views.
  • the second language is a language that the user wants to interpret the first language of the document into another language, and may be any kind of language such as English, Japanese, Chinese, German, Japanese, French, Italian, and Arabic.
  • a person who wants to read a document written in English in Korean can input the meaning in Korean in a test word composed of English words. In this case, English becomes the first language and Korean becomes the second language.
  • the semantic information input through the client terminal device may be received by the server 10, and the semantic information of the test word input in the received second language by the test module 110 is defined in advance. Can be determined whether or not.
  • another search server 10 capable of comparing or searching a dictionary or translating a language by using the database in which the providing system administrator previously inputs and stores the exact meaning of the test word.
  • the semantic information of the test word may be requested to the translation server 10 and the library and compared.
  • the client terminal device may include a test module 110 to determine whether the input semantic information directly matches a predefined meaning in the client terminal device.
  • test module 110 may calculate the number of correct answers in which the user correctly inputs the meaning of the test word based on the determination of the match, and may calculate a test result based on the number of correct answers.
  • a score for each test word by assigning an arbitrary weight to the frequency or difficulty of the test word, a value obtained by summing all the scores of the test words in which the meaning is input accurately is a test result.
  • the scope of the present invention is not limited thereto, and the test result may be calculated according to various criteria set by the administrator of the providing system.
  • the user may be provided a goodness of fit for the selected document (S50).
  • the suitability refers to whether the learning level for the first language is sufficient for the user to read the selected document.
  • the test result is more than a certain score or ratio in the test module 110
  • the user A 'suitability' can be determined that the learning level for the first language is sufficient to read the selected document, and if the test result is less than or equal to the predetermined score or ratio, the user reads the selected document to the first. Inappropriate judgment can be made that the level of learning about the language is insufficient.
  • the determination through the transmission and reception module 130 may transmit a fitness message that said 'suitable' or 'unsuitable' to the terminal device of the client, wherein, the test information includes whether the semantic information match and the exact semantic information Test results can be sent together.
  • the words included in the document selected by the user can be directly used in the test to accurately determine whether the document selected by the user is suitable for the user's level, thereby supporting the user's efficient document selection.
  • the user may be asked whether to test using another test word included in the selected document and not overlapping with the test word (S51).
  • test word Since the test result may vary according to the test word, and thus the user's suitability for the same document may be changed, the test word is not used among the words included in the selected document to increase the reliability of the goodness of fit. Other test words may be used to ask the user whether or not to repeat the test.
  • the difficulty level is low or high, except for the test words previously selected from among the words in the first language included in the selected document in the test module 110. If the different test words are selected or the other test words are selected according to the order of low or high frequency of use, the display module 120 may display the selected other test words on the client terminal device (S52). ). In addition, the other test words may be selected and displayed by an arbitrary number for each difficulty level. However, the scope of the present invention is not limited thereto, and the other test words may be selected according to the selection criteria arbitrarily set by the administrator of the providing system.
  • the fitness of the selected document may be provided to the user based on the re-execution test result and the existing test result (S53). Receiving the semantic information about the other test word from the user to confirm whether the match, calculation of the number of correct answers for the other test word and the calculation method of the re-execution test result is confirmed to match the existing test word, the test word Is the same as the method for calculating the correct answer and the test result.
  • the test module 110 may provide a suitability to the client based on the existing refit test method based on the retest test result, and calculate the average value by adding the retest test result and the existing test result. Based on this, the fitness can be provided to the user according to the fitness determination method.
  • the fitness test can be conducted using another test word included in the selected document continuously by the user's selection. Through this process, the reliability of the fitness can be improved, and the user can learn words included in the selected document.
  • test results may be calculated by grouping by the difficulty of the test word.
  • the test words used for the test may be classified and grouped according to the difficulty. Based on this, the total number of problems of the test words displayed to the user or the total score of the scores set in the test words can be calculated for each difficulty group. In addition, for each difficulty group, the user may calculate the total number of correct answers or correct scores obtained by accurately inputting semantic information of the test word.
  • the learning word information is information for recommending a learning word that the user should learn in order to easily read the selected document.
  • the learning word information includes the word usage status information, the number of learning words, a learning word list, and a learning word.
  • One or more information of semantic information or recommendation message may be included.
  • the word analysis module 100 corresponds to a difficulty higher than the learning difficulty, including the word corresponding to the learning difficulty or the learning difficulty among words included in the selected document in cooperation with the test module 110.
  • Learning words can be calculated based on all words.
  • the learning difficulty is calculated in plural, it is preferable to calculate a learning word based on the lowest level of learning difficulty among the plurality of learning difficulties, but the present invention is not limited thereto.
  • the learning word can be calculated based on the learning difficulty of the grade according to the grade or any criterion set by the management of the providing system.
  • All words included in the learning difficulty may be calculated as a learning word, or a word more than a certain frequency of use among words included in the learning difficulty may be calculated as a learning word.
  • the remaining words except for the test word in which the user inputs the semantic information accurately may be calculated as the learning word.
  • the word usage information, learning word count, learning word difficulty, learning word list, learning word semantic information, learning word part-of-speech information, or a recommendation message including any one or more of the information Word information can be generated.
  • the user can be provided with a list of the calculated learning words along with a message that the user can read the selected document by learning only 200 words. It can support document selection and provide the amount of learning needed to read the document.
  • the wordbook providing module 140 in the The wordbook may be generated in the form of a table, a table, a learning card to facilitate learning by receiving the selected memorizing target word information, or another form arbitrarily set by the providing system administrator.
  • the word to be memorized is a word selected by the user from a list of words provided to the user, and means a word that the user does not know or wants to know the exact meaning.
  • the wordbook providing module 140 may be provided in the client terminal device instead of the server, and may be configured to enable the wordbook service without being connected to the server.
  • the frequency of use to extract the words contained in the first document of the document written in the first language And difficulty can be calculated (S100).
  • the providing system may be independently implemented in the client terminal device.
  • the providing system may be implemented as a computer system capable of executing a program for providing guidelines according to document selection.
  • a user who wants to select and read a document written in a foreign language accesses the server 10 through a network using a client terminal device, or accesses the document by accessing a program, an application or a website installed in the client terminal device. can do.
  • the server 10, the network, and the client terminal device are the same as described above.
  • various documents written in a foreign language may be registered in the server 10 or the client terminal device.
  • These documents include electronically documented books, articles and articles, as well as documents in all fields, including novels, magazines, technical books, poetry, fairy tales, educational texts, periodicals, newspapers, papers, articles, etc., distributed online or offline. It may be included, and may be a file of various formats such as DOC, HWP, ePub, BeBB, AZW, PDF, PPT, XLS, TXT, RTF.
  • identification information that can be directly identified or inferred from the document can be inputted, such as the title, author, issuer, issue date, price, or a set of symbols or numbers.
  • the document may be stored and managed in a database in association with the identification information.
  • the first language is a specific language typically used in the preparation of the document, and may be any kind of language such as English, Japanese, Chinese, German, Japanese, French, Italian, and Arabic.
  • English becomes the first language.
  • the words included in the registered document are classified into a plurality of grades according to a predetermined difficulty classification method in the word analysis module 100, and a frequency of use which is the number of times of use of the words belonging to each of the plurality of grades in the document. Can be calculated.
  • the predetermined difficulty classification method may be a method of classifying English words in a specific dictionary according to a difficulty level of the dictionary, and the predetermined difficulty classification method may be stored in the database in advance.
  • the scope of the present invention is not limited thereto, and may be a difficulty classification method arbitrarily set by an administrator of the providing system.
  • the difficulty classification method may be regularly updated by the providing system administrator or automatically updated by the providing system at regular intervals.
  • the word analysis module 100 may determine the number of words corresponding to each of the plurality of grades, the utilization rate of words included in each of the plurality of grades, and the plurality of grades, respectively. Word usage status information including information on the number of use of the included words may be provided.
  • the difficulty and the frequency of use of words included in the document may be stored and managed in association with the identification information of the document, and may be provided to the client terminal device through the transmission / reception module 130.
  • a document list including the document may be provided.
  • the registered document may be displayed on a screen of a client terminal device in the form of a list or icon platform.
  • the platform can be implemented in various languages, plug-ins, and graphic technologies such as html, Css, javaScript, Visualbasic Script, PHP, JSP, ASP, ASP.net, Document Object Model, CGI, SVG, Canvas API, Flash, Shockwave, Java, etc. .
  • the information of the first document can be confirmed.
  • FIG. 13 illustrates one form of a word group according to the present embodiment.
  • the difficulty or frequency of use of the word group may be arbitrarily set by an administrator of the providing system, and may receive setting information from the user. For example, when the administrator or the user sets the frequency of use to '2', words having two or more times of use may be extracted from the words included in the first document. In this case, it can be extracted except for word groups corresponding to the level of difficulty of the elementary, middle and high levels.
  • Memorizing target word information of the word group may be received from the user (S120).
  • the display module 120 may display the word list included in the extracted word group on the client terminal device. Accordingly, the user may select a word to be memorized from the word list displayed on the client terminal device.
  • the word to be memorized is a word selected by the user among the listed words, and may mean a word that is unknown or wants to know the exact meaning.
  • a first vocabulary may be generated from the memorized target word information (S130).
  • the wordbook providing module 140 may generate a first wordbook to the user based on the memorization target word information selected by the user and provide the first wordbook to the user.
  • the first vocabulary may mean a vocabulary for words included in the first document, and the memorized target words selected by the user may be displayed on the client terminal device in a table or a table form.
  • the client terminal may directly upload and register any word other than the memorized target word in the generated first wordbook, and select and delete a specific word included in the first wordbook, or change it to another wordbook. You can move it.
  • the calculating of the frequency of use and difficulty may provide first learning word information based on a word included in the first document.
  • the first learning word information is information for recommending a learning word that a user should learn in order to easily read the first document.
  • the first learning word information includes the status information of the word, the number of learning words, and a learning word. One or more of the list, the expected time of study, or the recommended message may be included.
  • the word analysis module 100 may extract a learning word according to a predetermined learning word extraction criterion among words included in the first document.
  • the predetermined learning word extraction criterion may be a specific difficulty or frequency of use, and may be a word included in a specific wordbook, a database, or tag information.
  • a word having a specific difficulty or frequency of use based on the difficulty or frequency of use calculated by the word analysis module 100 is extracted as a learning word, or difficulty of a predetermined level or less.
  • a word having a frequency of use may be extracted as a learning word.
  • a learning word may be extracted by excluding or adding a word included in any wordbook, database, or tag information generated from the user among words included in the first document.
  • the learning word extraction criteria may be stored in advance in the database.
  • the words corresponding to the elementary, middle, and high difficulty levels can be excluded from the learning word. Can be excluded.
  • the cumulative use weights for accumulating the use frequencies may be calculated according to the order of the high frequency of use of the words. If the cumulative use weight reaches a predetermined value or more, the words not included in the cumulative use weights are included in the learning word. It can also be excluded.
  • the learning word extraction criteria may be extracted according to various criteria to provide more efficient learning information to the user.
  • the word analysis module 100 calculates the number of groups by the difficulty level based on the extracted learning word, and calculates the number by the learning difficulty time according to the difficulty level of the predetermined word or the expected learning time of the user.
  • the total estimated time for learning all the extracted learning words may be calculated by summing all the values multiplied by the calculated number.
  • the learning expected time for each difficulty level of the predetermined word may be arbitrarily set by an administrator of the providing system and stored in a database in advance.
  • the first word for the first document including any one or more information of the word usage status information, the number of learning words, the difficulty of learning words, the list of learning words, the expected time of study, or the recommended message based on the extracted learning words.
  • Learning word information may be generated and provided to the client terminal device.
  • the user can be provided with information on the amount of learning to read the document easily so that the user can more efficiently select the document suitable for the learning and level.
  • the user may select a memorization target word from the list for the learning word and generate a wordbook based on the selected memorization target words.
  • the extracting of the word group may include information on one or more of frequency of use, difficulty, usage form information, part-of-speech information, word circular information, and learning completion time of the extracted word.
  • each word included in the list may be analyzed to provide information.
  • Usage type information, difficulty level of each word included in the list, usage type information in which the words included in the list are actually applied in the sentences of the first document, part-of-speech information of each word included in the list, and word circle May contain information.
  • learning completion time information may be included.
  • the user may sort the word list in order of the frequency of use or the difficulty, in order of high or low, and filter to display only words having any frequency of use, difficulty, part-of-speech information, or word circular information. For example, you can filter to display only words that have elapsed from the learning completion time.
  • the word analysis module 100 may classify and classify the words, parts of speech or word circle according to a predetermined difficulty classification method, a part-of-speech classification method, or a word circular classification method, and classify the words, parts of speech or words.
  • the frequency of use which is the number of times the words belonging to the prototype are used in the document, can be calculated.
  • the predetermined difficulty classification method, the part-of-speech classification method, or the word circular classification method may be a method of classifying English words according to a difficulty level, a part-of-speech, or a word circle of a dictionary in a specific dictionary.
  • the prototype classification method may be stored in advance in the database.
  • the scope of the present invention is not limited thereto, and may be a difficulty, part-of-speech, or word circle classification method arbitrarily set by an administrator of the providing system.
  • the learning completion time and the elapsed time will be described in detail later.
  • the word circle information, part-of-speech information, the dictionary meaning information of the selected memorized words when the user selects any one of the words to be memorized from the generated first word book, the word circle information, part-of-speech information, the dictionary meaning information of the selected memorized words.
  • a separate sub-window may be displayed by displaying semantic information used in the first document and sentence example information based on the sentence used in the first document, memorization hint information, difficulty level, frequency of use, or learning problem. Can be.
  • the learning problem is to test whether the user has completed the learning of each of the memorization target words included in the first wordbook, so that the user directly inputs the meaning of the memorization target word or one of a plurality of options.
  • the client terminal may provide a word problem in a subjective or multiple choice form for the memorized target word.
  • Memorizing target word input correct answer through the learning problem may be said that the user has completed the learning.
  • the scope of the present invention is not limited thereto, and the first vocabulary may further provide various learning functions to more easily memorize and learn the words to be memorized.
  • the first vocabulary is divided by the user into the words to be memorized, words to know or learning completed words, memorized words, or to create a separate vocabulary for the words to be memorized, known words or learning completed words It can be managed or stored in a separate database.
  • the memorization target words included in the first vocabulary are classified as words to be memorized or a word to be memorized by the user for measurement of performance according to future user learning, efficient learning, and continuous management. Can be.
  • the memorized target word in which the correct answer is input through the learning problem may be classified as a learning completed word.
  • tag information is added to the classified memorized words, known words, or learning completion words, respectively, to sort and filter according to the tag information, and separately for the memorized words, known words, or learning completed words. It is possible to generate a vocabulary of, and to move the word to be memorized, knowing words or learning completed words to another vocabulary.
  • the word to be memorized, knowing words or learning completed words can be stored in a separate database in conjunction with the identification information of the user, the case of the learning completed words the time passed the test through the learning problem learning completion time Can be stored together.
  • the frequency of use and difficulty are calculated by extracting words included in the first document, and based on the test words, the test words are selected and provided to the user to test the suitability of the user to read the first document. Can be.
  • a word in which the correct answer is input among the test words it may be classified as the known word.
  • the usage frequency and difficulty calculation method, test word screening method, and fitness test method are as described above.
  • the scope of the present invention is not limited thereto, and the words to be memorized may be variously classified, such as words to be memorized, words to be understood, or words completed to learn, words to be confused, key words, and the like.
  • the user can directly upload separate words and sort or store them.
  • a user may provide a word book that is more optimized for reading the first document, and the user may separately create and manage an integrated word book or database related to the first language regardless of the first document.
  • the user may filter to exclude the word included in the known word or the completed word.
  • a list of words included in another document or words included in the memorized word information may be filtered to exclude words that match by comparing the words included in the wordbook or the database for the known word or the completed word.
  • the learning completion word when filtering the list of words included in the other document or the word included in the memorization target word information based on the learning completion word, from the learning completion time of the learning completion word to the filtering time
  • Each of the elapsed days may be calculated, and the learning completion word having the elapsed date less than or equal to a certain period may be filtered out of the filtering.
  • the arbitrary period may be set by the user or the providing system administrator in units of days, weeks, months, and years. In this way, the word completion may be forgotten because the learning completion time is long, and the wordbook may be re-learned, and words optimized for the first language level of the user may be provided as the wordbook.
  • a search word for the document may be input from the user (S140).
  • the search module 150 of the server 10 may provide the user with a search input window for searching at least one of the documents registered in the server 10.
  • the user may select the client terminal device. You can enter a search term.
  • the search module 150 may compare documents stored in the database with identification information of each document, and select documents matching the search word.
  • the matching documents may be displayed on a screen of a user terminal device in a list or icon manner.
  • the list or icon of the document may be sorted according to the number of words to be memorized, the use ratio of the words to be memorized, the number of words to know, the use ratio of the words to know, sales volume, rating order, release date or price.
  • the words to be memorized or the words to be memorized of the user stored in the database for each document are compared with the words extracted from the documents, respectively. You can sort by.
  • the searched documents may be arranged in order according to the sales amount, rating, release date, or high or low order included in the identification information of the document.
  • the use weight of the word to be memorized or the use weight of the word to know represents the weight occupied by the word or the word to be memorized among the words included in the document.
  • the document number can be calculated by dividing the total number of words extracted from the document from the memorized word number or the number of words memorized for each document, and thus the searched documents are sequentially ordered according to the order in which the calculated ratio is high or low. You can sort.
  • the present invention is not limited thereto, and the document list or icon may be arranged based on various information.
  • the first document may be displayed on the client terminal device (S160).
  • the user may select the first document and request reading, and when the server 10 receives the read request information of the first document, the user reads the file of the first document from the database and the client terminal device. Can be marked on.
  • the first wordbook or a separate wordbook may be selected (S170).
  • the user is included in the selected word book among the words contained in the first document displayed on the client terminal device. Meaning information about a word may be displayed together on the client terminal device.
  • the word terminal list for the first document or the other word list generated by the user may be provided to the client terminal device to select one word list.
  • the word analysis module 100 extracts a word included in the first document displayed on the client terminal device, compares the words in the wordbook selected by the user, and compares the semantic information of the matching words with one side of the client terminal device.
  • the word and semantic information may be displayed and provided together in a fixed form, a popup form on one side, or an arbitrary form set by the providing system administrator.
  • the administrator of the providing system is a list of exception words that are words that do not need to be interpreted or ignored separately for reading the selected document. May be set in advance, and a word included in the exception word list may not be displayed on the client terminal device.
  • the exception word list may include words included in the wordbook or database for the known word or the learning completed word.
  • FIG. 14 illustrates one embodiment in which the semantic information of words matching by the first document and the selected wordbook are displayed together on the client terminal device according to the present embodiment.
  • the user when displaying the document selected by the user on the client terminal device, the user can display and provide the semantic information of the words included in the portion displayed on the client terminal device that the user may not know. You can avoid the additional task of searching for a vocabulary or dictionary separately to interpret the document, and make it easier to read the selected document.
  • some of the modules that may be arranged in the server or the client terminal device may be partly arranged in the client terminal device or distributed in the server side.
  • the method of providing guidelines according to the document selection described above may also be embodied as computer readable codes on a computer readable recording medium. That is, there may be a computer-readable recording medium in which a program for performing the guideline providing method according to the document selection according to the embodiment of the present invention is recorded.
  • the computer-readable recording medium includes all kinds of recording media on which data that can be read by a computer system is stored. Examples of computer-readable recording media include, but are not limited to, ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage device, and the like.
  • the guideline providing method according to the document selection described above may be implemented as a program (or an application) and stored in a medium to be executed in combination with a terminal device which is hardware.
  • the program may include C, C ++, JAVA, machine language, etc. which the processor (CPU) of the client terminal device can read through the device interface of the client terminal device so that the client terminal device reads the program and executes the methods.
  • Code may be coded in the computer language of. Such code may include functional code associated with a function that defines necessary functions for executing the methods, and an execution procedure related control code necessary for the processor of the client terminal device to execute a predetermined procedure. It may include.
  • the code may include a memory reference code for additional information or media required to execute the functions by the processor of the client terminal device at which location (address address) of the internal or external memory of the client terminal device should be referred. It may further include.
  • the code may be used by any other computer remotely using the communication module of the client terminal device. Or a communication related code for how to communicate with a server or the like, and what information or media should be transmitted and received during communication.
  • the client terminal device may be implemented in various devices such as a mobile phone, a smart phone, a tablet computer, a notebook computer, a digital broadcasting terminal, a personal digital assistant (PDA), a portable multimedia player (PMP), a navigation device, a digital TV, and a desktop computer.
  • PDA personal digital assistant
  • PMP portable multimedia player
  • the stored medium is not a medium for storing data for a short time such as a register, a cache, a memory, but semi-permanently, and means a medium that can be read by the device.
  • examples of the storage medium include, but are not limited to, a ROM, a RAM, a CD-ROM, a magnetic tape, a floppy disk, an optical data storage device, and the like.
  • the program may be stored in various recording media on various server 10 to which the client terminal apparatus can access or various recording media on the client terminal apparatus of the user.
  • the media may also be distributed over network coupled computer systems so that the computer readable code is stored in a distributed fashion.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명의 일 실시예에 따른 문서 선택에 따른 가이드라인 제공방법은, 제1 언어로 작성된 문서가 선택되면, 상기 선택된 문서에 포함되는 단어를 추출하여 사용빈도 및 난이도를 산출하는 단계, 상기 사용빈도 및 난이도를 기초로 테스트단어를 표시하는 단계, 및 상기 테스트단어에 대한 테스트결과를 기초로, 상기 선택된 문서에 대한 적합도를 제공하는 단계를 포함한다.

Description

문서 선택에 따른 가이드라인 제공방법, 이를 수행하기 위한 프로그램이 기록된 컴퓨터 판독가능한 기록 매체 및 매체에 저장된 단말장치용 어플리케이션
본 발명은 외국어 문서를 쉽게 읽을 수 있도록 가이드라인을 제공하는 방법에 관한 것으로서, 보다 자세하게는, 외국어 문서에 포함되는 단어를 사용하여 유저가 선택한 문서를 읽기에 적합한지를 판단하고, 선택한 외국어 문서에 포함되는 단어에 대하여 최적화된 개별적인 단어장을 제공하여 외국어 문서를 보다 쉽게 읽을 수 있도록 지원하는, 문서 선택에 따른 가이드라인 제공방법에 관한 것이다.
인터넷 기술의 발전, 국제간의 교역 및 자본거래, 다국적기업 활동 등의 증가를 통해 경제는 물론 정치, 문화, 군사적인 측면까지 세계화가 됨에 따라 다양한 정보를 얻기 위하여 외국어로 된 원서를 찾는 비중이 증가하고 있다.
그러나, 해당 외국어를 제대로 숙지하지 않은 상태에서 원서를 읽는 경우, 사전 등을 통해 계속해서 단어의 의미를 찾아야 하며, 나아가 본인의 수준에 맞지 않는 원서를 선택하는 경우에는 단어의 의미를 찾기에 급급하여 많은 시간을 낭비하게 된다.
이에 따라, 본인의 수준에 맞는 외국어로 된 문서를 선택하고, 보다 효율적으로 읽을 수 있도록 지원하는 방법이 연구되어 왔다.
국내 특허 공개 제2011-0024419는 문장 중에서 단어를 추출하고, 추출된 단어의 뜻을 사용자에게 제공하여 사용자가 문장을 쉽게 번역할 수 있도록 지원하며, 나아가 사용자의 어휘수준을 고려해서 단어를 제공 및 문서를 추천하는 방법을 제시하고 있다.
그러나, 기존의 기술은 사용자의 어휘수준을 사용자가 선택한 단어의 사전적 난이도를 기준으로 하여 판단하고 있으며, 사용자에 대한 일정한 데이터가 축적되어야 판단할 수 있다.
또한, 문서 내에 포함되는 단어를 추출하여 추출된 단어의 뜻을 단순하게 제공하는 것에 그치고 있다.
위와 같은 문제점으로부터 안출된 본 발명이 해결하고자 하는 기술적 과제는, 선택된 외국어 문서에 포함되는 단어를 기초로 테스트 하여 해당 유저(즉, 클라이언트)가 해당 외국어 문서를 읽기에 적합한지 여부를 제시하는, 문서 선택에 따른 가이드라인 제공방법에 관한 것이다.
또한, 선택한 외국어 문서에 포함되는 단어를 추출하여 유저의 선택에 의해 단어장을 커스터마이즈 할 수 있는, 문서 선택에 따른 가이드라인 제공방법에 관한 것이다.
또한, 클라이언트 단말장치에 유저가 선택한 문서를 표시하는 경우 상기 커스터마이즈 된 단어장을 기초로 표시된 문서에 포함되는 단어의 의미정보를 함께 표시하는, 문서 선택에 따른 가이드라인 제공방법에 관한 것이다.
상기 언급된 기술적 과제들을 해결하기 위한, 본 발명의 일 실시예에 따른 문서 선택에 따른 가이드라인 제공방법은, 제1 언어로 작성된 문서가 선택되면, 상기 선택된 문서에 포함되는 단어를 추출하여 사용빈도 및 난이도를 산출하는 단계, 상기 사용빈도 및 난이도를 기초로 테스트단어를 표시하는 단계, 및 상기 테스트단어에 대한 테스트결과를 기초로 상기 선택된 문서에 대한 적합도를 결정하는 단계를 포함한다.
상기 테스트단어를 표시하는 단계는, 상기 문서에 포함되는 단어 중 상기 사용빈도 또는 상기 난이도가 낮은 또는 높은 순서에 따라 선별하여 표시하거나, 또는 상기 각 난이도별로 임의의 수만큼 선별하여 표시할 수 있다.
상기 문서에 포함되며 상기 테스트단어와 중복되지 않는 다른 테스트단어를 사용하여 재실시하는 테스트에 응하는 메시지를 수신할 경우, 상기 다른 테스트단어를 표시하는 단계, 및 상기 재실시 테스트결과와 기존의 상기 테스트결과를 기초로 상기 문서에 대한 적합도를 제공하는 단계를 더 포함할 수 있다.
상기 테스트결과는, 상기 테스트단어의 상기 난이도별로 그룹하여 산출하되, 상기 적합도를 제공하는 단계는, 상기 난이도별로 그룹하여 산출된 테스트결과를 기초로 상기 문서를 읽기 위한 학습단어정보를 제공할 수 있다.
상기 학습단어정보 중 암기대상단어정보를 수신하는 단계, 및 상기 암기대상단어정보로부터 단어장을 생성하는 단계를 더 포함할 수 있다.
상기 사용빈도 또는 상기 난이도에 기초하여 추출된 단어그룹의 암기대상단어정보로부터 제1 단어장을 생성하는 단계를 더 포함할 수 있다.
상기 생성된 제1 단어장은, 선택된 단어에 대한 사전의미정보, 품사정보, 단어원형정보, 상기 문서에 사용된 의미정보 및 문장예문정보, 암기힌트정보, 난이도, 사용빈도 및 학습문제 중 하나 이상의 정보를 제공할 수 있다.
상기 생성된 제1 단어장은, 각 암기대상단어들을 암기할 단어, 아는 단어 또는 학습완료 단어로 구분을 하거나 별도로 저장하여 관리될 수 있다.
상기 문서를 표시하는 단계를 더 포함하되, 상기 표시된 문서에 포함되는 단어 중 상기 선택된 단어장에 들어있는 단어에 대하여 의미정보를 함께 표시할 수 있다.
상기 문서에 대한 검색어를 입력받는 단계, 및 상기 검색어와 매칭되는 문서들을 포함하는 문서리스트를 제공하는 단계를 더 포함하되, 상기 암기할 단어개수, 상기 암기할 단어의 사용비중, 상기 아는 단어개수, 상기 아는 단어의 사용비중, 판매량, 평점순, 출시일 또는 가격에 따라 상기 문서리스트를 정렬할 수 있다.
상기 문서를 표시하는 단계를 더 포함하되, 상기 표시된 문서에 포함되는 단어 중 미리 설정된 예외단어 리스트에 포함되는 단어에 대하여 의미정보 표시가 제외될 수 있다.
상기와 같은 본 발명에 따르면, 유저가 선택한 문서 내 단어를 이용하여 테스트를 진행하고, 해당 유저가 해당 외국어 문서를 읽기에 적합한지 여부를 제시함으로써 유저의 수준에 맞는 적합한 외국어 문서를 선택하도록 할 수 있다.
또한, 선택한 문서에 포함되는 단어 중 유저의 학습이 필요한 단어만을 선택한 최적의 단어장을 생성하여 해당 외국어 문서를 보다 쉽게 읽을 수 있도록 할 수 있다.
또한, 클라이언트 단말장치에 외국어 문서를 표시하는 경우 표시된 부분에 포함되는 단어 중 단어장에 들어있는 단어에 대하여 의미를 함께 표시하여 별도의 검색 없이 쉽게 읽을 수 있도록 할 수 있다.
도 1은 본 발명의 일 실시예에 따른 문서 선택에 따른 가이드라인 제공방법을 개략적으로 나타내는 예시도.
도 2는 본 발명의 일 실시예에 따른 문서 선택에 따른 가이드라인 제공방법에 대한 흐름도.
도 3 내지 도 8은 본 발명의 다른 실시예에 따른 문서 선택에 따른 가이드라인 제공방법에 대한 흐름도.
도 9은 본 발명의 일 실시예에 따른 문서 선택에 따른 가이드라인 제공시스템의 구성도.
도 10은 본 발명의 다른 실시예에 따른 문서 선택에 따른 가이드라인 제공시스템의 구성도.
도 11는 본 발명의 일 실시예에 따른 문서 선택에 따른 가이드라인 제공방법의 데이터 및 정보흐름을 나타내는 예시도.
도 12은 본 발명의 다른 실시예에 따른 문서 선택에 따른 가이드라인 제공방법의 데이터 및 정보흐름을 나타내는 예시도.
도 13은 본 발명의 일 실시예에 따른 문서 선택에 따른 가이드라인 제공방법에 의해 생성된 단어그룹을 개략적으로 나타내는 예시도.
도 14은 본 발명의 다른 실시예에 따른 문서 선택에 따른 가이드라인 제공방법에 의해 클라이언트단말에 표시되는 문서를 나타내는 예시도.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명한다. 본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 게시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 게시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다.
이하, 도면을 참조하여 본 발명의 실시예들에 따른 문서 선택에 따른 가이드라인 제공방법에 대하여 설명하기로 한다.
도 1, 도 2, 도 9 및 도 11을 참조하면, 본 발명의 일 실시예에 따른 문서 선택에 따른 가이드라인 제공방법 도시된다. 각각의 제1언어로 작성된 문서에 포함되는 단어를 추출하여 사용빈도 및 난이도를 산출할 수 있다(S10).
도 1은 본 발명의 일 실시예에 따른 문서 선택에 따른 가이드라인 제공시스템(이하 제공시스템)에 의한 서비스 제공을 위한 연결관계를 나타내며, 도 7은 본 실시예에 따른 상기 제공시스템의 구성도로써 서버(10)로 구현되었다. 그러나 본 발명의 범위가 이에 한정되는 것은 아니다. 예컨대, 상기 제공시스템은 문서 선택에 따른 가이드라인 제공방법에 대한 프로그램을 실행할 수 있는 컴퓨터 시스템으로 구현될 수도 있다.
외국어로 작성된 문서를 선택하여 읽기를 원하는 유저는 클라이언트 단말장치(도시되지 않음)를 사용하여 네트워크를 통해 다양한 외국어 문서가 등록된 서버(10)에 접속할 수 있다. 이하에서는, 외국어 문서가 서버(10)에 등록된 경우를 예로 들어 설명하였으나, 이에 한정되는 것은 아니며 외국어 문서가 클라이언트 단말장치에 저장 및 관리될 수도 있다. 따라서, 별도의 서버(10) 접속 없이 외국어 문서를 클라이언트 단말장치에서 직접 선택하는 형태로 서비스를 제공할 수도 있다.
본 명세서에서 "문서"의 의미는, 텍스트 또는 바이너리 형태의 문서 파일 또는 해당 문서를 이미지화한 텍스트 정보가 포함된 이미지 파일을 모두 포함하는 개념일 수 있다.
상기 서버(10)는 하드웨어적으로는 통상적인 웹 서버(Web Server) 또는 웹 어플리케이션 서버(WebApplication Server) 또는 왑 서버(WAP Server)와 동일한 구성일 수 있으며, 소프트웨어적으로는, C, C++, Java, PHP, .Net, Python, Ruby 등 여하한 언어를 통하여 구현되어 여러 가지 기능을 하는 프로그램 모듈(Module)을 포함할 수 있다.
또한, 서버(10)는, 네트워크를 통하여 컴퓨터, 모바일 단말 등의 클라이언트 단말장치 또는 다른 서버(10)와 연결될 수 있는데, 이에 따라, 서버(10)는 클라이언트 단말장치 또는 다른 서버(10)의 작업수행 요청을 접수하고 그에 대한 작업 결과를 도출하여 제공하는 컴퓨터 시스템 또는 이러한 컴퓨터 시스템을 위하여 설치되어 있는 컴퓨터 소프트웨어(서버 프로그램)를 뜻하는 것일 수도 있다.
또한, 서버(10)는, 전술한 서버 프로그램 이외에도, 서버(10) 상에서 동작하는 일련의 응용 프로그램(Application Program)과, 경우에 따라서는 내부 또는 외부에 구축되어 있는 각종 데이터베이스를 포함하는 넓은 개념으로 이해되어야 할 것이며, 콘텐츠, 각종 정보 및 데이터를 데이터베이스에 저장시키고 관리할 수 있다. 여기서, 데이터베이스는 서버(10)의 내부 또는 외부에 구현될 수 있다.
상기 클라이언트 단말장치는 일반적인 데스크 탑이나 노트북 등의 일반 PC 뿐만 아니라 스마트폰, 태블릿 PC, PDA 등의 모바일단말을 포함하는 컴퓨팅 동작을 수행하는 기계 및 장치를 의미한다.
한편, 네트워크는 서버(10)와 클라이언트 단말장치를 연결해주는 망(Network)으로서, LAN(Local Area Network), WAN(Wide Area Network)등의 폐쇄형 네트워크일 수도 있으나, 인터넷(Internet)과 같은 개방형 네트워크일 수도 있다. 여기서, 인터넷은 TCP/IP 프로토콜 및 그 상위계층에 존재하는 여러 서비스를 제공하는 전 세계적인 개방형 컴퓨터 네트워크 구조를 의미할 수 있으며, 스마트 폰, 태블릿 PC, PDA 및 스마트폰 등의 모바일 단말을 포함하는 경우, 네트워크는 이동 통신망이나 와이파이(WiFi)망 등의 무선 액세스 망을 더 포함할 수도 있다.
먼저, 외국어로 작성된 다양한 문서를 상기 서버(10)에 등록할 수 있다. 앞서 언급한 바와 같이, 외국어로 작성된 다양한 문서는 클라이언트 단말장치에서 저장 및 관리될 수도 있다. 상기 문서에는 전자 문서화된 도서, 논문, 기사를 비롯하여 온라인 또는 오프라인으로 유통되는 소설, 잡지, 전문서적, 시집, 동화, 교육교재, 정기간행물, 신문, 논문, 기사 등을 포함하는 모든 분야의 문서가 포함될 수 있으며, DOC, HWP, ePub, BeBB, AZW, PDF, PPT, XLS, TXT, RTF 등 다양한 포맷의 파일일 수 있다. 또한 상기 문서를 등록하는 경우 상기 문서의 제목, 저자, 발행처, 출시일, 가격, 판매량, 평점 또는 임의적으로 부여되는 기호, 숫자의 집합 등과 같이 문서를 직접 식별하거나 유추하여 알 수 있는 식별정보를 입력할 수 있다. 상기 문서는 상기 식별정보와 연동하여 데이터베이스에 저장하여 관리할 수 있다.
한편, 상기 제1 언어는 상기 문서의 작성에 대표적으로 쓰인 특정한 언어로써, 영어, 일본어, 중국어, 독일어, 프랑스어, 이탈리아어, 아랍어 등 모든 종류의 언어일 수 있다. 예를 들어 전체적으로 영어를 사용하여 작성된 문서의 경우 영어가 상기 제1 언어가 된다.
상기 등록된 문서에 포함되는 단어들을 단어분석모듈(100)에서 추출하여 미리 정해진 난이도 분류방법에 따라 다수의 등급들로 분류하고, 상기 다수의 등급들 각각에 속한 단어들의 상기 문서에서의 사용 횟수인 사용빈도를 산출할 수 있다. 상기 미리 정해진 난이도 분류 방법이라 함은 특정 사전에서 영어 단어들을 사전의 난이도에 따라 분류한 방법일 수 있으며, 상기 미리 정해진 난이도 분류 기준은 상기 데이터베이스에 미리 저장될 수 있다. 그러나 본 발명의 범위가 이에 한정되는 것은 아니며, 상기 제공시스템의 관리자가 임의로 설정한 난이도 분류 기준일 수도 있다. 또한, 시간이 지남에 따라 거의 안 쓰이는 난이도 높은 단어가 거의 모든 이들이 일상생활이나 출판물에 빈번이 사용하기 시작하면 해당 단어는 난이도가 낮아질 수 있다. 이러한 특징을 반영하기 위해서 상기 난이도 분류방법은 상기 제공시스템 관리자가 정기적으로 업데이트되거나 또는 상기 제공시스템이 일정한 주기별로 자동적으로 업데이트할 수도 있다.
또한, 상기 단어분석모듈(100)에서 상기 추출된 단어들에 대하여 상기 다수의 등급들 각각에 대응하는 단어들의 수, 상기 다수의 등급들 각각에 포함되는 단어들의 사용률 및 상기 다수의 등급들 각각에 포함된 단어들의 사용 횟수 정보를 포함하는 단어 사용 현황정보를 제공할 수도 있다.
상기 문서에 포함되는 단어들의 상기 난이도 및 상기 사용빈도는 상기 문서의 식별정보와 연동하여 상기 데이터베이스에 저장될 수 있으며, 상기 송수신모듈(130)을 통하여 클라이언트 단말장치로 제공될 수 있다.
앞서 설명한 바와 같이, 외국어로 작성된 다양한 문서는 클라이언트 단말장치에서 저장 및 관리되는 경우에는, 단어분석모듈(100)이 서버(10)에 구비되지 않고, 클라이언트 단말장치 내에 배치될 수도 있다. 이러한 경우에는, 단어분석모듈(100) 내에서 단어 분석 작업을 수행함에 있어서, 서버(10)와의 통신이 생략될 수도 있다.
이어서, 상기 문서를 포함하는 문서리스트를 제공할 수 있다(S20). 디스플레이모듈(120)에서 상기 서버(10)에 접속하는 클라이언트 단말장치의 화면에 상기 등록된 문서를 선택할 수 있도록 리스트 또는 아이콘 방식의 플랫폼 형태로 제공할 수 있으나, 이에 한정되는 것은 아니며, 문서가 클라이언트 단말장치에 저장 및 관리되는 경우에는, 서버(10)에 접속하지 않고 클라이언트 단말장치에서 직접 문서리스트를 생성할 수도 있다. 이러한 경우, 디스플레이모듈(120)은 클라이언트 측에 구비되어, 서비스를 제공할 수 있다. 상기 플랫폼은 html, Css, javaScript, Visualbasic Script, PHP, JSP, ASP, ASP.net, Document Object Model, CGI, SVG, Canvas API, Flash, Shockwave, Java 등 다양한 언어, 플러그인, 그래픽 기술로 구현할 수 있다. 한편, 서비스에 접근한 유저의 식별정보를 수신하여 데이터베이스에 저장할 수 있으며, 해당 식별정보는 유저를 직접 식별하거나 유추하여 알 수 있는 정보로써, 이름, 아이디, 비밀번호, 나이, 성별, 주소, 전화번호, 이메일 주소, SNS 주소, 홈페이지 주소, 신용카드 번호, 주민등록번호 또는 임의적으로 부여되는 기호, 숫자의 집합일 수 있다.
이에 따라, 유저가 상기 리스트 또는 아이콘을 통해 특정 문서를 선택하는 경우 상기 선택된 문서의 정보를 클라이언트 단말장치에서 직접 제공하거나 서버(10)로부터 수신할 수 있다(S30).
한편, 상기 선택된 문서가 유저에게 읽기에 적합한지 여부를 판단하기 위하여, 상기 선택된 문서에 포함되는 단어 중 상기 난이도 및 상기 사용빈도를 기초로 테스트 단어를 표시할 수 있다(S40).
상기 서버(10)에 구비되거나 또는 클라이언트 단말장치 내에 구비된 테스트모듈(110)에서 상기 선택된 문서에 포함되는 제1 언어로 된 단어 중 상기 난이도가 낮은 또는 높은 순서에 따라 테스트단어를 선별하거나 또는 상기 사용빈도가 낮은 또는 높은 순서에 따라 선별하면 상기 디스플레이모듈(120)을 통해 클라이언트 단말장치에 표시할 수 있다. 또한 상기 테스트단어를 상기 각 난이도별로 임의의 수만큼 선별하여 표시할 수 있다. 그러나 본 발명의 범위가 이에 한정되는 것은 아니며, 상기 제공시스템의 관리자가 임의로 설정한 선별 기준에 따라 테스트단어를 선별할 수도 있다. 또한, 상기 선별된 테스트단어가 상기 선택된 문서에서 실제로 적용된 문장을 추출하여 상기 추출된 문장 자체를 테스트단어로 할 수 있다.
이에 대해 유저는 상기 클라이언트 단말장치에 표시된 테스트단어에 대한 의미를 제2 언어로 입력할 수 있다. 유저가 의미정보를 직접 입력할 수 있으며, 복수의 보기 중에서 어느 하나를 선택하여 입력할 수 있다. 제2 언어는 유저가 문서의 제1 언어를 다른 언어로 해석하고자 하는 대상이 되는 언어로써, 영어, 일본어, 중국어, 독일어, 일본어, 프랑스어, 이탈리아어, 아랍어 등 모든 종류의 언어일 수 있다. 예를 들어 영어로 작성된 문서를 한국어로 해석하여 읽기 원하는 사람의 경우 영어 단어로 이루어진 테스트단어에 한국어로 의미를 입력할 수 있다. 이 경우에 영어가 상기 제1 언어가 되며 한국어가 상기 제2 언어가 된다.
상기 클라이언트 단말장치를 통해 입력된 의미정보를 상기 서버(10)에서 수신할 수 있으며, 상기 테스트모듈(110)에서 상기 수신된 제2 언어로 입력된 상기 테스트단어의 의미정보가 사전에 정의된 의미와 일치하는지 여부를 판단할 수 있다. 상기 테스트모듈(110)에서 상기 제공시스템 관리자가 상기 테스트단어에 대한 정확한 의미를 미리 입력하여 저장한 데이데베이스를 이용하여 비교하거나 또는 사전을 검색하거나 언어를 번역할 수 있는 다른 검색 서버(10), 번역 서버(10) 및 라이브러리에 상기 테스트단어의 의미정보를 요청하여 비교할 수 있다.
몇몇 다른 실시예에서, 클라이언트 단말장치는 테스트모듈(110)을 구비하여, 입력된 의미정보를 직접 클라이언트 단말장치 내에서 사전 정의된 의미와 일치하는지 여부를 판단할 수 있다.
또한, 상기 테스트모듈(110)에서 상기 일치 여부 판단을 기초로 해당 유저가 상기 테스트단어의 의미를 정확하게 입력한 정답수를 산출할 수 있으며, 정답수를 기초로 테스트결과를 산출할 수 있다. 상기 테스트단어의 사용빈도 또는 난이도에 따라 임의의 가중치를 부여하여 각각의 테스트단어에 대한 점수를 설정한 후 의미를 정확하게 입력한 테스트단어들의 점수를 모두 합산한 값을 테스트결과로 할 수 있다. 그러나 본 발명의 범위가 이에 한정되는 것은 아니며, 상기 제공시스템의 관리자가 설정한 다양한 기준에 따라 테스트결과를 산정할 수 있다.
테스트단어에 대한 테스트결과를 기초로 유저에게 선택된 문서에 대한 적합도를 제공할 수 있다(S50). 상기 적합도는 상기 유저가 상기 선택된 문서를 읽기에 상기 제1 언어에 대한 학습수준이 충분한지 여부에 관한 것으로써, 상기 테스트모듈(110)에서 상기 테스트결과가 임의의 점수 또는 비율 이상인 경우 상기 유저가 상기 선택된 문서를 읽기에 상기 제1 언어에 대한 학습수준이 충분하다는 '적합' 판정을 할 수 있으며, 상기 테스트결과가 상기 임의의 점수 또는 비율 이하인 경우 상기 유저가 상기 선택된 문서를 읽기에 상기 제1 언어에 대한 학습수준이 불충분하다는 '부적합' 판정을 할 수 있다. 상기 판정에 따라 송수신모듈(130)을 통해 클라이언트의 단말장치에 상기 '적합' 또는 '부적합' 하다는 적합도 메시지를 송신할 수 있으며, 이때, 상기 테스트단어의 의미정보 일치 여부 및 정확한 의미정보를 포함하는 테스트결과를 함께 전송할 수 있다.
이와 같이 유저가 선택한 문서에 포함되는 단어를 테스트에 직접 사용하여 유저에 의해 선택된 문서가 유저의 수준에 맞는지 정확하게 판단할 수 있으며, 이를 통해 유저의 효율적인 문서 선택을 지원할 수 있다.
도 3을 참조하면, 본 발명의 다른 실시예로서, 상기 유저에게 상기 선택된 문서에 포함되며 상기 테스트단어와 중복되지 않는 다른 테스트단어를 사용하여 테스트할지 여부를 문의할 수 있다(S51).
상기 테스트단어에 따라 상기 테스트결과가 달라질 수 있으며, 이에 따라 같은 문서에 대한 유저의 적합도가 변경될 수 있기 때문에, 상기 적합도의 신뢰성을 높이기 위하여 상기 선택된 문서에 포함되는 단어 중 상기 테스트단어로 사용되지 않은 다른 테스트단어를 사용하여 상기 테스트를 재실시할지 여부를 상기 유저에게 문의할 수 있다.
유저가 상기 테스트의 재실시에 응하는 경우, 상기 테스트모듈(110)에서 상기 선택된 문서에 포함되는 제1 언어로 된 단어 중 기존에 선별된 상기 테스트단어를 제외하고, 상기 난이도가 낮은 또는 높은 순서에 따라 다른 테스트단어를 선별하거나 또는 상기 사용빈도가 낮은 또는 높은 순서에 따라 다른 테스트단어를 선별하면 상기 디스플레이모듈(120)에서 상기 클라이언트 단말장치에 상기 선별된 다른 테스트단어를 표시할 수 있다(S52). 또한 상기 다른 테스트단어를 상기 각 난이도별로 임의의 수만큼 선별하여 표시할 수 있다. 그러나 본 발명의 범위가 이에 한정되는 것은 아니며, 상기 제공시스템의 관리자가 임의로 설정한 선별 기준에 따라 상기 다른 테스트단어를 선별할 수도 있다.
상기 재실시 테스트결과와 기존의 테스트결과를 기초로 상기 유저에게 상기 선택된 문서에 대한 적합도를 제공할 수 있다(S53). 상기 유저로부터 상기 다른 테스트단어에 대한 의미정보 수신하여 일치여부 확인, 상기 다른 테스트단어에 대한 정답수 산출 및 재실시 테스트결과의 산출 방법은 기존의 상기 테스트단어에 대한 일치여부 확인, 상기 테스트단어에 대한 정답수 산출 및 상기 테스트결과 산출 방법과 동일하다.
상기 테스트모듈(110)에서 상기 재실시 테스트결과를 기초로 기존의 상기 적합도 판단방법에 따라 상기 클라이언트에게 적합도를 제공할 수 있으며, 상기 재실시 테스트결과와 기존의 상기 테스트결과를 합산하여 평균값을 산출하여 이를 기초로 상기 적합도 판단방법에 따라 상기 유저에게 적합도를 제공할 수 있다.
또한, 유저의 선택에 의해 계속해서 상기 선택된 문서에 포함되는 또 다른 테스트단어를 사용해서 상기 적합도 테스트를 진행할 수 있다. 이러한 과정을 통해 상기 적합도에 대한 신뢰성을 향상시킬 수 있으며, 상기 유저의 경우 상기 선택된 문서에 포함되는 단어들을 학습해 나갈 수 있다.
또한, 본 발명의 또 다른 실시예로서, 상기 테스트결과는, 상기 테스트단어의 상기 난이도별로 그룹하여 산출할 수 있다.
상기 테스트모듈(110)에서 상기 테스트에 사용된 상기 테스트단어를 상기 난이도에 따라 분류하여 그룹화할 수 있다. 이를 기초로 상기 난이도 그룹별로 각각 상기 유저에게 표시된 테스트단어의 총 문제수 또는 상기 테스트단어에 설정된 점수의 총점을 산출할 수 있다. 또한, 상기 난이도 그룹별로 각각 상기 유저가 상기 테스트단어의 의미정보를 정확하게 입력하여 얻은 총 정답수 또는 정답점수를 산출할 수 있다.
상기 산출된 총 문제수, 총점, 총 정답수 또는 총 정답점수를 기초로 상기 유저에게 상기 적합도와 함께 학습단어정보를 제공할 수 있다. 상기 학습단어정보는 상기 유저가 상기 선택된 문서를 수월하게 읽기 위하여 학습해야 하는 학습단어를 추천하기 위한 정보로써, 상기 학습단어정보에는 상기 단어 사용 현황 정보, 학습단어의 개수, 학습단어 리스트, 학습단어 의미정보 또는 추천메시지 중 어느 하나 이상의 정보가 포함될 수 있다.
상기 난이도별로 각각 상기 총 문제수와 상기 총 정답수를 비교하여 임의의 정답 개수 또는 임의의 정답 비율 이하거나 또는 상기 난이도별로 각각 상기 총점과 상기 총 정답점수를 비교하여 임의의 정답 점수 또는 임의의 정답 비율 이하인 난이도를 상기 유저가 상기 선택된 문서를 수월하게 읽기 위하여 학습이 필요한 학습난이도로 산출할 수 있다.
이에 따라, 단어분석모듈(100)에서 상기 테스트모듈(110)과 연동하여 상기 선택된 문서에 포함되는 단어 중 상기 학습난이도에 해당하는 단어 또는 상기 학습난이도를 포함하여 상기 학습난이도보다 높은 난이도에 해당하는 모든 단어를 기초로 학습단어를 산출할 수 있다. 한편, 상기 학습난이도가 복수로 산출된 경우 상기 복수의 학습난이도 중에서 가장 낮은 등급의 학습난이도를 기초로 하여 학습단어를 산출하는 것이 바람직하나, 이에 한정되는 것은 아니며, 상기 복수의 학습난이도 중에서 가장 높은 등급 또는 상기 제공시스템의 관리가 설정한 임의의 기준에 따른 등급의 학습난이도를 기초로 하여 학습단어를 산출할 수 있다.
상기 학습난이도에 포함되는 모든 단어를 학습단어로 산출하거나 또는 상기 학습난이도에 포함되는 단어 중 일정한 사용빈도 이상인 단어를 학습단어로 산출할 수 있다. 또한, 상기 산출된 학습단어 중 상기 테스트결과에 기초하여 상기 유저가 정확하게 의미정보를 입력한 테스트단어를 제외한 나머지 단어를 학습단어로 산출할 수 있다. 이와 같이 산출된 학습단어를 기초로 상기 단어 사용 현황 정보, 학습단어 개수, 학습단어 난이도, 학습단어에 대한 리스트, 학습단어 의미정보, 학습단어 품사정보 또는 추천메시지 중 어느 하나 이상의 정보를 포함하는 학습단어정보를 생성할 수 있다.
예를 들어 산출된 학습단어 개수가 200개인 경우 상기 유저에게 200개 단어만 학습하면 상기 선택한 문서를 읽을 수 있다는 메시지와 함께 산출된 학습단어에 대한 리스트를 제공할 수 있으며, 이를 통해 상기 유저의 효율적인 문서 선택을 지원하고, 문서를 읽기 위한 필요 학습량 정보를 제공할 수 있다.
한편, 상기 학습단어에 대한 리스트를 제공하는 경우, 유저가 상기 리스트에서 임의의 학습단어를 암기대상단어로 선택하도록 할 수 있으며, 유저가 암기대상단어를 선택하는 경우 단어장제공모듈(140)에서 상기 선택된 암기대상단어정보를 수신하여 테이블이나 표 형태, 학습을 용이하게 할 수 있는 학습카드 형태이거나 상기 제공시스템 관리자가 임의로 설정한 다른 형태로 단어장을 생성할 수 있다. 상기 암기대상단어는 상기 유저에게 제공된 단어 리스트 중에서 상기 유저가 선택한 단어로써, 상기 유저가 모르는 단어이거나 또는 정확한 의미를 알고 싶어하는 단어를 의미한다.
몇몇 다른 실시예에서, 단어장제공모듈(140)은 서버가 아닌 클라이언트 단말장치에 구비되어, 서버와의 접속 없이도 단어장 서비스가 가능하도록 구성될 수도 있다.
도 1, 도 4 내지 도 6, 도 10 및 도 12 내지 도 14를 참조하면, 본 발명의 또 다른 실시예로서, 상기 제1 언어로 작성된 문서 중 제1 문서에 포함되는 단어를 추출하여 사용빈도 및 난이도를 산출할 수 있다(S100).
도 10은 본 실시예에에 따른 제공시스템의 구성도로써 서버(10)로 구현되는 예를 제시하였으나, 이에 한정되는 것은 아니며, 상기 제공시스템은 클라이언트 단말장치 내에서 독립적으로 구현될 수도 있으며, 상기 제공시스템은 문서 선택에 따른 가이드라인 제공방법에 대한 프로그램을 실행할 수 있는 컴퓨터 시스템으로 구현될 수도 있다.
외국어로 작성된 문서를 선택하여 읽기를 원하는 유저는 클라이언트 단말장치를 사용하여 네트워크를 통해 상기 서버(10)에 접속하거나, 클라이언트 단말장치 내에 설치되어 있는 프로그램이나 어플리케이션 또는 웹사이트에 접속하여 해당 문서에 접근할 수 있다.
상기 서버(10), 네트워크, 클라이언트 단말장치는 앞서 상술한 바와 동일하다.
먼저, 외국어로 작성된 다양한 문서를 상기 서버(10) 또는 클라이언트 단말장치에 등록할 수 있다. 상기 문서에는 전자 문서화된 도서, 논문, 기사를 비롯하여 온라인 또는 오프라인으로 유통되는 소설, 잡지, 전문서적, 시집, 동화, 교육교재, 정기간행물, 신문, 논문, 기사 등을 포함하는 모든 분야의 문서가 포함될 수 있으며, DOC, HWP, ePub, BeBB, AZW, PDF, PPT, XLS, TXT, RTF 등 다양한 포맷의 파일일 수 있다. 또한 상기 문서를 등록하는 경우 상기 문서의 제목, 저자, 발행처, 발행일자, 가격 또는 임의적으로 부여되는 기호, 숫자의 집합 등과 같이 문서를 직접 식별하거나 유추하여 알 수 있는 식별정보를 입력할 수 있다. 상기 문서는 상기 식별정보와 연동하여 데이터베이스에 저장하여 관리할 수 있다.
한편, 상기 제1 언어는 상기 문서의 작성에 대표적으로 쓰인 특정한 언어로써, 영어, 일본어, 중국어, 독일어, 일본어, 프랑스어, 이탈리아어, 아랍어 등 모든 종류의 언어일 수 있다. 예를 들어 전체적으로 영어를 사용하여 작성된 문서의 경우 영어가 상기 제1 언어가 된다.
상기 등록된 문서에 포함되는 단어들을 단어분석모듈(100)에서 미리 정해진 난이도 분류방법에 따라 다수의 등급들로 분류하고, 상기 다수의 등급들 각각에 속한 단어들의 상기 문서에서의 사용 횟수인 사용빈도를 산출할 수 있다. 상기 미리 정해진 난이도 분류 방법이라 함은 특정 사전에서 영어 단어들을 사전의 난이도에 따라 분류한 방법일 수 있으며, 상기 미리 정해진 난이도 분류 방법은 상기 데이터베이스에 미리 저장될 수 있다. 그러나 본 발명의 범위가 이에 한정되는 것은 아니며, 상기 제공시스템의 관리자가 임의로 설정한 난이도 분류 방법일 수 있다. 또한, 시간이 지남에 따라 거의 안 쓰이는 난이도 높은 단어가 거의 모든 이들이 일상생활이나 출판물에 빈번이 사용하기 시작하면 해당 단어는 난이도가 낮아질 수 있다. 이러한 특징을 반영하기 위해서 상기 난이도 분류방법은 상기 제공시스템 관리자가 정기적으로 업데이트되거나 또는 상기 제공시스템이 일정한 주기별로 자동적으로 업데이트해 나갈 수도 있다.
또한, 상기 단어분석모듈(100)에서 상기 추출된 단어들에 대하여 상기 다수의 등급들 각각에 대응하는 단어들의 수, 상기 다수의 등급들 각각에 포함되는 단어들의 사용률 및 상기 다수의 등급들 각각에 포함된 단어들의 사용 횟수 정보를 포함하는 단어 사용 현황정보를 제공할 수도 있다.
상기 문서에 포함되는 단어들의 상기 난이도 및 상기 사용빈도는 상기 문서의 식별정보와 연동하여 저장 및 관리될 수 있으며, 상기 송수신모듈(130)을 통하여 클라이언트 단말장치로 제공될 수 있다.
또한, 상기 문서를 포함하는 문서리스트를 제공할 수 있다. 클라이언트 단말장치의 화면에 상기 등록된 문서를 선택할 수 있도록 리스트 또는 아이콘 방식의 플랫폼 형태로 표시 할 수 있다. 상기 플랫폼은 html, Css, javaScript, Visualbasic Script, PHP, JSP, ASP, ASP.net, Document Object Model, CGI, SVG, Canvas API, Flash, Shockwave, Java 등 다양한 언어, 플러그인, 그래픽 기술로 구현할 수 있다.
이에 따라, 유저가 상기 리스트 또는 아이콘을 통해 제1 문서를 선택하는 경우 상기 제1 문서의 정보를 확인할 수 있다.
한편, 상기 제1 문서를 선택하였다는 정보를 수신하는 경우, 단어장 제공모듈(140)에서 상기 제1 문서에 포함되는 단어들 중 상기 단어분석모듈(100)을 통해 산출된 상기 난이도 또는 사용빈도를 기초로 일정이상의 난이도 또는 사용빈도를 가지는 단어그룹을 추출할 수 있다(S110). 도 13은 본 실시예에 따른 단어그룹의 일 형태를 예시한 것이며, 상기 일정이상의 난이도 또는 사용빈도는 상기 제공시스템의 관리자가 임의로 설정할 수 있으며, 상기 유저로부터 설정정보를 제공받을 수 있다. 예를 들어 상기 관리자 또는 상기 유저가 상기 사용빈도를 '2'로 설정하는 경우 상기 제1 문서에 포함되는 단어 중 사용횟수가 두 번 이상인 단어들이 추출될 수 있으며, 대학생 이상을 대상으로 하는 원서의 경우 초, 중, 고 수준의 난이도에 해당하는 단어그룹을 제외하고 추출될 수 있도록 할 수 있다.
상기 단어그룹 중 암기대상단어정보를 유저로부터 수신할 수 있다(S120). 디스플레이모듈(120)에서 상기 추출된 단어그룹에 포함되는 단어 리스트를 상기 클라이언트 단말장치에 표시할 수 있으며, 이에 따라, 유저는 상기 클라이언트 단말장치에 표시된 단어 리스트에서 암기대상단어를 선택할 수 있다. 상기 암기대상단어는 상기 리스트 된 단어 중에서 상기 유저가 선택한 단어로써, 모르는 단어이거나 또는 정확한 의미를 알고 싶어하는 단어를 의미할 수 있다.
상기 암기대상단어정보로부터 제1 단어장을 생성할 수 있다(S130). 상기 단어장제공모듈(140)에서 상기 유저가 선택한 암기대상단어정보를 기초로 상기 유저에게 제1 단어장을 생성하여 유저에게 제공할 수 있다. 상기 제1 단어장은 상기 제1 문서에 포함되는 단어들에 대한 단어장을 의미할 수 있으며, 상기 유저가 선택한 암기대상단어들을 테이블이나 표형태로 상기 클라이언트 단말장치에 표시할 수 있다.
한편, 상기 생성된 제1 단어장에 상기 암기대상단어 이외의 임의의 단어를 상기 클라이언트 단말장치가 직접 업로드하여 등록할 수 있으며, 상기 제1 단어장에 포함된 특정 단어를 선택하여 삭제하거나 또는 다른 단어장으로 이동시킬 수 있다.
본 발명의 또 다른 실시예로서, 상기 사용빈도 및 난이도를 산출하는 단계는, 상기 제1 문서에 포함되는 단어를 기초로 제1학습단어정보를 제공할 수 있다. 상기 제1학습단어정보는 유저가 상기 제1 문서를 수월하게 읽기 위하여 학습해야 하는 학습단어를 추천하기 위한 정보로써, 상기 제1학습단어정보에는 상기 단어 사용 현황정보, 학습단어의 개수, 학습단어 리스트, 학습예상시간 또는 추천메시지 중 어느 하나 이상의 정보가 포함될 수 있다.
상기 제1 문서가 선택되었다는 정보를 감지되는 경우, 상기 단어분석모듈(100)에서 상기 제1 문서에 포함되는 단어 중 미리 정해진 학습단어추출기준에 따라 학습단어를 추출할 수 있다. 상기 미리 정해진 학습단어추출기준이라 함은 특정 난이도 또는 사용빈도일 수 있으며, 특정한 단어장, 데이터베이스 또는 태그정보에 포함되는 단어일 수 있다. 상기 제1 문서에 포함되는 단어들 중 상기 단어분석모듈(100)을 통해 산출된 상기 난이도 또는 사용빈도를 기초로 특정한 난이도 또는 사용빈도를 가지는 단어를 학습단어로 추출하거나 또는 일정 이상 또는 이하의 난이도 또는 사용빈도를 가지는 단어를 학습단어로 추출할 수 있다. 또한 상기 제1 문서에 포함되는 단어들 중 상기 유저로부터 생성된 임의의 단어장, 데이터베이스 또는 태그정보에 포함되는 단어를 제외하거나 추가하도록 하여 학습단어를 추출할 수 있다. 상기 학습단어추출기준은 상기 데이터베이스에 미리 저장될 수 있다.
예를 들어 클라이언트가 대학생 이상을 대상으로 하는 원서를 선택하는 경우 초, 중, 고 수준의 난이도에 해당하는 단어를 학습단어에서 제외할 수 있으며, 문서 내 사용빈도가 2이하로 낮은 단어들을 학습단어에 제외할 수 있다. 또한, 상기 단어들의 사용빈도가 높은 순서에 따라 상기 사용빈도를 누적시키는 누적사용비중을 계산할 수 있으며, 상기 누적사용비중이 일정이상의 값에 이르는 경우 상기 누적사용비중에 포함되지 않은 단어들을 학습단어에서 제외할 수 도 있다.
또한, 상기 유저가 아는 단어 또는 학습을 통해 익힌 학습완료단어들을 별도로 저장하거나 특정 태그정보를 입력하여 관리하는 경우 해당 단어들을 제외하도록 하여 학습단어를 추출할 수 있다. 그러나 본 발명의 범위가 이에 한정되는 것은 아니며, 상기 학습단어추출기준은 유저에게 보다 효율적인 학습정보를 제공하기 위해 다양한 기준에 따라 추출될 수 있다.
한편, 상기 추출된 학습단어의 난이도 및 개수를 기준으로 상기 학습단어들을 학습하기 위한 예상 시간인 학습예상시간을 산출하여 제공할 수 있다. 상기 단어분석모듈(100)에서 상기 추출된 학습단어를 기초로 상기 난이도별로 그룹하여 개수를 산출하고, 미리 정해진 단어의 난이도별 학습예상시간 또는 상기 유저의 실제 학습 히스토리로부터 추정되는 학습예상시간에 상기 산출된 개수를 곱한 값을 모두 합하여, 상기 추출된 학습단어들을 모두 학습하기 위한 총 예상 시간을 산출할 수 있다. 상기 미리 정해진 단어의 난이도별 학습예상시간은 상기 제공시스템의 관리자가 임의로 설정할 수 있으며 데이터베이스에 미리 저장될 수 있다.
이와 같이 추출된 학습단어를 기초로 상기 단어 사용 현황 정보, 학습단어 개수, 학습단어 난이도, 학습단어에 대한 리스트, 학습예상시간 또는 추천메시지 중 어느 하나 이상의 정보를 포함하는 제1문서에 대한 제1학습단어정보를 생성하여 상기 클라이언트 단말장치에 제공할 수 있다.
이를 통해 유저에게 문서를 수월하게 읽기 위한 학습량에 대한 정보를 제공하여 유저가 보다 효율적으로 학습 및 수준에 맞는 문서를 선택하도록 지원할 수 있다.
한편, 상기 클라이언트 단말장치에 상기 학습단어에 대한 리스트를 제공하는 경우 상기 유저는 상기 학습단어에 대한 리스트에서 암기대상단어를 선택할 수 있으며, 선택된 암기대상단어들을 기초로 단어장을 생성하도록 할 수 있다.
본 발명의 또 다른 실시예로서, 상기 단어그룹을 추출하는 단계는, 상기 추출된 단어의 사용빈도, 난이도, 사용형태정보, 품사정보, 단어원형정보, 학습완료시간 중 어느 하나 이상의 정보를 포함할 수 있다. 상기 단어분석모듈(100)에서 상기 제1문서에 포함되는 단어의 리스트를 제공하는 경우 상기 리스트에 포함되는 각 단어들을 분석하여 정보를 제공할 수 있다. 상기 리스트에 포함되는 각 단어들의 사용빈도, 난이도 및 상기 리스트에 포함되는 각 단어들이 상기 제1 문서의 문장 내에서 실제로 적용된 모습인 사용형태정보, 상기 리스트에 포함되는 각 단어들의 품사정보, 단어원형정보를 포함할 수 있다. 또한 상기 리스트에 포함되는 각 단어 중 상기 유저가 다른 단어장을 통해 학습을 완료한 단어의 경우에는 학습완료시간정보가 포함될 수 있다. 이에 따라 상기 유저는 상기 단어 리스트를 상기 사용빈도 또는 상기 난이도가 높은 또는 낮은 순서대로 차례로 정렬할 수 있고, 임의의 사용빈도, 난이도, 품사정보 또는 단어원형정보를 가지는 단어들만 표시하도록 필터링 할 수 있으며, 학습완료시간으로부터 임의의 경과시간 이상의 단어들만 표시하도록 필터링 할 수 있다.
이를 위해서, 상기 단어분석모듈(100)에서 미리 정해진 난이도 분류 방법, 품사 분류 방법 또는 단어원형 분류 방법에 따라 상기 각 단어들의 등급, 품사 또는 단어원형을 정하여 분류할 수 있으며, 상기 등급, 품사 또는 단어원형에 속한 단어들이 상기 문서에서 사용된 횟수인 사용빈도를 산출할 수 있다. 상기 미리 정해진 난이도 분류 방법, 품사 분류 방법 또는 단어원형 분류 방법이라 함은 특정 사전에서 영어 단어들을 사전의 난이도, 품사, 또는 단어원형에 따라 분류한 방법일 수 있으며, 상기 미리 정해진 난이도, 품사 또는 단어원형 분류 방법은 상기 데이터베이스에 미리 저장될 수 있다. 그러나 본 발명의 범위가 이에 한정되는 것은 아니며, 상기 제공시스템의 관리자가 임의로 설정한 난이도, 품사 또는 단어원형 분류 방법일 수도 있다. 상기 학습완료시간 및 경과시간은 대한 자세한 설명은 후술한다.
본 발명의 또 다른 실시예로서, 상기 유저가 상기 생성된 제1 단어장에서 상기 암기대상단어 중 어느 하나를 선택하는 경우 상기 선택된 암기대상단어의 사전적 의미정보를 비롯하여 단어원형정보, 품사정보, 상기 제1 문서에서 사용된 의미정보 및 상기 제1 문서에서 사용된 문장을 기초로 한 문장예문정보, 암기힌트정보, 난이도, 사용빈도 또는 학습문제 중 어느 하나 이상의 정보를 별도의 서브창을 띄어 표시할 수 있다. 상기 학습문제는 상기 제1 단어장에 포함되는 상기 각 암기대상단어들을 상기 유저가 학습을 완료했는지 테스트하기 것으로써, 상기 암기대상단어에 대한 의미를 상기 유저가 직접 입력하거나 또는 복수의 선택지 중 어느 하나를 선택할 수 있도록, 상기 암기대상단어에 대한 주관식 또는 객관식 형태의 단어문제를 상기 클라이언트 단말장치에서 제공할 수 있다. 상기 학습문제를 통해 정답이 입력된 암기대상단어는 상기 유저가 학습을 완료한 것으로 할 수 있다. 그러나 본 발명의 범위가 이에 한정되는 것은 아니며, 상기 제1 단어장에는 상기 암기대상단어를 보다 쉽게 암기하고 학습할 수 있도록 하는 다양한 학습기능을 추가로 제공할 수 있다.
또한, 상기 제1 단어장은 상기 유저에 의해 상기 각 암기대상단어들을 암기할 단어, 아는 단어 또는 학습완료 단어로 구분하거나, 상기 암기할 단어, 아는 단어 또는 학습완료 단어를 대상으로 별도의 단어장을 생성하거나 또는 별도의 데이터베이스에 저장하여 관리할 수 있다.
상기 제1 단어장이 생성된 후 향후 유저의 학습에 따른 성과 측정, 효율적인 학습 및 지속적인 관리를 위하여 상기 제1 단어장에 포함되어 있는 암기대상단어들을 상기 유저가 암기할 단어 또는 아는 단어로 체크하여 분류할 수 있다. 또한, 상기 학습문제를 통해 정답이 입력된 암기대상단어를 학습완료 단어로 분류할 수 있다. 이때, 상기 분류된 암기한 단어, 아는 단어 또는 학습완료 단어들에 각각 태그정보를 붙여 상기 태그정보에 따라 정렬 및 필터링 하도록 할 수 있으며, 상기 암기할 단어, 아는 단어 또는 학습완료 단어를 대상으로 별도의 단어장을 생성할 수 있으며, 상기 암기할 단어, 아는 단어 또는 학습완료 단어를 다른 단어장으로 이동시킬 수 있다.
또한, 상기 암기할 단어, 아는 단어 또는 학습완료 단어를 상기 유저의 식별정보와 연동하여 별도의 데이터베이스에 저장할 수 있으며, 상기 학습완료 단어의 경우 상기 학습문제를 통해 테스트를 통과한 시간을 학습완료시간으로 하여 함께 저장할 수 있다.
또한, 상기 제1 문서에 포함되는 단어를 추출하여 사용빈도 및 난이도를 산출하고, 이를 기초로 테스트단어를 선별하여 상기 유저에게 제공해 상기 유저가 상기 제1 문서를 읽기에 적합한지에 대한 적합도 테스트를 할 수 있다. 이 때, 상기 테스트단어 중 정답이 입력된 단어의 경우 상기 아는 단어로 분류할 수 있다. 상기 사용빈도 및 난이도 산출 방법, 테스트단어 선별방법, 적합도 테스트 방법은 앞서 상술한 바와 같다. 그러나 본 발명의 범위가 이에 한정되는 것은 아니며, 상기 암기할 단어, 아는 단어 또는 학습완료 단어 이외에 의미가 혼동되는 단어, 핵심 단어 등과 같이 상기 암기대상단어를 다양하게 분류할 수 있으며, 상기 암기대상단어 이외에 상기 유저가 별도의 단어들을 직접 업로드하여 분류 또는 저장할 수 있다.
이를 통해 유저가 상기 제1 문서를 읽기에 보다 최적화된 단어장을 제공할 수 있으며, 상기 제1 문서에 상관없이 유저 개별적으로 제1 언어와 관련된 통합적인 단어장 또는 데이터베이스를 생성하여 관리할 수 있다.
또한, 상기 유저가 상기 제1 언어로 작성된 다른 문서를 선택하여 상기 다른 문서에 대한 단어장을 생성하는 경우 상기 아는 단어 또는 학습완료 단어에 포함되는 단어를 제외하도록 필터링할 수 있다.
상기 다른 문서에 대한 단어장을 생성하기 위하여, 상기 다른 문서에 포함되는 단어에 대한 리스트를 상기 유저에게 제공하거나 또는 상기 유저로부터 암기대상단어정보를 수신하여 상기 다른 문서에 대한 단어장을 생성하는 경우, 상기 다른 문서에 포함되는 단어에 대한 리스트 또는 상기 암기대상단어정보에 포함되는 단어를 상기 아는 단어 또는 상기 학습완료 단어에 대한 단어장 또는 데이터베이스에 포함되는 단어와 비교하여 일치하는 단어를 제외하도록 필터링할 수 있다.
이를 통해 상기 유저에게 불필요한 단어정보를 제외하고 필요한 단어정보만을 선별하여 제공할 수 있다.
한편, 상기 학습완료 단어를 기초로 상기 다른 문서에 포함되는 단어에 대한 리스트 또는 상기 암기대상단어정보에 포함되는 단어를 필터링하는 경우, 상기 학습완료 단어의 상기 학습완료시간으로부터 상기 필터링을 하는 시간까지의 경과일을 각각 산출하고, 상기 경과일이 임의의 기간 이하인 학습완료 단어의 경우 상기 필터링에서 필터링되어 제외될 수 있다. 상기 임의의 기간은 상기 유저 또는 상기 제공시스템 관리자가 일, 주, 월, 년 단위로 설정할 수 있다. 이를 통해 학습완료시간이 오래되어 잊을 수 있는 단어들을 상기 단어장에 포함시켜 재학습을 시킬 수 있으며, 상기 유저의 제1 언어 수준에 보다 최적화된 단어들을 단어장으로 제공할 수 있다.
도 8을 참조하면, 본 발명의 또 다른 실시예로서, 상기 유저로부터 상기 문서에 대한 검색어를 입력 받을 수 있다(S140). 상기 서버(10)의 검색모듈(150)에서 상기 유저에게 상기 서버(10)에 등록된 문서 중 적어도 어느 하나를 검색할 수 있는 검색입력창을 제공할 수 있으며, 상기 유저는 상기 클라이언트 단말장치를 통해 검색어를 입력할 수 있다.
상기 유저로부터 검색어정보를 수신하는 경우 상기 검색모듈(150)에서 상기 데이터베이스에 저장된 문서, 각 문서의 식별정보와 비교하여 상기 검색어와 매칭되는 문서들을 선별할 수 있으며, 상기 디스플레이모듈(120)에서 상기 유저의 단말장치의 화면에 상기 매칭되는 문서들을 리스트 또는 아이콘 방식으로 표시할 수 있다.
이 때, 상기 문서의 리스트 또는 아이콘을 상기 암기할 단어개수, 상기 암기할 단어의 사용비중, 상기 아는 단어개수, 상기 아는 단어의 사용비중, 판매량, 평점순, 출시일 또는 가격에 따라 정렬할 수 있다. 상기 단어분석모듈(100)에서 상기 각 문서별로 상기 데이터베이스에 저장된 상기 유저의 암기할 단어 또는 아는 단어를 상기 문서에서 추출된 단어와 각각 비교하여 일치하는 단어개수가 많은 또는 적은 순서에 따라 상기 검색된 문서를 차례대로 정렬할 수 있다. 또한, 상기 문서의 식별정보에 포함되어 있는 판매량, 평점, 출시일 또는 가격이 높은 또는 낮은 순서에 따라 상기 검색된 문서를 차례대로 정렬할 수 있다. 또한, 상기 암기할 단어의 사용비중 또는 상기 아는 단어의 사용비중은 상기 문서에 포함되는 단어 중 상기 암기할 단어 또는 상기 아는 단어가 차지하는 비중을 나타내는 것으로써, 상기 단어분석모듈(100)에서 상기 각 문서별로 상기 암기한 단어개수 또는 상기 아는 단어개수에서 상기 문서에서 추출된 단어 전체 개수를 나누어 %비율로 산출할 수 있으며, 이에 따라 상기 산출된 비율이 높은 또는 낮은 순서에 따라 상기 검색된 문서를 차례대로 정렬할 수 있다. 그러나 본 발명이 이에 한정되는 것은 아니며, 상기 문서 리스트 또는 아이콘을 다양한 정보를 바탕으로 정렬할 수 있다.
도 7, 도 14을 참조하면, 본 발명의 또 다른 실시예로서, 상기 제1 문서를 상기 클라이언트 단말장치에 표시할 수 있다(S160). 상기 유저는 상기 제1 문서를 선택하여 읽기를 요청할 수 있으며, 상기 서버(10)에 상기 제1 문서의 읽기 요청정보가 수신되는 경우 상기 데이터베이스에서 상기 제1 문서의 파일을 읽어 들여 상기 클라이언트 단말장치에 표시할 수 있다.
상기 제1 단어장 또는 별도의 단어장을 선택할 수 있다(S170). 상기 유저가 상기 제1 문서를 원활하게 읽도록 상기 제1 문서에 포함되는 단어의 의미정보를 제공하기 위함으로써, 상기 클라이언트 단말장치에 표시되는 제1 문서에 포함되는 단어 중 상기 선택된 단어장에 들어있는 단어에 대하여 의미정보를 상기 클라이언트 단말장치에 함께 표시할 수 있다. 상기 클라이언트 단말장치에 상기 제1 문서에 대한 제1 단어장 또는 상기 유저에 의해 생성된 다른 단어장 리스트를 제공하여 어느 하나의 단어장을 선택하도록 할 수 있다.
상기 단어분석모듈(100)에서 상기 클라이언트 단말장치에 표시되는 제1 문서에 포함되는 단어를 추출하고, 상기 유저가 선택한 단어장의 단어들과 비교하여 일치하는 단어들의 의미정보를 상기 클라이언트 단말장치의 일측에 고정된 형태, 일측에 팝업 형태, 또는 상기 제공시스템 관리자가 설정한 임의의 형태로 해당 단어와 의미정보를 함께 표시하여 제공할 수 있다.
한편, 문서를 읽는데 굳이 필요하지 않은 단어의 의미정보까지 표시되는 것을 방지하기 위해, 상기 제공시스템의 관리자는 상기 선택된 문서를 읽기 위해 별도로 해석할 필요가 없거나 무시해도 되는 단어인 예외단어들에 대한 리스트를 미리 설정할 수 있으며, 상기 예외단어 리스트에 포함되는 단어의 경우 클라이언트 단말장치에 표시되지 않도록 설정할 수 있다. 또한, 상기 예외단어 리스트에는 상기 아는 단어 또는 학습완료 단어에 대한 단어장 또는 데이터베이스에 포함된 단어들도 포함될 수 있다.
도 14는 본 실시예에에 따른 상기 클라이언트 단말장치에 상기 제1 문서와 상기 선택된 단어장에 의해 일치하는 단어들의 의미정보를 함께 표시한 일형태를 예시한 것이다. 이와 같이 상기 클라이언트 단말장치에 상기 유저가 선택한 문서를 표시할 때, 상기 클라이언트 단말장치에 표시되는 부분에 포함되는 단어 중 상기 유저가 모를 가능성이 있는 단어의 의미정보를 함께 표시하여 제공함으로써, 유저가 문서를 해석하기 위해 별도로 단어장이나 사전을 검색하는 추가적인 작업을 방지하고, 선택된 문서를 보다 수월하게 읽어 나갈 수 있도록 지원할 수 있다.
몇몇 다른 실시예에서, 각각의 모듈 중 서버 또는 클라이언트 단말장치에 배치될 수 있는 모듈들은 일부가 클라이언트 단말장치에 배치될 수도 있고, 서버 측에 분산하여 배치될 수도 있다.
위에서 설명한 문서선택에 따른 가이드라인 제공방법은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 즉, 본 발명의 실시예에 따른 문서선택에 따른 가이드라인 제공방법을 수행하는 프로그램이 기록된 컴퓨터 판독가능한 기록 매체가 있을 수 있다. 여기서, 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 매체를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있지만, 이에 제한되지 않는다.
또한, 위에서 설명한 문서선택에 따를 가이드라인 제공방법은 하드웨어인 단말장치와 결합되어 실행되기 위해 프로그램(또는 어플리케이션)으로 구현되어 매체에 저장될 수 있다.
상기 프로그램은, 상기 클라이언트 단말장치가 프로그램을 읽어 들여 상기 방법들을 실행시키기 위하여, 상기 클라이언트 단말장치의 프로세서(CPU)가 상기 클라이언트 단말장치의 장치 인터페이스를 통해 읽힐 수 있는 C, C++, JAVA, 기계어 등의 컴퓨터 언어로 코드화된 코드(Code)를 포함할 수 있다. 이러한 코드는 상기 방법들을 실행하는 필요한 기능들을 정의한 함수 등과 관련된 기능적인 코드(Functional Code)를 포함할 수 있고, 상기 기능들을 상기 클라이언트 단말장치의 프로세서가 소정의 절차대로 실행시키는데 필요한 실행 절차 관련 제어 코드를 포함할 수 있다. 또한, 이러한 코드는 상기 기능들을 상기 클라이언트 단말장치의 프로세서가 실행시키는데 필요한 추가 정보나 미디어가 상기 클라이언트 단말장치의 내부 또는 외부 메모리의 어느 위치(주소 번지)에서 참조되어야 하는지에 대한 메모리 참조관련 코드를 더 포함할 수 있다. 또한, 상기 클라이언트 단말장치의 프로세서가 상기 기능들을 실행시키기 위하여 원격(Remote)에 있는 어떠한 다른 컴퓨터나 서버 등과 통신이 필요한 경우, 코드는 상기 클라이언트 단말장치의 통신 모듈을 이용하여 원격에 있는 어떠한 다른 컴퓨터나 서버 등과 어떻게 통신해야 하는지, 통신 시 어떠한 정보나 미디어를 송수신해야 하는지 등에 대한 통신 관련 코드를 더 포함할 수 있다.
상기 클라이언트 단말장치는 휴대폰, 스마트 폰, 태블릿 컴퓨터, 노트북 컴퓨터, 디지털 방송용 단말기, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 네비게이션, 디지털 tv, 데스크탑 컴퓨터 등 다양한 장치로 구현될 수 있다.
상기 저장되는 매체는, 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상기 저장되는 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있지만, 이에 제한되지 않는다. 즉, 상기 프로그램은 상기 클라이언트 단말장치가 접속할 수 있는 다양한 서버(10) 상의 다양한 기록매체 또는 사용자의 상기 클라이언트 단말장치 상의 다양한 기록매체에 저장될 수 있다. 또한, 상기 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장될 수 있다.
이상 첨부된 도면을 참조하여 본 발명의 실시예들을 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.

Claims (13)

  1. 제1 언어로 작성된 문서가 선택되면, 상기 선택된 문서에 포함되는 단어를 추출하여 사용빈도 및 난이도를 산출하는 단계;
    상기 사용빈도 및 난이도를 기초로 테스트단어를 표시하는 단계; 및
    상기 테스트단어에 대한 테스트결과를 기초로 상기 선택된 문서에 대한 적합도를 결정하는 단계;를 포함하는, 문서 선택에 따른 가이드라인 제공방법.
  2. 제1항에 있어서,
    상기 테스트단어를 표시하는 단계는,
    상기 문서에 포함되는 단어 중 상기 사용빈도 또는 상기 난이도가 낮은 또는 높은 순서에 따라 선별하여 표시하거나, 또는 상기 각 난이도별로 임의의 수만큼 선별하여 표시하는 것을 특징으로 하는, 문서 선택에 따른 가이드라인 제공방법.
  3. 제1항에 있어서,
    상기 문서에 포함되며 상기 테스트단어와 중복되지 않는 다른 테스트단어를 사용하여 재실시하는 테스트에 응하는 메시지를 수신할 경우, 상기 다른 테스트단어를 표시하는 단계; 및
    상기 재실시 테스트결과와 기존의 상기 테스트결과를 기초로 상기 문서에 대한 적합도를 결정하는 단계;를 더 포함하는, 문서 선택에 따른 가이드라인 제공방법.
  4. 제1항에 있어서,
    상기 테스트결과는,
    상기 테스트단어의 상기 난이도별로 그룹하여 산출하되,
    상기 적합도를 제공하는 단계는,
    상기 난이도별로 그룹하여 산출된 테스트결과를 기초로 상기 문서를 읽기 위한 학습단어정보를 제공하는 것을 특징으로 하는, 문서 선택에 따른 가이드라인 제공방법.
  5. 제4항에 있어서,
    상기 학습단어정보 중 암기대상단어정보를 수신하는 단계; 및
    상기 암기대상단어정보로부터 단어장을 생성하는 단계;를 포함하는, 문서 선택에 따른 가이드라인 제공방법.
  6. 제1항에 있어서,
    상기 사용빈도 또는 상기 난이도에 기초하여 추출된 단어그룹의 암기대상단어정보로부터 제1 단어장을 생성하는 단계를 더 포함하는, 문서 선택에 따른 가이드라인 제공방법.
  7. 제6항에 있어서,
    상기 생성된 제1 단어장은,
    선택된 단어에 대한 사전의미정보, 품사정보, 단어원형정보, 상기 문서에 사용된 의미정보 및 문장예문정보, 암기힌트정보, 난이도, 사용빈도 및 학습문제 중 하나 이상의 정보를 제공하는, 문서 선택에 따른 가이드라인 제공방법.
  8. 제6항에 있어서,
    상기 생성된 제1 단어장은,
    각 암기대상단어들을 암기할 단어, 아는 단어 또는 학습완료 단어로 구분을 하거나 별도로 저장하여 관리되는, 문서 선택에 따른 가이드라인 제공방법.
  9. 제6항에 있어서,
    상기 문서를 표시하는 단계;를 더 포함하되,
    상기 표시된 문서에 포함되는 단어 중 상기 제1 단어장에 들어있는 단어에 대하여 의미정보를 함께 표시하는 것을 특징으로 하는, 문서 선택에 따른 가이드라인 제공방법.
  10. 제8항에 있어서,
    상기 문서에 대한 검색어를 입력받는 단계; 및
    상기 검색어와 매칭되는 문서들을 포함하는 문서리스트를 제공하는 단계;를 더 포함하되,
    상기 암기할 단어개수, 상기 암기할 단어의 사용비중, 상기 아는 단어개수, 상기 아는 단어의 사용비중, 판매량, 평점순, 출시일 또는 가격에 따라 상기 문서리스트를 정렬할 수 있는, 문서 선택에 따른 가이드라인 제공방법.
  11. 제6항에 있어서,
    상기 문서를 표시하는 단계;를 더 포함하되,
    상기 표시된 문서에 포함되는 단어 중 미리 설정된 예외단어 리스트에 포함되는 단어에 대하여 의미정보 표시를 제외하는, 문서 선택에 따른 가이드라인 제공방법.
  12. 제1항 내지 제11항 중 어느 하나의 항에 기재된 문서 선택에 따른 가이드라인 제공방법을 수행하는 프로그램이 기록된 컴퓨터 판독가능한 기록 매체.
  13. 하드웨어인 클라이언트단말과 결합되어 제1항 내지 제11항 중 어느 하나의 항에 기재된 문서 선택에 따른 가이드라인 제공방법을 실행시키기 위하여, 매체에 저장된 단말장치용 어플리케이션.
PCT/KR2015/012096 2014-11-11 2015-11-11 문서 선택에 따른 가이드라인 제공방법, 이를 수행하기 위한 프로그램이 기록된 컴퓨터 판독가능한 기록 매체 및 매체에 저장된 단말장치용 어플리케이션 WO2016076622A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017526591A JP2018503853A (ja) 2014-11-11 2015-11-11 文書選択に応じたガイドライン提供方法、これを遂行するためのプログラムが記録されたコンピュータ読出し可能な記録媒体及び媒体に格納された端末装置用アプリケーション

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20140156365 2014-11-11
KR10-2014-0156365 2014-11-11
KR10-2015-0025568 2015-02-24
KR1020150025568A KR101618600B1 (ko) 2015-02-24 2015-02-24 문서 선택에 따른 가이드라인 제공방법, 이를 수행하기 위한 프로그램이 기록된 컴퓨터 판독가능한 기록 매체 및 매체에 저장된 단말장치용 어플리케이션

Publications (1)

Publication Number Publication Date
WO2016076622A1 true WO2016076622A1 (ko) 2016-05-19

Family

ID=55954635

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2015/012096 WO2016076622A1 (ko) 2014-11-11 2015-11-11 문서 선택에 따른 가이드라인 제공방법, 이를 수행하기 위한 프로그램이 기록된 컴퓨터 판독가능한 기록 매체 및 매체에 저장된 단말장치용 어플리케이션

Country Status (2)

Country Link
JP (1) JP2018503853A (ko)
WO (1) WO2016076622A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7213509B2 (ja) * 2019-01-18 2023-01-27 日本電信電話株式会社 語彙発達指標推定装置、語彙発達指標推定方法、プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080084146A (ko) * 2007-03-15 2008-09-19 황보의 단어장 형성 방법 및 시스템
WO2010150986A2 (ko) * 2009-06-24 2010-12-29 Nam Chan-Hee 외국어 단어 평생 학습 장치 및 방법
KR20110032470A (ko) * 2009-09-23 2011-03-30 동국대학교 산학협력단 단어 게임 장치 및 방법
WO2012026674A2 (ko) * 2010-08-25 2012-03-01 에스케이텔레콤 주식회사 학습 플랜 분석 방법, 장치 및 시스템
WO2013085320A1 (ko) * 2011-12-06 2013-06-13 Wee Joon Sung 스마트 기기를 이용한 상황 인식 기반 외국어 습득 및 학습 서비스 제공 방법

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1184999A (ja) * 1997-09-03 1999-03-30 N T T Data:Kk 情報提示システム及びその構成装置、記録媒体
JP2002072841A (ja) * 2000-08-29 2002-03-12 Hitachi Ltd 単語学習システム
JP5032600B2 (ja) * 2010-01-07 2012-09-26 株式会社東芝 文書可読性評価プログラムおよび文書可読性評価装置
KR20120118520A (ko) * 2011-04-19 2012-10-29 두산동아 주식회사 난이도별 어휘 분류가 가능한 학습 단말 장치 및 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080084146A (ko) * 2007-03-15 2008-09-19 황보의 단어장 형성 방법 및 시스템
WO2010150986A2 (ko) * 2009-06-24 2010-12-29 Nam Chan-Hee 외국어 단어 평생 학습 장치 및 방법
KR20110032470A (ko) * 2009-09-23 2011-03-30 동국대학교 산학협력단 단어 게임 장치 및 방법
WO2012026674A2 (ko) * 2010-08-25 2012-03-01 에스케이텔레콤 주식회사 학습 플랜 분석 방법, 장치 및 시스템
WO2013085320A1 (ko) * 2011-12-06 2013-06-13 Wee Joon Sung 스마트 기기를 이용한 상황 인식 기반 외국어 습득 및 학습 서비스 제공 방법

Also Published As

Publication number Publication date
JP2018503853A (ja) 2018-02-08

Similar Documents

Publication Publication Date Title
Casillas et al. A step-by-step guide to collecting and analyzing long-format speech environment (LFSE) recordings
CN105229693B (zh) 教育中心
AU2018279013B2 (en) Method and system for extraction of relevant sections from plurality of documents
US20110219299A1 (en) Method and system of providing completion suggestion to a partial linguistic element
Ye et al. A crowdsourcing framework for medical data sets
CN112052396A (zh) 课程匹配方法、系统、计算机设备和存储介质
CN110941702A (zh) 一种法律法规和法条的检索方法及装置、可读存储介质
WO2020111827A1 (ko) 프로필 자동생성서버 및 방법
CN101512518A (zh) 自然语言处理系统和词典登录系统
Schmidtke et al. Mass counts in World Englishes: A corpus linguistic study of noun countability in non-native varieties of English
Nkhoma et al. Learning analytics techniques and visualisation with textual data for determining causes of academic failure
Krishna Rohit et al. Analysis of speeches in Indian parliamentary debates
CN112418875A (zh) 跨平台税务智能客服语料迁移方法及装置
WO2016076622A1 (ko) 문서 선택에 따른 가이드라인 제공방법, 이를 수행하기 위한 프로그램이 기록된 컴퓨터 판독가능한 기록 매체 및 매체에 저장된 단말장치용 어플리케이션
WO2017179778A1 (ko) 빅데이터를 이용한 검색 방법 및 장치
Gañan Plagiarism detection
Enăchescu Screening the Candidates in IT Field Based on Semantic Web Technologies: Automatic Extraction of Technical Competencies from Unstructured Resumes.
KR101607128B1 (ko) 오답과 관련된 연관문제 제공방법
JP2017027168A (ja) 嗜好学習方法、嗜好学習プログラム、及び嗜好学習装置
CN109710751A (zh) 法律文件的智能推荐方法、装置、设备及存储介质
KR101783012B1 (ko) 문서 선택에 따른 가이드라인 제공방법, 이를 수행하기 위한 프로그램이 기록된 컴퓨터 판독가능한 기록 매체 및 매체에 저장된 단말장치용 어플리케이션
JP2021022107A (ja) 情報提供システムおよびサーバ
KR101618600B1 (ko) 문서 선택에 따른 가이드라인 제공방법, 이를 수행하기 위한 프로그램이 기록된 컴퓨터 판독가능한 기록 매체 및 매체에 저장된 단말장치용 어플리케이션
CN117493210B (zh) 微服务工具评价方法及系统
CN114565928B (zh) 文本识别方法、装置、设备及存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15859490

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2017526591

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 18.08.2017)

122 Ep: pct application non-entry in european phase

Ref document number: 15859490

Country of ref document: EP

Kind code of ref document: A1