Open Access System for Information Sharing

Login Library

 

Thesis
Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

한국어 문법 오류 교정에서의 병렬 말뭉치 부족 현상 완화

Title
한국어 문법 오류 교정에서의 병렬 말뭉치 부족 현상 완화
Authors
조승우
Date Issued
2018
Publisher
포항공과대학교
Abstract
This thesis proposes two methods that use monolingual corpora to mitigate the lack of parallel data for grammatical error correction in Korean: data augmentation, and language model integration. We generate artificial grammatical errors in monolingual corpora to augment parallel data. We also integrate a recurrent neural network language model into the encoder of a neural machine translation system for identification of erroneous syllables. Our methods successfully improved the quality in translations of Lang-8 test data. Our methods are applicable to Automatic Post Editing (APE), in that APE corrects wrong translations.
본 학위 논문은 한국어 문장 교정에서의 병렬 말뭉치 부족 현상을 완화하기 위하여, 작은 크기의 병렬 말뭉치를 증강하는 기법과 언어 모델을 기계 번역 기반 교정 모델의 인코더에 도입하는 기법을 제안한다. 말뭉치 증강 기법은 문법 오류를 인공적으로 단일 말뭉치에 발생시켜서 교정 모델에 필요한 학습 데이터를 풍부하게 하며, 언어 모델을 도입하는 기법은 문법 오류에 해당하는 음절을 좀 더 잘 구별할 수 있다는 장점이 존재한다. 병렬 말뭉치보다 수집하기 쉬운 단일 말뭉치를 활용하는 두 가지 제안 기법으로 Lang-8 실험 데이터에 대한 교정 성능의 향상을 확인할수 있었다.
URI
http://postech.dcollection.net/common/orgView/200000006933
http://oasis.postech.ac.kr/handle/2014.oak/93578
Article Type
Thesis
Files in This Item:
There are no files associated with this item.

qr_code

  • mendeley

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Views & Downloads

Browse