Open Access System for Information Sharing

Login Library

 

Thesis
Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

저자원 환경하의 한국어-한국수화 번역을 위한 규칙-신경망 복합 기법

Title
저자원 환경하의 한국어-한국수화 번역을 위한 규칙-신경망 복합 기법
Authors
정헌영
Date Issued
2020
Publisher
포항공과대학교
Abstract
기계 번역은 서로 다른 언어를 사용하는 사람 사이의 의사소통과 외국어로 표현된 정보에 대한 접근성을 높이는 것을 목적으로 사용된다. 청각 장애인들이 사용하는 언어는 그 지역의 구화 언어와 다르기 때문에 일상 생활에서 비장애인과의 의사소통 및 언어로 표현된 정보를 접하는데 큰 어려움을 가지고 있다. 수화를 다루는데 있어서 필요한 여러 자원이 적기 때문에 수화를 다루는 시스템을 작성하는데 어려움이 있다. 본 학위논문에서는 저자원 환경에서 한국어-한국 수화 시스템을 구축하기 위한 방법을 제시한다. 이 번역 시스템에서는 먼저 한국어-한국수화 번역 사전을 구축하여 이에 기반한 단어 번역을 진행하고 데이터-규칙 복합 방식으로 문장구조를 변환하여 한국수화 번역문을 생성한다. 단어분석 단계에서는 한국어 입력문장의 단어를 의미 수준에서 분석하고 이 의미에 따라 적합한 수화를 사저에서 선책하도록 한다. 문장구조 변환에 있어서, 한국수화의 어순이 부분순서 결정으로 설명될 수 있음에 착안하여 문장에서 어순 결정이 필요한 부분을 "order-important constituent pair"로 분리하고 이를 데이터 기반분류 문제로 풀어내는 방식을 제안한다. 분류기를 사용한 어순 결정에 있어서 한국수화 데이터 부족의 문제를 해소하기 위해 대량의 외부 데이터를 사용하는 신경망 기반 분류 모델을 제안한다. 이 제안 방식은 TV 뉴스 데이터를 사용한 평가 실험 에서 기본 시스템의 성능을 크게 웃돌아 BLEU 점수로 0.514, RIBES 점수로 0.426를 달성하였다.
Machine translation has the purpose to break the language barrier that prevents communication with others and to increase accessibility to information. The deaf people face huge language barriers in their daily lives including access to written and spoken information. There are very few machine-readable linguistic resources to process sign language expression. In this thesis, we present a transfer-based machine translation system for translating Korean-to-Korean Sign Language (KSL) with gloss notation, mainly comprised of 1) dictionary-based lexical transfer and 2) a hybrid structural transfer based on a data-driven approach. In particular, we formulate complicated partial word reordering problems in the structural transfer as multi-class classification tasks and propose “syntactically guided” data-driven structural transfer. The core part of our study is a neural classification model, which use external large data, for reordering "order-important constituent pairs" with a reordering task that is newly designed for Korean-to-KSL translation. The experimental results evaluated on news transcript data show that the proposed system achieves a BLEU score of 0.514 and a RIBES score of 0.426, significantly improving upon the baseline system performance.
URI
http://postech.dcollection.net/common/orgView/200000288209
https://oasis.postech.ac.kr/handle/2014.oak/111895
Article Type
Thesis
Files in This Item:
There are no files associated with this item.

qr_code

  • mendeley

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Views & Downloads

Browse