Open Access System for Information Sharing

Login Library

 

Thesis
Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

자연어 처리를 이용한 요구사항 기반 특허 기술정보 도출 방법론

Title
자연어 처리를 이용한 요구사항 기반 특허 기술정보 도출 방법론
Authors
기완욱
Date Issued
2018
Publisher
포항공과대학교
Abstract
기술 기획의 어려움과 급변하는 기술 동향에 대한 우려로 인해 기술 기획, 지적재산관리 (IP, Intellectual Property) 및 연구개발 전략 수립과 같은 많은 산업 분야에서 특허 마이닝 및 분석이 점차 주목 받고 있습니다. 특허는 중요한 기술 정보가 포함된 정형화된 기술 문서이며 기술 기획의 필수 요소입니다. 특허 분석은 필요한 기술 내용과 특허 집합 간의 관계를 확인하여 향후 전략 수립을 지원하기 위해 사용되곤 합니다. 현재까지 대부분의 연구자들은 자연어 처리 (NLP, Natural Language Processing)를 기반으로 하는 의미론적 특허 분석에 관심을 보여 왔습니다. 기존의 서지 정보 기반 특허 분석은 기술의 진정한 의미를 식별할 수 없었기 때문에 단어의 문맥을 분석하는 자연어 처리에 대한 연구가 활발하게 이루어졌습니다. 그러나 특허 문서의 구조적 어려움과 데이터 전처리의 비효율성으로 인해 혁신적인 의미론적 특허 분석에 대한 요구 또한 증가하고 있습니다. 또 다른 문제점은 분석 과정에서 이해 관계자의 요구사항을 적절히 반영하지 않으면서 다양한 방법을 사용하는 맹목적인 특허 분석만이 수행된다는 것입니다. 체계적인 요구사항 분석이 이루어지지 않으면 비즈니스 성공을 보장할 수 있는 기술 기획을 수립하는 것이 불가능합니다. 위에서 설명한 한계점들을 극복하기 위해서 본 연구에서는 NLP 기술을 활용하여 이해관계자 요구사항 기반 기술정보를 도출하는 반자동 방법론을 제안했습니다. 요구사항은 문법 규칙을 기반으로 구조화된 의미 정보로 분해된 다음, 요구사항 및 특허에서 추출한 기술 기능, 컴포넌트, 컨텍스트 및 목적을 포함하는 4가지 기술정보와 연결하여 요구사항 기반 기술정보를 도출 할 수 있습니다. TF-IDF (Term Frequency – Inverse Document Frequency) 및 전문가 리뷰는 각 정보의 중요성을 평가하는 기준으로 사용됩니다. 추출된 결과를 이용하여 기술정보의 정성 분석을 지원하기 위해 네트워크 및 매트릭스 형식으로 정보를 시각화 했습니다. 네트워크는 ‘node’와 ‘edge’ 간의 기술적 관계를 파악할 수 있으며 매트릭스는 공백 영역 및 고밀도 산업영역에서 비즈니스 기회를 제안할 수 있습니다. 이 방법론은 나노 센서와 관련된 특허 데이터 분석을 통해 입증되었습니다.
Due to concern about difficulties of technology planning and rapidly changing technology trend, patent mining and analysis have received increasing attention in many industrial sectors including technology planning, management of Intellectual property (IP) and establishment of R&D strategy. Patent is a formal technical document containing important technical information and is an essential part of technical planning. Patent analysis is used to support future strategy establishment by identifying required technical contents and relationship among patent set. Up to present time, most researchers have been concerned with semantic patent analysis based on natural language processing (NLP). Since the existing bibliographic information based patent analysis has not been able to identify the real meaning of technology, research on natural language processing that analyzes context of a document in words has become active. However, due to the structural difficulties of patent documents and the inefficiency of data preprocessing, the demand for innovative semantic patent analysis is also increasing. The other problem is that only blind patent analysis using various method is performed without properly reflecting the requirements of stakeholders in the analysis process. Without systematic requirements analysis, it is difficult to plan the technology to ensure business success. To overcome the limitations described above, in this paper, we proposed a semi-automated methodology for deriving technical information based on stakeholder requirements using NLP technology. The requirements are decomposed into structured semantic information based on grammar rules, and then the requirements based technology information can be derived by linking with the four technical information including function, component, context and purpose extracted from the requirement and patent. TF-IDF (Term Frequency – Inverse Document Frequency) and expert reviews are used as criteria for evaluating the importance of each information. Using extracted result, we visualized this information in network and matrix form for supporting qualitative analysis of technical information. The network can identify technical relation from node and edge, and matrix can suggest business opportunities from vacuum and intense area. The methodology has been verified through analysis of patent data related to Nano sensors.
URI
http://postech.dcollection.net/common/orgView/200000010930
http://oasis.postech.ac.kr/handle/2014.oak/92832
Article Type
Thesis
Files in This Item:
There are no files associated with this item.

qr_code

  • mendeley

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Views & Downloads

Browse