Open Access System for Information Sharing

Login Library

 

Thesis
Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

Cognitive Model-Based Autonomic Fault Management in SDN

Title
Cognitive Model-Based Autonomic Fault Management in SDN
Authors
김성수
Date Issued
2013
Publisher
포항공과대학교
Abstract
인터넷이 탄생한 이래로 네트워크 기술은 매우 빠른 속도로 발전해왔다. 초기의 단순한 데이터 전송 네트워크에서 다양한 네트워크 기술과, 서로 다른 업체의 장비들이 혼재되어있으며 실시간 비디오 스트리밍이나 VoIP(Voice over IP) 와 같은 서비스들을 제공하는 복합적인 시스템으로 변화하고 있다. 그러나 네트워크 관리 기술은 네트워크 기술의 눈부신 발전 속도를 따라잡지 못하고 있는 것이 현실이다. 초기의 네트워크 관리는 관리자가 네트워크 관리 시스템의 수집된 데이터를 분석하고, 현재 상태를 파악해서 문제가 발생했을 경우 관리자가 설정을 변경하는 방식으로 이루어졌다. 관리자의 개입으로 인한 비용의 증가, 느린 문제해결 속도 등은 네트워크 관리의 문제점이었고 이를 해결하기 위해 오토노믹 네트워크 관리(autonomic network management)가 해결방안으로 부상하였다. 오토노믹 네트워크 관리는 네트워크 관리 시스템 스스로 현재의 네트워크 상태를 파악하고 상황에 맞는 해결방안을 선택함으로써 관리자의 개입 없이 스스로 네트워크의 관리가 가능하게 하는 방안이다. 오토노믹 네트워크 관리를 실제 시스템에 적용하기 위해서는 해결해야할 문제들이 있는데, 핵심 중 하나는 상황을 정확하게 파악하고 현재 상황에 맞는 결정을 내리는 컨트롤 루프의 구성이다. 기존의 오토노믹 네트워크 관리를 위한 컨트롤 루프들은, 문제의 특성에 관계없이 오로지 한 가지 루프만을 제공하여 모든 문제를 해결한다. 하지만 실제 네트워크에서 발생하는 문제들은 긴급하게 처리해야하는 문제, 시간이 지체되더라도 더 정확한 분석이 필요한 문제 등 그 특성이 다양하며 효율적인 관리를 위해서는 문제들의 특성을 고려하여 처리해야한다. 이를 위해 우리는 사람의 인지모델(human cognition model)을 적용하여 문제의 특성에 따라 가장 적합한 프로세스를 이용해 문제를 해결하는 컨트롤 루프를 제시한다. 본 논문에서는 컨트롤 루프와 더불어 서로 다른 데이터 모델을 이용하는 네트워크 장비들의 데이터를 조합하여 상위레벨의 지식형태로 표현하는 model based translation과 계층적 관리 구조를 포함한 오토노믹 네트워크 관리구조인 CogMan(Cognitive network Management)을 제시한다. 아키텍처의 검증을 위해 CogMan을 기존의 네트워크와 SDN(Software Defined Networks) 장애관리에 적용하였다. 기존의 SDN에서는 장애복구를 위해 보호경로를 미리 설정하는 경로보호방식과 문제가 발생했을 때 컨트롤러에서 해당 플로우들을 새로운 경로로 우회하는 경로재설정 방식을 이용한다. 경로 보호 방식은 빠른 장애 복구를 제공하나 복수의 장애가 발생하여 보호경로 마저 이용이 불가능 할 경우 경로 재설정 방식을 이용해야 한다. 복수의 장애가 발생했을 경우에도 기존의 경로재설정 방식보다 빠르게 복구할 수 있는 FFS(Fast Flow Setup) 알고리즘을 제안하고 이를 CogMan에 적용해 상황에 따라 단일장애에는 경로보호방식을, 복수의 장애에는 FFS 방식을 이용해 다양한 형태의 장애가 발생해도 신속하게 복구가 가능함을 테스트베드에서의 실험을 통하여 검증했다. 또한, SDN 뿐만 아니라 기존의 네트워크에서 장애로 인해 발생하는 알람들을 연관규칙 마이닝을 이용하여 효과적으로 관리하고 장애를 파악하는 사례를 보인다.
In the past decades, network technologies have rapidly evolved with respect to their conception, coverage, capacities and complexities. Advanced technologies, such as software agents and policy-based network management, have been developed for more ecient network management. However, the development of network management technologies has not kept pace with the rapid evolution of the network technologies. Autonomic network management, which helps the network itself detect, diagnose and repair failures by adaptive con guration changes based on the context, is a solution approach for advanced network management. Autonomic network management is rst and foremost, a method to manage complexity. Autonomic network management systems can lead to important business advantages, such as reduction of operational expenditure through task automation. Unfortunately, autonomic network management is still an immature technology that poses many challenges to be solved before successful deployment. In order to be a real autonomic management system, not just a automated system, the system should have enough capacities to adapt itself to changing situations. Autonomic network management systems have relied on control loops to change their behaviors based on observations of situations. Existing control loops provide only a single routine to handle situations, regardless of the nature of problems. Although most urgent problems require speedy solutions, some problems need the best solution notwithstanding its response time. Especially, existing control loops have no idea how to deal with unexpected situations which are not de ned by policies. In this thesis, we propose a novel autonomic network management architecture, called CogMan, which is based on a cognitive model for ecient problem resolving and accurate decision making even in unexpected situations. A cognitive control loop of CogMan provides reactive, deliberative, and re ective loops for managing systems based on an analysis of the current status. In order to validate the proposed architecture and the control loop, we apply them to fault management in Software De ned Networks (SDN), as well as legacy networks. We also propose a Fast Flow Setup (FFS) algorithm for fast failure recovery in SDN. Finally, this thesis presents the results of experiments on which managing various failure situations with the proposed architecture and algorithm are evaluated.
URI
http://postech.dcollection.net/jsp/common/DcLoOrgPer.jsp?sItemId=000001634350
http://oasis.postech.ac.kr/handle/2014.oak/2044
Article Type
Thesis
Files in This Item:
There are no files associated with this item.

qr_code

  • mendeley

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Views & Downloads

Browse