Open Access System for Information Sharing

Login Library

 

Thesis
Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

Modeling and Propagating CNNs in a Tree Structure for Visual Tracking

Title
Modeling and Propagating CNNs in a Tree Structure for Visual Tracking
Authors
백무열
Date Issued
2018
Publisher
포항공과대학교
Abstract
This work is an online visual tracking algorithm managing multiple target appearance models stochastically in a tree structure. The proposed algorithm employs Convolutional Neural Networks (CNNs) to represent multiple target appearances, where multiple CNNs collaborate to estimate target states and determine the desirable paths for online model updates in the tree. The strategy maintaining multiple CNNs in diverse branches of tree structure enables to deal with multi-modality in target appearances and preserve model reliability through smooth updates along tree paths. Since multiple CNNs share all parameters in convolutional layers, it takes advantage of multiple models with little extra cost by saving memory space and avoiding redundant network evaluations. The final target state is estimated by sampling target candidates around the state in the previous frame and identifying the best sample in terms of a weighted average score from a set of active CNNs. Proposed algorithm achieved outstanding performance compared to the state-of-the-art techniques in challenging datasets such as online tracking benchmark and visual object tracking challenge.
본 연구는 복수의 외형 모델을 효율적으로 유지하는 컨볼루션 신경망 기반 물체 추적 알고리즘을 제안한다. 컨볼루션 신경망은 영상을 입력받아 컨볼루션 연산과 비선형 함수 입력을 여러 번 거듭하여 특징을 추출하는 알고리즘으로, 대량의 영상 분류 데이터를 이용하여 적합한 컨볼루션 연산의 인자를 찾는 기계학습 방식을 통하여 이미지 분류기의 정확도를 비약적으로 상승시켜 컴퓨터과학 전반에 큰 변혁을 일으키고 있다. 이렇듯 컨볼루션 신경망이 컴퓨터 비젼의 다양한 문제에 대한 좋은 해결책으로 부상하면서 이를 물체 추적 알고리즘에 적용하고자 하는 노력도 있어 왔다. 다만 대부분 이미 학습된 컨볼루션 신경망을 가져와 이를 특징 추출기로 이용하는 데 그친 바 있다. 이러한 한계를 넘어, 영상에서 물체를 추적함과 동시에 추적된 결과를 바탕으로 온라인 학습이 가능한 구조를 고안해 보았다. 컨볼루션 신경망을 여러 개 유지하되, 시간 순서에 맞추어 선형적으로 추가하는 대신 트리 구조를 이용하여 영상 내의 각기 다른 구간의 영상을 기반으로 추계적으로 학습하는 것이 그 골자이다. 여러개의 컨볼루션 신경망을 여러 개의 브랜치를 가진 트리 구조 내에 저장함으로써 추적 대상의 다양한 외형 모델을 잘 유지하면서도 안정적인 업데이트가 가능하다. 이러한 구조는 일부 신경망이 외형 모델을 잘 담지 못하게 되더라도, 다수의 다른 신경망의 정확한 판단으로 인해 끈질기고 안정적으로 물체를 추적할 수 있는 장점이 있다. 각 컨볼루션 신경망은 대다수의 인자를 서로 공유함으로서 그 갯수가 늘어나더라도 계산양과 메모리 요구량이 선형적으로 증가하지 않도록 설계했다. 물체 추적기의 정확도를 측정하는데 두루 사용되는 다양한 물체 추적 벤치마크 영상군에서 (OTB, VOT) 실험해 본 결과, 본 알고리즘이 좋은 성능을 보이는 것을 확인할 수 있었다.
URI
http://postech.dcollection.net/common/orgView/200000106373
https://oasis.postech.ac.kr/handle/2014.oak/93590
Article Type
Thesis
Files in This Item:
There are no files associated with this item.

qr_code

  • mendeley

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Views & Downloads

Browse