Tez Arşivi

Hakkımızda

Tez aramanızı kolaylaştıracak arama motoru. Yazar, danışman, başlık ve özete göre tezleri arayabilirsiniz.


Dokuz Eylül Üniversitesi / Fen Bilimleri Enstitüsü / Elektrik-Elektronik Mühendisliği Anabilim Dalı / Elektrik Elektronik Mühendisliği Bilim Dalı

Object recognition from depth camera images

Derinlik kamerası görüntülerinden nesne tanıma

Teze Git (tez.yok.gov.tr)

Bu tezin tam metni bu sitede bulunmamaktadır. Teze erişmek için tıklayın. Eğer tez bulunamazsa, YÖK Tez Merkezi tarama bölümünde 625994 tez numarasıyla arayabilirsiniz.

Özet:

Object recognition from RGB-D images that provide additional depth information is very important task in many real world robotics and computer vision applications. The Convolutional Neural Networks (CNNs) have widely used in numerous applications especially RGB-D object recognition. However, CNNs have several restrictions even though they have demonstrated outstanding performance on object recognition. Pooling layer of CNNs causes to information loss in the stage of feature extraction. In addition to this, CNN is very sensitive to environmental factors such as rotation and light intensity. Capsule networks proposed by Hinton have been developed to avoid from these problems. In the thesis, the performances of the Capsule networks are investigated on the RGB-D dataset. Also a two-layer hierarchical structure is proposed in which the depth images are used in the first layer and RGB images are used in the second layer. Two different hierarchical structures that consist of CNN and capsule networks are designed. The performances of the hierarchical CNN and capsule networks are evaluated on the Washington RGB-D dataset. According to the simulation results, the best performance has been achieved with hierarchical CNN.

Summary:

Derinlik bilgisini sağlayan RGB-D görüntülerinden nesne tanıma, robotik ve bilgisayarlı görü gibi uygulama alanlarında çok önemli bir görevdir. Evrişimli sinir ağları, özellikle RGB-D nesne tanıma uygulamalarında yaygın olarak kullanılmaktadır. Evrişimli sinir ağları, nesne tanımada üstün performans göstermesine rağmen, belirli kısıtlara sahiptir. Evrişimli sinir ağlarında kullanılan örnekleme katmanı, öznitelik çıkarma aşamasında bilgi kaybına neden olmaktadır. Buna ek olarak, evrişimli sinir ağları, dönme ve ışık şiddeti gibi çevresel etkenlere karşı çok hassastır. Hinton tarafından önerilen kapsül ağları, bu tarz problemlerden kaçınmak için geliştirilmiştir. Bu tezde, kapsül ağlarının, RGB-D veri seti üzerindeki performansları incelenmiştir. Ayrıca, ilk katmanında derinlik görüntüleri, ikinci katmanında RGB görüntüleri olan iki katmanlı hiyerarşik bir yapı önerilmiştir. Evrişimli sinir ağları ve kapsül ağlarından oluşan iki farklı hiyerarşik yapı tasarlanmıştır. Evrişimli sinir ağları ve kapsül ağlarının performansları, Washington RGB-D veri seti üzerinde değerlendirilmiştir. Simülasyon sonuçlarına göre, en iyi performans hiyerarşik evrişimli sinir ağı ile elde edilmiştir.