Tez Arşivi

Tez aramanızı kolaylaştıracak arama motoru. Yazar, danışman, başlık ve özete göre tezleri arayabilirsiniz.


Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü

An attempt to classify Turkish district data: K-means and 'self-organizing map'(SOM) algorithms

Türkiye'nin ilçe verilerini kümeleme denemesi: K-means ve 'self-organizing map'(SOM) algoritmaları

Teze Git (tez.yok.gov.tr)

Bu tezin tam metni bu sitede bulunmamaktadır. Teze erişmek için tıklayın. Eğer tez bulunamazsa, YÖK Tez Merkezi tarama bölümünde 153634 tez numarasıyla arayabilirsiniz.

Özet:

ABSTRACT AN ATTEMPT TO CLASSIFY TURKISH DISTRICT DATA: K-MEANS AND SELF-ORGANIZING MAP (SOM) ALGORITHMS Aksoy, Ece M.S., Department of Geodetic and Geographic Information Systems Supervisor: Assoc. Prof. Dr. Oğuz Işık December 2004, 112 pages There is no universally applicable clustering technique in discovering the variety of structures display in data sets. Also, a single algorithm or approach is not adequate to solve every clustering problem. There are many methods available, the criteria used differ and hence different classifications may be obtained for the same data. While larger and larger amounts of data are collected and stored in databases, there is increasing the need for efficient and effective analysis methods. Grouping or classification of measurements is the key element in these data analysis procedures. There are lots of non-spatial clustering techniques in various areas. However, spatial clustering techniques and software are not so common. This thesis is an attempt to classify Turkish district data with the help of two clustering algorithms: K-means clustering and self organizing maps (SOM). With the help of these two common techniques it is expected that a clustering can be reached, which can be used for different aims such as regional politics, constructing statistical integrity or analyzing distribution of funds, for same data in GIS IVenvironment and putting forward the facilitative usage of GIS in regional and statistical studies. All districts of Turkey, which is 923 units, were chosen as an application area in this thesis. Some limitations such as population were specified for clustering of Turkey's districts. Firstly, different clustering techniques for spatial classification were researched. K-Means and SOM algorithms were chosen to compare different methods with Turkey's district data. Afterward, database of Turkey's statistical datum was formed and analyzed joining with geographical data in the GIS environment. Different clustering software, ArcGIS, CrimeStat and Matlab, were applied according to conclusion of clustering techniques research. Self Organizing Maps (SOM) algorithm, which is the best and most common spatial clustering algorithm in recent years, and CrimeStat K-Means clustering were used in this thesis as clustering methods. Keywords: Spatial Clustering Techniques, Classification of Statistical Region Units, Geographical Information Systems (GIS), SOM Algorithm, Statistical Datum

Summary:

oz TÜRKİYE'NİN İLÇE VERİLERİNİ KÜMELEME DENEMESİ: K-MEANS VE 'SELF-ORGANIZING MAP' (SOM) ALGORİTMALARI Aksoy, Ece Yüksek Lisans, Jeodezi ve Coğrafi Bilgi Teknolojileri Bölümü Tez Yöneticisi: Assoc. Prof. Dr. Oğuz Işık Aralık 2004, 112 sayfa Veri yapısının çeşitliliğini görüntülemek için tüm dünyada kabul gören bir sınıflama tekniği yoktur. Tek bir algoritma yada yaklaşım da tüm sınıflama problemlerini çözmek için yeterli değildir.Uygun birçok yöntem olması ve kullanılan kriterler değişebilmesi sebebiyle aynı veri için farklı sınıflamalar elde edilebilir. Veri tabanlarında tutulan ve saklanan veriler büyüdükçe, verimli ve kullanışlı analiz yöntemlerine olan ihtiyaç artmaktadır. Ölçümlerin gruplama yada sınıflaması bu tür veri analizi prosedürlerinde anahtar unsurdur. Çeşitli alanlarda kullanılan birçok mekansal olmayan sınıflama tekniği mevcuttur. Ancak, mekansal sınıflama teknikleri ve yazılımları o kadar yaygın değildir. Bu tez, Türkiye'nin ilçe verilerini iki sınıflama algoritması yardımıyla kümeleme denemesidir: K-Means sınıflaması ve *self-organizing' haritalar (SOM). Bu iki yaygın algoritma yardımıyla, aynı veri için CBS ortamında bölgesel politikalar oluşturmak, istatistiksel bütünlük yaratmak yada fonların dağılım analizi gibi farklı amaçlar için kullanılabilecek sınıflama yapılması amaçlanmaktadır ve CBS'nin bölgesel ve istatistik!" çalışmalardaki verimli kullanımını vurgulamayı amaçlamaktadır. viBu tezde, uygulama alanı olarak sayısı 923 olan Türkiye'nin tüm ilçeleri seçilmiştir. Türkiye nin ilçelerini sınıflandırmak için, nüfus gibi bazı kısıtlamalar belirlenmiştir. İlk olarak, mekansal sınıflamaya dair farklı sınıflandırma teknikleri araştırılmıştır. Türkiye'nin ilçe datalarıyla farklı metodları karşılaştırmak için K-Means ve SOM algoritmaları seçilmiştir. Daha sonra, Türkiye'nin istatistiksel verilerinden oluşan bir veri tabanı oluşturulmuş ve CBS ortamında coğrafi verilerle birleştirilerek analizleri yapılmıştır. Sınıflandırma teknikleri araştırması sonucuna göre belirlenen farklı sınıflandırma yazılımları, ArcGIS, CrimeStat ve Matlab, uygulanmıştır. Bu tezde mekansal sınıflama yöntemleri olarak son yıllardaki en iyi ve en yaygın mekansal sınıflandırma algoritması olan SOM ve CrimeStafin K-Means sınıflaması kullanılmıştır. Anahtar Kelimeler: Mekansal Sınıflandırma Teknikleri, Coğrafi Bölge Birimleri Sınıflandırması, Coğrafi Bilgi Teknolojileri (CBS), SOM Algoritması, İstatistiki Veri vıı