Tez Arşivi

Tez aramanızı kolaylaştıracak arama motoru. Yazar, danışman, başlık ve özete göre tezleri arayabilirsiniz.


Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Anabilim Dalı

A C++ distributed database select-project-join query processor on a HPC cluster

Bir dağıtık veritabanı select-project-join sorgu işlemcisinin bir HPC öbeği üzerinde C++ implementasyonu

Teze Git (tez.yok.gov.tr)

Bu tezin tam metni bu sitede bulunmamaktadır. Teze erişmek için tıklayın. Eğer tez bulunamazsa, YÖK Tez Merkezi tarama bölümünde 318905 tez numarasıyla arayabilirsiniz.

Özet:

Yüksek performanslı bilgisayar öbekleri merkezi muadillerine göre daha ölçeklenebilir, ucuz ve güvenilir oldukları için günümüzde yaygınlaşmıştır. Veritabanı yönetim sistemleri dağıtık mimariler için oldukça uygun olmalarına rağmen, dağıtık veritabanları tasarımlarının zor olması nedeniyle yeterince geniş alanda kullanılmamaktadırlar. Bu çalışmada dağıtık veritabanı tasarımında karşılaşılan zorlukların üstesinden gelinmesine yardımcı olmak için simülasyona yönelik bir test yatağı geliştirilmesi amaçlanmıştır. Bunun için bölümümüzün HPC öbeği üzerinde select, project ve join işlemlerini dağıtık olarak çalıştıran bir sorgu planı işlemcisi implemente edilmiştir. Bunun yanında primary key ve foreign key kısıtlamalarını sağlayabilen bir veri üretim modülü hazırlanmıştır. Test yatağının bir diğer yeteneği ise verilen bir sorgu planın cevap zamanını ölçebilmesi, belirtilen iletişim ağı parametrelerine göre bu zamanı simüle ve tahmin edebilmesidir. Üretilen sonuçların doğruluğunu göstermek üzere deneyler yapılmıştır. Tahmin fonksiyonlarını doğrulamak için tahmin edilen çalışma zamanlarıyla test yatağından elde edilen gerçek zamanlar karşılaştırılmıştır. Bu şekilde tahmin fonksiyonlarının dağıtık veritabanı sorgu iyileştiricilerinde ve dağatık veritabanı tasarım araçlarında kullanılabileceği gösterilmiştir.

Summary:

High performance computer clusters have become popular as they are more scalable, affordable and reliable than their centralized counterparts. Database management systems are particularly suitable for distributed architectures; however distributed DBMS are still not used widely because of the design difficulties. In this study, we aim to help overcome these difficulties by implementing a simulation testbed for a distributed query plan processor. This testbed works on our departmental HPC cluster machine and is able to perform select, project and join operations. A data generation module has also been implemented which preserves the foreign key and primary key constraints in the database schema. The testbed has capability to measure, simulate and estimate the response time of a given query execution plan using specified communication network parameters. Extensive experimental work is performed to show the correctness of the produced results. The estimated execution time costs are also compared with the actual run-times obtained from the testbed to verify the proposed estimation functions. Thus, we make sure that these estimation functions can be used in distributed database query optimization and distributed database design tools.