Tez Arşivi

Tez aramanızı kolaylaştıracak arama motoru. Yazar, danışman, başlık ve özete göre tezleri arayabilirsiniz.


Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Bölümü

A TV content augmentation system exploiting rule based named entity recognition method

Kural tabanlı varlık ismi tanıma yöntemi kullanarak televizyon içeriğini zenginleştirme sistemi

Teze Git (tez.yok.gov.tr)

Bu tezin tam metni bu sitede bulunmamaktadır. Teze erişmek için tıklayın. Eğer tez bulunamazsa, YÖK Tez Merkezi tarama bölümünde 385057 tez numarasıyla arayabilirsiniz.

Özet:

In this thesis, a TV content augmentation system taking the advantage of named entity recognition methods is proposed. The system aims to automatically enhance TV program contents by retrieving context related data and presenting them to the viewers without any necessity of another device. In addition to conceptual description of the system, a prototype implementation is developed and demonstrated with predefined TV programs. The implementation utilizes Electronic Program Guide (EPG) data of programs crawled from web resources in order to extract named entities such as person names, locations, organizations, etc. For this purpose, a rule based Named Entity Recognition (NER) algorithm is developed for Turkish texts. Detailed information about the extracted entities is retrieved from Wikipedia after semantic disambiguation and its summarized form is presented to the users. A set of experiments have been conducted on two different data sets in order to evaluate the performance of the rule based NER algorithm and the behavior of the TV content augmentation system. The experimental results show that the content augmentation with NER methods is quite successful in TV domain especially for channels broadcasting news and series. Keywords: Content Augmentation, Connected TV, EPG (Electronic Program Guide), Named Entity Recognition (NER), Semantic Disambiguation

Summary:

Bu tezde, kural tabanlı varlık ismi tanıma yönteminden yararlanan bir televizyon içeriği zenginleştirme sistemi önerilir. Sistem televizyon programlarının içeriklerini, bağlamla ilgili verileri alarak, otomatik olarak artırmaya ve bunları kullanıcılara başka bir cihaz ihtiyacı olmaksızın sunmaya çalışır. Sistemin kavramsal tanımının yanı sıra, bir prototip uygulaması geliştirilmiş ve önceden tanımlanmış televizyon kanalları ile birlikte gösterilmiştir. Uygulama kişi, yer, organizasyon gibi varlık isimlerini çıkarmak için web kaynaklarından taranmış elektronik program rehberi bilgisinden faydalanır. Bu amaçla, Türkçe için kural tabanlı bir varlık ismi tanıma algoritması geliştirilmiştir. Semantik anlam ayrımından sonra, çıkarılan varlık isimlerinin detaylı bilgisi Vikipedi'den bulup getirilir ve özet hali kullanıcıya gösterilir. Kural tabanlı varlık ismi tanıma algoritmasının performansını ve televizyon içeriği zenginleştirme sisteminin davranışını değerlendirmek için iki farklı veri seti üzerinde bir dizi deney yürütülmüştür. Deney sonuçları, varlık ismi tanıma yöntemleriyle beraber içerik zenginleştirme sisteminin özellikle haber ve dizi yayınlayan kanallarda oldukça başarılı olduğunu göstermektedir. Anahtar Kelimeler: İçerik Zenginleştirme, İnternet Bağlantılı Televizyonlar, EPG (Elektronik Program Rehberi), Varlık İsmi Tanıma (NER), Semantik Anlam Ayrımı