DSpace Repository

Analysis of genetic data via data mining methods and its applications

Show simple item record

dc.contributor.author TUNABOYLU, Sezin
dc.date.accessioned 2015-11-20T12:54:51Z NULL
dc.date.available 2015-11-20T12:54:51Z NULL
dc.date.issued 2011
dc.identifier.uri http://hdl.handle.net/20.500.12397/7857 NULL
dc.description.abstract Özellikle ökaryotlarda gen yapılarının tahmin edilmesi biyoenformatiğin önemli konularından biridir. Gen yapılarının tahmin edilmesindeki en önemli konu kodlanan bölgelerdeki kesim bölgeleridir. Kesim bölgelerinin belirlenmesi de verilen DNA dizisindeki ekzonlar ve intronlar arasındaki bölgelerin doğru tanımlanmasına bağlıdır. Bu problem dizi elementlerinin `exon-intron' (EI), `intron-exon' (IE) or `None' (N) sınıfları olarak sınıflandırılması olarak tanımlanabilir._x000B_Bu tez çalışmasında, kesim bölgelerini belirlemek için geliştirilen yeni bir yöntem olan ve nükleotit baz frekanslarından oluşan spesifik pozisyonel skorlama matrisini kullanan Ağırlıklandırılmış Pozisyonel Skorlama Metodu (WPSSM) önerilmiştir. Ayrıca optimal ağırlıkların ve eşik değerinin belirlenmesinde genetik algoritma kullanılmıştır. Bu metod öğrenme, tanımlama ve geçerlilik aşamaları olmak üzere üç aşamadan oluşmaktadır. Önerilen WPSS metodu literatürdeki pek çok metodun performansıyla karşılaştırıldığında etkili sonuçlar vermiştir. Hesaplamalar, `UCI Repository of machine learning databases' veri tabanından alınan DNA dizileri üzerinde gerçekleştirilmiştir. The prediction of the complete structure of genes is one of the important tasks of bioinformatics, especially in eukaryotes. A crucial part in gene structure prediction is to determine the splice sites in the coding region. Identification of splice sites depends on the precise recognition of the boundaries between exons and introns of a given DNA sequence. This problem can be formulated as a classification of sequence elements into `exon-intron? (EI), `intron-exon? (IE) or `None? (N) boundary classes._x000B_In this thesis, we propose a new Weighted Position Specific Scoring Method (WPSSM) to recognize splice sites which uses a position-specific scoring matrix constructed by nucleotide base frequencies. A genetic algorithm is used in order to tune the weight and threshold parameters of the positions on. This method comprises of three phases: learning phase, identification phase and validation phase. In this study, the optimal position weights and threshold parameter are found via genetic algorithm. The proposed WPSS method poses efficient results compared to the performance of various methods proposed in the literature. Computational experiments are conducted on the DNA sequence dataset from `UCI Repository of machine learning databases?. en_US
dc.language.iso en en_US
dc.publisher DEÜ Fen Bilimleri Enstitüsü en_US
dc.subject Exon-Intron Splice Sites, Weighted Position Specific Scoring Method, Genetic Algorithm. Ekson-Intron Kesim Bölgeleri, Ağırlıklandırılmış Pozisyonel Skorlama Metodu, Genetik Algoritma. en_US
dc.title Analysis of genetic data via data mining methods and its applications en_US
dc.title.alternative Genetik verilerin veri madenciliği yöntemleri ile incelenmesi ve uygulamaları en_US
dc.type Thesis en_US


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account