dc.contributor.author |
TUNABOYLU, Sezin
|
|
dc.date.accessioned |
2015-11-20T12:54:51Z |
NULL |
dc.date.available |
2015-11-20T12:54:51Z |
NULL |
dc.date.issued |
2011 |
|
dc.identifier.uri |
http://hdl.handle.net/20.500.12397/7857 |
NULL |
dc.description.abstract |
Özellikle ökaryotlarda gen yapılarının tahmin edilmesi biyoenformatiğin önemli konularından biridir. Gen yapılarının tahmin edilmesindeki en önemli konu kodlanan bölgelerdeki kesim bölgeleridir. Kesim bölgelerinin belirlenmesi de verilen DNA dizisindeki ekzonlar ve intronlar arasındaki bölgelerin doğru tanımlanmasına bağlıdır. Bu problem dizi elementlerinin `exon-intron' (EI), `intron-exon' (IE) or `None' (N) sınıfları olarak sınıflandırılması olarak tanımlanabilir._x000B_Bu tez çalışmasında, kesim bölgelerini belirlemek için geliştirilen yeni bir yöntem olan ve nükleotit baz frekanslarından oluşan spesifik pozisyonel skorlama matrisini kullanan Ağırlıklandırılmış Pozisyonel Skorlama Metodu (WPSSM) önerilmiştir. Ayrıca optimal ağırlıkların ve eşik değerinin belirlenmesinde genetik algoritma kullanılmıştır. Bu metod öğrenme, tanımlama ve geçerlilik aşamaları olmak üzere üç aşamadan oluşmaktadır. Önerilen WPSS metodu literatürdeki pek çok metodun performansıyla karşılaştırıldığında etkili sonuçlar vermiştir. Hesaplamalar, `UCI Repository of machine learning databases' veri tabanından alınan DNA dizileri üzerinde gerçekleştirilmiştir. The prediction of the complete structure of genes is one of the important tasks of bioinformatics, especially in eukaryotes. A crucial part in gene structure prediction is to determine the splice sites in the coding region. Identification of splice sites depends on the precise recognition of the boundaries between exons and introns of a given DNA sequence. This problem can be formulated as a classification of sequence elements into `exon-intron? (EI), `intron-exon? (IE) or `None? (N) boundary classes._x000B_In this thesis, we propose a new Weighted Position Specific Scoring Method (WPSSM) to recognize splice sites which uses a position-specific scoring matrix constructed by nucleotide base frequencies. A genetic algorithm is used in order to tune the weight and threshold parameters of the positions on. This method comprises of three phases: learning phase, identification phase and validation phase. In this study, the optimal position weights and threshold parameter are found via genetic algorithm. The proposed WPSS method poses efficient results compared to the performance of various methods proposed in the literature. Computational experiments are conducted on the DNA sequence dataset from `UCI Repository of machine learning databases?. |
en_US |
dc.language.iso |
en |
en_US |
dc.publisher |
DEÜ Fen Bilimleri Enstitüsü |
en_US |
dc.subject |
Exon-Intron Splice Sites, Weighted Position Specific Scoring Method, Genetic Algorithm. Ekson-Intron Kesim Bölgeleri, Ağırlıklandırılmış Pozisyonel Skorlama Metodu, Genetik Algoritma. |
en_US |
dc.title |
Analysis of genetic data via data mining methods and its applications |
en_US |
dc.title.alternative |
Genetik verilerin veri madenciliği yöntemleri ile incelenmesi ve uygulamaları |
en_US |
dc.type |
Thesis |
en_US |