Abstract:
Lojistik regresyonda, gözlenen varyansın, beklenen varyanstan büyük olması aşırı yayılım olarak tanımlanmaktadır. Karışımlı modellemede, aşırı yayılıma gözlenemeyen heterojenliğin neden olduğu varsayılmaktadır. Veri seti kendi içerisinde homojen alt populasyonlara ayrılarak, aşırı yayılım giderilmektedir. Karışımlı lojistik regresyonda parametre tahminlerinin elde edilmesinde EM algoritmasını esas alan en çok olabilirlik yöntemi kullanılmaktadır. Uygun model seçiminde ise AIC ve BIC ölçütleri yaygın olarak kullanılmaktadır. Çalışmada, lojistik regresyon analizi sonucunda meydana gelen aşırı yayılım, veri seti kendi içerisinde homojen iki alt populasyona ayrılarak giderilmiştir. Modele alınan bağımsız değişkenlerin tamamı etkileri istatistiksel olarak önemli bulunmuştur (p<0.01). In logistics regression, when observed variance is more than expected variance it is defined as over dispersion. In mixture modeling, it is assumed that unobserved heterogeneity causes the over dispersion. The data set is divided into homogenous sub proportions in order to overcome the over dispersion. In obtaining the parameter estimations, Maximum likelihood method which takes the EM algorithm, is used. For suitable model selection, AIC and BIC criteria are widely used. In this study, over dispersion caused by logistic regression analysis was solved by separating the data set to two homogenous sub- populations. All independent variables taken to the model were found statistically significant (p<0.01).