Academic Journals Database
Disseminating quality controlled scientific knowledge

Random Forests Yöntemi ve Sağlık Alanında Bir Uygulama

ADD TO MY LIST
 
Author(s): Muhammet AKMAN | Yasemin GENÇ | Handan ANKARALI

Journal: Turkiye Klinikleri Journal of Biostatistics
ISSN 1308-7894

Volume: 3;
Issue: 1;
Start page: 36;
Date: 2011;
Original page

Keywords: Veri madenciliği | sınıflandırma | random forests | karar ağaçları | karar ormanı

ABSTRACT
Amaç: Veri madenciliği, genel olarak tanımlayıcı ve tahmin edici olmak üzere iki ana başlıkta incelenmektedir. Özellikle tıp alanında veri madenciliği daha çok tahmin edici yönüyle kullanılmaktadır. Bu çalışmada, ağaç tabanlı veri madenciliği yöntemlerinden birisi olan Random Forests (RF) yönteminin incelenmesi ve sağlık alanından elde edilen bir veri seti üzerine uygulaması yapılarak sonuçlarının tartışılması amaçlanmıştır. Gereç ve Yöntemler: RF yönteminde, karar ormanını oluşturan karar ağaçları orijinal veri setinden bootstrap yöntemiyle seçilen farklı örneklerden oluşturulmaktadır. Her karar ağacında veri setindeki tüm değişkenlerden rastgele seçilen az sayıda değişken kullanılmaktadır. Her ağaç bir sınıf için oy vermektedir ve orman sınıflayıcısı bütün ağaçların verdiği oyları toplayarak bir sınıf için son tahminini yapmaktadır. Yöntemin uygulanması amacıyla Diş hekimliği alanından elde edilen bir veri seti kullanılmıştır. Bulgular: Toplam 43 tane demografik, dental ve serolojik özelliklere ait veriler kullanılarak RF yöntemi ile %95.4 oranında başarılı bir sınıflandırma yapılmıştır. Bu karar ormanının hata oranı ise %3.33 olarak bulunmuştur. Aynı veri seti için Bagging ve CART yöntemi ile de sınıflama yapılmış ve Bagging yöntemi ile hata oranı %5.4, CART yöntemi ile %8.75 olarak bulunmuştur. Sonuç: RF yöntemi ile veri setindeki değişken sayısı ve örnek sayısı ne kadar çok olursa olsun genellikle hata oranı düşük sınıflamalar yapılmaktadır. Hata oranının düşüklüğü ise bir topluluk yöntemi olmasından kaynaklanmaktadır. Özelikle çok sayıda değişkenin olduğu DNA veri seti gibi binlerce gen arasından önemli olanları tespit etmek için kullanılabilir.
Save time & money - Smart Internet Solutions      Why do you need a reservation system?