STATISTICAL COMPARISON OF MACHINE LEARNING CLASSIFICATION ALGORITHMS USING BIOMEDICAL DATA SETS
Journal Name:
- Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi
Key Words:
Keywords (Original Language):
Author Name | University of Author | Faculty of Author |
---|---|---|
Abstract (2. Language):
Nowadays, information technology is used in nearly every field. One of the most used is the health sector. Patient datas are stored in computers with the using of digital hospital systems and in this way biomedical data sets are consisted. The size of these data sets is too large and it is very difficult to be analyzed and interpreted by a human. The machine learning algorithms which are workspace of computer engineering are used for analyzing and interpreting these data sets. In this study 6 machine learning algorithms’ performance has been tested with using 9 different biomedical data sets and the obtained results were compared statistically. According to the experimental and statistical results of this study, for the small and medium sized datasets Artificial Neural Network algorithm and K-Nearest Neighbor algorithm are succeeded in terms of classification accuracy performance and cpu time performance, respectively. A part of this work was presented at the ASYU 2014/Izmir symposium.
Bookmark/Search this post with
Abstract (Original Language):
Günümüzde bilişim teknolojileri hemen hemen her alanda kullanılmaktadır. En çok kullanılan alanlardan bir tanesi de sağlık sektörüdür. Dijital hastane sistemlerinin kullanılmasıyla birlikte hasta verileri artık bilgisayar ortamında saklanmakta ve böylelikle biyomedikal veri kümeleri oluşmaktadır. Boyut olarak çok büyük olan bu veri kümelerinin bir insan tarafından analiz edilmesi ve yorumlanması çok zordur. Bunun için bilgisayar mühendisliği çalışma alanlarından biri olan makine öğrenmesi algoritmaları kullanılır. Bu çalışmada 6 tane makine öğrenmesi algoritmalarının başarımları 9 farklı biyomedikal veri kümesi üzerinde test edilmiştir ve elde edilen sonuçlar istatistiksel olarak karşılaştırılmıştır. Deneysel ve istatistiksel sonuçlar birlikte incelediğinde küçük ve orta büyüklükteki biyomedikal veri kümeleri için Yapay Sinir Ağları algoritması sınıflandırma başarımı açısından ve K-en Yakın Komşu algoritması ise çalışma zamanı açısından daha başarılı olmuştur. Bu çalışmanın bir bölümü ASYU 2014/İzmir sempozyumunda bildiri olarak sunulmuştur.
FULL TEXT (PDF):
- 48