Association Rules in Data Mining and an Application in Second Hand Car Market
Journal Name:
- Ordu Üniversitesi Sosyal Bilimler Araştırmaları Dergisi
Keywords (Original Language):
Author Name | University of Author | Faculty of Author |
---|---|---|
Abstract (2. Language):
Number of road motor vehicles that are handed over are increasing over the years. That makes the detailed examination of second hand car market is a necessity. It is possible to extract useful information about the operating mechanism of second hand car market using new analysis techniques and massive datasets. The purpose of this study is to examine the database which includes data belong to second hand cars by association rules. Association rules are successful at determining which two objects are observed simultaneously in a dataset. For this study, a dataset includes to 21109 second hand cars with 73 variables is scraped from a website in July 2016 and August 2016. In order to apply the apriori algorithm, the dataset must be consisted from Boolean variables. Numerical variables are converted to Boolean type by using their distribution. The association rules that are created with apriori algorithm is visualized with a network graph. At the end of the study rules such as “diesel cars have less fuel consumption, cannot go much faster, have higher torque values; new and expensive cars have higher taxes” are created. The overall results have useful information for those who operate in second hand car market.
Bookmark/Search this post with
Abstract (Original Language):
İkinci el piyasada devredilen otomobil sayısı her geçen yıl artmaktadır. Bu durum ikinci el araç piyasasının detaylı bir şekilde incelenmesini zorunlu kılmaktadır. Yeni geliştirilen analizler ve yığınla toplanabilen veri setleri yardımıyla ikinci el araç piyasasının işleyiş mekanizmasına ilişkin faydalı bilgiler ortaya çıkabilmektedir. Çalışmanın amacı, ikinci el araçlara ilişkin verilerin bulunduğu bir veri tabanını birliktelik kuralları ile incelemektir. Birliktelik kuralları bir arada gözlenen özelliklerin belirlenmesinde başarıyla kullanılmaktadır. Bu çalışma için, 2016 yılının Temmuz ayında ve Ağustos ayının ilk üç haftasında ikinci el otomobil ilanlarının yer aldığı bir siteden 211109 adet otomobile ait 73 adet değişken web kazıma tekniği ile bir araya getirilmiştir. Birliktelik kurallarının oluşturulabilmesi için veri setinin mantıksal (boolean) değişkenlerden oluşması gerekmektedir. Sayısal değişkenler, dağılımları göz önünde bulundurulmak üzere mantıksal yapıya çevrilmiştir. Çalışmada apriori algoritması ile oluşturulan birliktelik kuralları ağ grafiği yardımı ile görselleştirilmiştir. Çalışma sonunda “dizel araçlar az yakar, fazla hız yapamazlar, torkları yüksektir; yeni ve pahalı araçların vergisi yüksektir” gibi kurallar oluşturulmuştur. Çalışmanın sonuçları ikinci el araç piyasasında işlem yapan taraflar için yol gösterici nitelikte bilgiler içermektedir.
FULL TEXT (PDF):
- 1