Buradasınız

n < p Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi

A Comparison of Different Clustering Methods on the Biological Data with n<p Dimensions

Journal Name:

Publication Year:

Keywords (Original Language):

Abstract (2. Language): 
This research was carried out on 38 variables from 24 types of pistachio (Pistacia vera L.) with n<p dimensions. However, in order to apply the some multivariate test statistics of clustering analysis to this type data matrix, the number of variables (np) must be decreased. Principal Component, Discriminant and analysis of correlation were used to decrease the number of variables. The reduced number of variables by using these mentioned methods, was comparatively evaluated by using different clustering methods. Present results shown that the most suitable method for clustering is the Ward method used together with Principle Components variable reducing technique. It was also found out that the most suitable measurement index to determine the number of clusters were Wilk’s Lambda, Cmax and Hotelling Lawley Trace statistics.
Abstract (Original Language): 
Araştırma, n<p boyutlu olan, 24 farklı Antepfıstığı (Pistacia vera L.) tipi ve bu tiplerden alınan 38 adet değişken üzerinde yapıldı. Ancak bu tip bir veri matrisine kümeleme analizine ilişkin bazı çok değişkenli test istatistiklerinin uygulanabilmesi için değişken sayısının (np) azaltılması gerekmektedir. Değişken sayısının azaltılmasında Temel Bileşenler (Principal Component) analizi, Ayırma (Diskriminant) analizi ve Korelasyon analizinden yararlanılmıştır. Sözü edilen metotlarla indirgenen değişkenler, farklı kümeleme metotlarıyla karşılaştırmalı olarak incelendi. Sonuçta, kümelemede en uygun yöntemin Temel Bileşenler analizi ile birlikte kullanılan Ward metodunun olduğu saptandı. Küme sayısının belirlenmesinde ise en uygun ölçütün Cmax, Wilks Lambda ve Hotelling Lawley İz istatistiklerinin olduğu belirlenmiştir.

REFERENCES

References: 

Acar, İ., 1997. Ceylanpınar Tarım İşletmesinde Seçilmiş
Bazı Erkek Antep Fıstığı Tiplerinin Morfolojik ve
Biyolojik Özellikleri Üzerinde Bir Araştırma.
Harran Üniv. Fen Bil. Enst. Y. Lisans Tezi
(Basılmamış), 92 s.
Anderberg, M.R., 1973. Cluster Analysis For
Applications. Academic Press, New York 359 S.
Blashfield, R.K., 1976. Mixture Model Test of Cluster
Analysis: Accuracy of Four Agglomerative
Hierarchical Methods. Psychological Bull., 83: 377-
388.
Bliss F.A.,1981. Utilization of Vegetable Germplasm.
Hortscience 16(2): 129-132.
Fisher, L., Van Ness, J.W., 1971. Admissible Clustering
Procedures. Biometrika, 58: (1), 91-104.
Hawkins, D. M., Müller, M.W., Krooden, J.A., 1982.
Topics in Applied Multivariate Analysis. Cambridge
University Press, USA.
Huang Tung C., 2001. The Effects of Linkage Between
Business and Human Resource Managament
Strategies, Personal Review, 30(2):132-151.
Jain, S.K., 1975. Population Structure and the Effects of
Breeding System. in Crop Genetic Resources for
Today and Tomorrow, Ed. Frankel, O.H. and
Hawkes, J.G., Cambridge Uni. Press.
Johnson, A.R., Wichern, D.W., 1992. Applied
Multivariate Statistical Analysis. Prentice Hall
International Inc. New Jersey.
Mac Queen, J., 1967. Some Methods for Classifications
and Stopping Rules: An Evaluation. Comp. J., 20:
359-363.
Mainly, B.F.J., 1994. Multivariate Statistical Methods,
Second Edition, Londra: Chapman– Hall. New
York,
Minitab Inc, 1995. Minitab Release, V: 10,51.
Özdamar, K.,1988. Hastalık Olgularının İncelenmesinde
Kümeleme Çözümlemesinin Kullanılması. T.C.
Anadolu Üniversitesi Yayınları No:295, Tıp
Fakültesi Yayınları No:25, Eskişehir.
Özdamar, K., 1999. Paket Programlar ile İstatistiksel
Veri Analizi. Kaan Kitabevi, Eskişehir, 214s.
Sharma S., 1996. Applied Multivariate Techniques.
John Wiley & Sons.Inc. New York.
Sneath, P. 1957. The Application of Computers to
Taxonomy. Journal of General Microbiology, 17,
201-226.
Sokal R.R., Michener C.D. 1958. A Statistical Method
for Evaluating Systematic Relationships. The
University of Kansas Scientific Bulletin 38: 1409-
1438.
Tan, A., 1983.Sayısal Taksonomik Yöntemlerle
Varyasyonun Saptanması. Ege Bölge Zirai Araş.
Enst. Yay. No: 30, Menemen- İzmir.
Tatlıdil, H., 1992. Uygulamalı Çok Değişkenli İstatistik
Analiz. Hacettepe Üniversitesi, Ankara.

Thank you for copying data from http://www.arastirmax.com