EFFECTS OF BACKGROUND DATA DURATION ON SPEAKER VERIFICATION PERFORMANCE
Journal Name:
- Uludağ Üniversitesi Mühendislik-Mimarlık Fakültesi Dergisi
Keywords (Original Language):
Author Name | University of Author | Faculty of Author |
---|---|---|
Abstract (2. Language):
Gaussian mixture models with universal background model (GMM-UBM) and vector
quantization with universal background model (VQ-UBM) are the two well-known classifiers used for
speaker verification. Generally, UBM is trained with many hours of speech from a large pool of different
speakers. In this study, we analyze the effect of data duration used to train UBM on text-independent
speaker verification performance using GMM-UBM and VQ-UBM modeling techniques. Experiments
carried out NIST 2002 speaker recognition evaluation (SRE) corpus show that background data duration
to train UBM has small impact on recognition performance for GMM-UBM and VQ-UBM classifiers.
Bookmark/Search this post with
Abstract (Original Language):
Gauss karışım modeli genel arka plan modeli (GKM-GAM) ve vektör nicemleme genel arka plan
modeli (VN-GAM) konuşmacı doğrulamada sık kullanılan iki yöntemdir. Genellikle GAM modeli fazla
sayıda farklı konuşmacının bulunduğu bir kümeden seçilen saatlerce uzunluktaki ses işaretleri
kullanılarak eğitilir. Bu çalışmada, GAM modelinin eğitiminde kullanılan veri miktarının metinden
bağımsız konuşmacı doğrulama performansına etkisi incelenmektedir. NIST 2002 konuşmacı tanıma
değerlendirme veritabanı ile GKM-GAM ve VN-GAM yöntemleri kullanılarak yapılan deneysel
çalışmalar arka plan modelini eğitmek için kullanılan veri miktarının konuşmacı tanıma performansına
çok fazla etkisinin olmadığı görülmüştür.
FULL TEXT (PDF):
- 1
111-119