Türkçe e-postaların Doc2Vec ile sınıflandırılması
[ X ]
Tarih
2019
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Institute of Electrical and Electronics Engineers Inc.
Erişim Hakkı
info:eu-repo/semantics/closedAccess
Özet
Bu çalışmada Türkçe e-postalar için makine öğrenmesi teknikleri ile sınıflandırma uygulaması geliştirilerek spam olan Türkçe e-postaların tespit edilmesi hedeflenmiştir. TurkishEmail veri setinden alınan e-postalar eğitim ve test verisi olarak kullanılmıştır. Doc2Vec kütüphanesine ait algoritmalar kullanılarak e-postalar sayısallaştırılmış, sonrasında özellik çıkarımı yapılmıştır. Bu özellikler üzerinden test verileri çeşitli sınıflandırma algoritmaları ile sınıflandırılarak analiz edilmiş ve sonuçlar tartışılmıştır
In this study, it was aimed to determine the Turkish e-mails which are spam by developing the application with machine learning techniques for Turkish e-mails. E-mails received from the TurkishEmail data set were used as training and test data. Numerical representation of the e-mails was obtained by using the algorithms of Doc2Vec library and then the feature was extracted. Test data were analyzed by various classification algorithms and the results were discussed.
In this study, it was aimed to determine the Turkish e-mails which are spam by developing the application with machine learning techniques for Turkish e-mails. E-mails received from the TurkishEmail data set were used as training and test data. Numerical representation of the e-mails was obtained by using the algorithms of Doc2Vec library and then the feature was extracted. Test data were analyzed by various classification algorithms and the results were discussed.
Açıklama
Anahtar Kelimeler
Makine Öğrenmesi, Doğal Dil İşleme, Metin Sınıflandırma, Spam Filtreleme, E-posta Sınıflandırma, Doc2Vec, Machine Learning, Natural Language Processing, Text Classification, Spam Filtering, E-mail Classification, Doc2Vec
Kaynak
1st International Informatics and Software Engineering Conference: Innovative Technologies for Digital Transformation, IISEC 2019 - Proceedings November 2019
WoS Q Değeri
Scopus Q Değeri
N/A
Cilt
Sayı
Künye
Deniz, E., Erbay, H., Coşar, M. (2019). Türkçe e-postaların Doc2Vec ile sınıflandırılması. In 2019 1st International Informatics and Software Engineering Conference (UBMYK) (pp. 1-4). IEEE.