Türkçe e-postaların Doc2Vec ile sınıflandırılması

[ X ]

Tarih

2019

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Institute of Electrical and Electronics Engineers Inc.

Erişim Hakkı

info:eu-repo/semantics/closedAccess

Özet

Bu çalışmada Türkçe e-postalar için makine öğrenmesi teknikleri ile sınıflandırma uygulaması geliştirilerek spam olan Türkçe e-postaların tespit edilmesi hedeflenmiştir. TurkishEmail veri setinden alınan e-postalar eğitim ve test verisi olarak kullanılmıştır. Doc2Vec kütüphanesine ait algoritmalar kullanılarak e-postalar sayısallaştırılmış, sonrasında özellik çıkarımı yapılmıştır. Bu özellikler üzerinden test verileri çeşitli sınıflandırma algoritmaları ile sınıflandırılarak analiz edilmiş ve sonuçlar tartışılmıştır
In this study, it was aimed to determine the Turkish e-mails which are spam by developing the application with machine learning techniques for Turkish e-mails. E-mails received from the TurkishEmail data set were used as training and test data. Numerical representation of the e-mails was obtained by using the algorithms of Doc2Vec library and then the feature was extracted. Test data were analyzed by various classification algorithms and the results were discussed.

Açıklama

Anahtar Kelimeler

Makine Öğrenmesi, Doğal Dil İşleme, Metin Sınıflandırma, Spam Filtreleme, E-posta Sınıflandırma, Doc2Vec, Machine Learning, Natural Language Processing, Text Classification, Spam Filtering, E-mail Classification, Doc2Vec

Kaynak

1st International Informatics and Software Engineering Conference: Innovative Technologies for Digital Transformation, IISEC 2019 - Proceedings November 2019

WoS Q Değeri

Scopus Q Değeri

N/A

Cilt

Sayı

Künye

Deniz, E., Erbay, H., Coşar, M. (2019). Türkçe e-postaların Doc2Vec ile sınıflandırılması. In 2019 1st International Informatics and Software Engineering Conference (UBMYK) (pp. 1-4). IEEE.