New approaches to enhancing the performance on text classification

dc.contributor.advisorGünal, Serkan
dc.contributor.authorUysal, Alper Kürşat
dc.contributor.departmentFen Bilimleri Enstitüsüen_US
dc.date.accessioned2025-12-02T23:23:17Z
dc.date.issued2013
dc.descriptionTez (doktora) - Anadolu Üniversitesien_US
dc.descriptionAnadolu Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Anabilim Dalıen_US
dc.descriptionKayıt no: 843995en_US
dc.description.abstractMetinlerin kategorize edilmesi olarak da bilinen metin sınıflandırmanın amacı metinleri uygun sınıflara atamaktır. İnternet teknolojilerinin hızlı bir şekilde gelişmesine bağlı olarak dünya genelindeki elektronik belge miktarında yüksek miktarda bir artış görülmüştür. Dolayısıyla metin sınıflandırma, bu belgelerin organizasyonunda büyük bir önem kazanmıştır. Metin sınıflandırmadaki önemli sorunlar öznitelik uzayının yüksek boyutluluğu ve bundan kaynaklı hatalı sınıflandırmalardır. Bu tez çalışmasında, metin sınıflandırmadaki bu iki sorunun üstesinden gelebilmek için çeşitli çözümler önerilmiştir. Özel olarak, ayırt edici öznitelik seçici adında yeni bir filtre tabanlı öznitelik seçim yöntemi ortaya çıkarılmıştır. Bunun yanı sıra, öznitelik seçim ve öznitelik dönüşüm işlemlerinden oluşan genetik algoritma yönelimli gizli anlamsal öznitelikler önerilmiştir. Ayrıca, çeşitli öznitelik çıkarım ve öznitelik seçim yöntemlerinin metin sınıflandırmanın bir türü olan istenmeyen kısa mesaj filtreleme problemi üzerindeki etkisi iki farklı dil için detaylı bir şekilde araştırılmıştır. Son olarak, ön işleme yöntemlerinin metin sınıflandırma üzerinde etkisi farklı konu başlıkları ve farklı diller için incelenmiştir. Kıyaslama veri kümeleri üzerinde yapılan kapsamlı deneyler, önerilen tüm çözümlerin daha iyi boyut indirgeme ve/veya sınıflandırma başarımı sağladığını ortaya koymuştur.en_US
dc.identifier.startpageX, 78 y. + 1 CD-ROM.en_US
dc.identifier.urihttps://hdl.handle.net/11421/25803
dc.language.isoengen_US
dc.publisherAnadolu Üniversitesien_US
dc.relation.publicationcategoryTezen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectElektronik posta sistemlerien_US
dc.titleNew approaches to enhancing the performance on text classificationen_US
dc.typedoctoralThesisen_US

Dosyalar

Orijinal seri

Şimdi gösteriliyor 1 - 1 / 1
Yükleniyor...
Thumbnail Image
Ad:
843995.pdf
Boyut:
2.64 MB
Format:
Adobe Portable Document Format
Açıklama
Tam Metin / Full Text

Koleksiyonlar