Lefke Avrupa Üniversitesi (LAÜ) Bilgisayar Mühendisliği Öğretim Üyesi Yrd. Doç. Dr. Zafer Erenel “Elektronik Ortamda Belge Sınıflandırma” konusu ile ilgili açıklamalarda bulundu.
Erenel: son on yılda internet ortamındaki belge sayısı büyük bir hızla artıyor
“Geçtiğimiz on yıl göz önüne alındığında, internet ortamındaki belge sayısının büyük bir hızla artmakta olduğu görülmektedir” diyen Erenel 7’den 70’e milyarlarca kullanıcının kişisel bilgisayarlar, akıllı telefonlar ve tabletler ile bu ortama ulaştıkları göz önüne alındığında bu ortamda oluşturulan belgelerin sayısının artmasının da doğal olduğunu ve çok sayıda belge ile beraber ortaya çıkan bazı sorunların da çözülmesi gerekmekte olduğunu belirtti. Erenel, bu sorunlardan bir tanesinin de elektronik ortamdaki metinlerin sınıflandırılması sorunu olduğunu ifade ederek, “Metin sınıflandırma sorunu, eldeki bir metnin önceden belirlenen sınıflardan hangisine ya da hangilerine girdiğinin belirlenmesi demektir. Bu tip sınıflandırmalar popüler arama motorlarının sayfalarında bile çok verimli çözümler üretebilir. Bugün itibariyle www.yahoo.com arama motorunun sayfasına bakacak olursak, 2020 Amerika Seçimi, Haberler, Finans, Spor, Koronavirüs, Eğlence, Hayat, Alışveriş gibi başlıklar altında bir ağaç yapısı içinde çok sayıda belge gruplanmıştır. Arama motorları dışında, istenmeyen e-posta mesajlarını normal e-postalardan ayırt etmek, bir metnin dilinin otomatik olarak belirlenmesi, farklı yaş grupları veya okuyucu türleri için uygun materyallerin belirlenmesi, duygu analizi, bir konuşmacının veya yazarın bir konuyla ilgili tutumunun belirlenmesi, metin sınıflandırmanın diğer kullanım alanlarıdır”dedi.
Erenel: Vektör makineleri metin sınıflandırmakta sıklıkla kullanılır
Erenel, 1990’larda ve 2000’lerin başında metin sınıflandırmak için oldukça sıklıkla kullanılan sınıflandırıcıların destek vektör makineleri olduğunu belirterek, son zamanlarda kelimeler arasında anlamsal veya kavramsal açıdan ilişki kurmak için kelimelerin ne sıklıkla bir arada geçtiği verisini içeren kelime temsillerinin öğreniminin öne çıktığına dikkat çekti. Erenel “Bu temsiller, derin öğrenme başlığı altında yer alan konvolüsyonel (evrişimsel) sinir ağları ile birlikte kullanılarak destek vektör makinelerinin üzerinde performans üretmeyi başarmıştır”dedi.
Türkçe karakter kullanılmayan ve büyük harflerle yazılmış yorumlar onaylanmamaktadır.