HAVAYOLU MÜŞTERİ MEMNUNİYETİNİN ANALİZİNDE SENTETİK VE GERÇEK VERİLERİN ETKİSİ: MAKİNE ÖĞRENİMİ YAKLAŞIMI

Author :  

Year-Number: 2024-73
Yayımlanma Tarihi: 2024-12-21 22:16:31.0
Language : Turkish
Konu : management information systems
Number of pages: 190-205
Mendeley EndNote Alıntı Yap

Abstract

Duygu analizi, müşteri geri bildirimlerini anlamak ve iş stratejilerini yönlendirmek için kritik bir araçtır. Makine öğrenmesi ve derin öğrenme modelleri, büyük veri kümelerinde yüksek doğruluk oranları sunarak bu süreçleri otomatikleştirme potansiyeline sahiptir. Ancak, büyük ve etiketlenmiş veri setlerinin toplanması zaman alıcı ve maliyetlidir. Havayolu sektörü, yoğun müşteri etkileşimi ve yüksek hizmet beklentileri nedeniyle müşteri memnuniyetinin sürekli ölçülmesi gereken bir alandır. Bu sektörde müşteri geri bildirimlerinin etkin analizi, rekabet avantajı sağlamak, hizmet kalitesini artırmak ve müşteri sadakatini geliştirmek açısından kritik öneme sahiptir. Bu çalışmada, havayolu müşteri memnuniyeti bağlamında, gerçek verilerle geniş dil modelleri kullanılarak üretilen sentetik verilerin duygu analizi üzerindeki etkileri karşılaştırılmıştır.   

Deney sonuçları, sentetik verilerin özellikle veri eksikliği durumunda, gerçek verilerle kıyaslanabilir bir performans sağladığını göstermektedir. Evrişimsel sinir ağı tabanlı duygu analizi modelinin doğruluk oranı %95.20, F1 skoru %95.16 olarak ölçülmüş ve modelin hem gerçek hem de sentetik verilerle etkili sonuçlar üretebildiği görülmüştür. Bununla birlikte, sentetik verilerin bağlamsal çeşitlilik açısından gerçek verilerin yerini tam anlamıyla alamadığı gözlemlenmiştir. 

Sonuç olarak, sentetik verilerin duygu analizi modellerinde tamamlayıcı bir araç olarak kullanılabileceği, ancak tamamen gerçek verilerin yerine geçemeyeceği sonucuna ulaşılmıştır. Çalışma, sentetik verilerin veri toplama sürecindeki potansiyel rolünü ve müşteri geri bildirimleri analizinde veri eksikliğini giderme açısından sağladığı faydaları vurgulamaktadır. Gelecekteki çalışmalar için, sentetik verilerin bağlam çeşitliliğini artırmaya yönelik yöntemlerin geliştirilmesi önerilmektedir.

Keywords

Abstract

Sentiment analysis is a vital instrument for comprehending customer feedback and directing business strategies. The application of machine learning and deep learning models has the potential to automate this process, delivering high accuracy rates on large datasets. However, the collection of large and labeled datasets is a time-consuming and costly process. The airline industry, which is characterized by intense customer interaction and high service expectations, is an area where the continuous measurement of customer satisfaction is essential. The effective analysis of customer feedback in this sector is critical for gaining a competitive advantage, improving service quality, and fostering customer loyalty. In this study, the impact of synthetic data generated using large language models and real data on sentiment analysis in the context of airline customer satisfaction was compared.

The experimental results demonstrated that synthetic data can provide performance comparable to that of real data, particularly in cases of data scarcity. The accuracy of the convolutional neural network-based sentiment analysis model was measured at 95.20%, with an F1 score of 95.16%. These results indicate the effectiveness of the model with both real and synthetic data. However, it was observed that synthetic data cannot fully replace real data in terms of contextual diversity.

In conclusion, the use of synthetic data can serve as a complementary tool for sentiment analysis models; however, it cannot entirely substitute for real data. This study underscores the potential utility of synthetic data in the data collection process and its advantages in addressing data scarcity in customer feedback analysis. It is recommended that future studies develop methods that enhance the contextual diversity of synthetic data.

Keywords


                                                                                                                                                                                                        
  • Article Statistics