Akademik Çalışmalar

Kullanılabilirlik Testlerindeİnsan ve Sentetik Katılımcıların Karşılaştırmalı Analizi

Okuma Süresi: 3 dakika

3 Şubat 2026 tarihinde İstanbul Beykent Üniversitesi’nde fiziksel, 4 ve 5 Şubat 2026 tarihlerinde çevrimiçi (online) ortamda gerçekleştirilen Akademik Bilişim Konferansı kapsamında sunulmuştur.

ÖZET

Etkileşimli sistemlerin başarısı, kullanıcı deneyimi (UX) ve kullanılabilirlik ilkelerinin etkin biçimde optimize edilmesine dayanmaktadır. Geleneksel kullanılabilirlik testleri, insan merkezli ve ampirik içgörüler sunsa da; yüksek maliyet, lojistik zorluklar ve sınırlı örneklem büyüklüğü nedeniyle modern, çevik yazılım geliştirme süreçleriyle uyum sağlamakta zorlanmaktadır. Özellikle hızlı yineleme gereksinimi, bu yöntemleri sürdürülebilir bir kalite güvence aracı olmaktan çıkarabilmektedir.

Üretken Yapay Zekâ ve Büyük Dil Modellerindeki (LLM) gelişmeler, İnsan-Bilgisayar Etkileşimi (HCI) ve UX alanında “Sentetik Kullanıcı Testleri” olarak adlandırılan yeni bir yaklaşımın ortaya çıkmasına yol açmıştır. Sentetik kullanıcılar; belirli demografik özellikler, bilişsel modeller ve davranışsal sezgiseller temelinde kurgulanan, insan-sistem etkileşimini dijital olarak simüle eden otonom aktörlerdir. Bu yaklaşım; test süreçlerinin otomasyonu, uç kullanıcı senaryolarının temsil edilmesi ve deneylerin yüksek hassasiyetle tekrarlanabilmesi açısından önemli bir potansiyel sunmaktadır. Bununla birlikte, sentetik kullanıcıların ürettiği verilerin insan davranışını ne ölçüde yansıttığı ve epistemolojik geçerliliği akademik literatürde tartışmalıdır.

Bu çalışmanın amacı, gerçek kullanıcılar ile sentetik kullanıcıların kullanılabilirlik değerlendirme performanslarını karşılaştırmalı olarak incelemektir. Araştırma; davranışsal örtüşme düzeyini ölçmeyi, farklı UX bileşenlerinde sentetik testlerin etkinliğini değerlendirmeyi ve sentetik verilerin epistemolojik değerini ampirik bulgularla ortaya koymayı hedeflemiştir. Mobil bir uygulama üzerinde yürütülen deneyde, gerçek kullanıcılardan (n>30) görev tamamlama süresi, hata oranları, SUS skorları ve nitel veriler toplanmış; aynı görevler farklı LLM mimarileriyle oluşturulan sentetik kullanıcılar tarafından da icra edilmiştir. Elde edilen veriler, temel istatistiksel yöntemler ve davranışsal sınıflandırmalarla karşılaştırılmıştır.

Bulgular, sentetik kullanıcı performansının UX bileşenlerine göre anlamlı biçimde değiştiğini göstermektedir. Kural temelli ve bilişsel olarak yapılandırılmış görevlerde sentetik kullanıcıların gerçek kullanıcılarla yüksek düzeyde örtüştüğü; görev başarımı ve mantıksal çıkarımlarda güçlü performans sergilediği tespit edilmiştir. Buna karşılık, duygusal tepkiler, irrasyonel kararlar ve deneyime dayalı sezgisel davranışlar gibi “etkili biliş” gerektiren süreçlerde sentetik modellerin sınırlı kaldığı görülmüştür. İnsan davranışının kaotik ve bağlamsal doğası, sentetik modellerde genellikle ortalama ve idealize edilmiş bir rasyonaliteye indirgenmektedir. Bu durum, temsiliyet önyargısını sentetik kullanıcı testlerinin en kritik zayıflığı haline getirmektedir.

Sonuç olarak, sentetik kullanıcı modelleri verimlilik, hız ve tekrarlanabilirlik açısından güçlü bir araç olmakla birlikte, insan deneyiminin fenomenolojik ve duygusal derinliğini tam olarak ikame edememektedir. Bu nedenle, erken tasarım ve keşif aşamalarında tamamlayıcı bir yöntem olarak kullanımları uygun görülürken, nihai değerlendirme ve kullanıcı onay süreçlerinde gerçek kullanıcı katılımının vazgeçilmez olduğu vurgulanmaktadır.

YAZARLAR

Kemal ŞAHİN
Mimar Sinan Güzel Sanatlar Üniversitesi, Türkiye

image
Kemal ŞAHİN | Akademik Hayat

Akademisyen, kullanıcı deneyimi ve arayüz tasarımı, veri görselleştirme, web/mobil uygulama geliştirme.

Kemal ŞAHİN'i yakından tanıyın.