Artikel ini menjawab komentar mengenai analisis data dalam deteksi kanker dini menggunakan SERS-AICS, dengan penjelasan tentang pemisahan data pelatihan dan pengujian. Penulis menjelaskan bahwa akurasi dihitung hanya dari data uji untuk menghindari kesalahan interpretasi. Selain itu, analisis yang lebih mendalam dan randomisasi data juga dilakukan, menunjukkan keandalan model.
Bratchenko et al. mengungkapkan dua kekhawatiran mengenai analisis data spektral dalam teknik Surface-enhanced Raman scattering dan Kecerdasan Buatan untuk Skrining Kanker (SERS-AICS). Mereka mengklaim adanya penyajian akurasi yang tidak sesuai dan penggunaan satu data split dalam evaluasi model. Penelitian kami memisahkan data pelatihan dan pengujian dengan ketat, sehingga akurasi yang dihasilkan tidak dipengaruhi oleh overfitting. Kami menggunakan data uji secara eksklusif untuk menilai model, yang tentu mengurangi kemungkinan interpretasi yang salah mengenai performa. Selanjutnya, kami telah melakukan koreksi pada ukuran sampel yang terlewat dan menyediakan analisis lebih mendalam tentang pengujian dengan kembali mengevaluasi ROC curve dan matriks kebingungan untuk setiap jenis kanker. Hasil tampak konsisten dan menunjukkan bahwa model kami dapat diandalkan untuk deteksi kanker lebih awal. Selain itu, kami lebih banyak melakukan randomisasi pemisahan data untuk uji keandalan model, yang menunjukkan bahwa hasilnya tidak dipilih secara sembarangan melainkan mencerminkan ketepatan pesuruh kami dalam klasifikasi kanker.
Deteksi kanker dini melalui teknik spectroscopy biomolekular dengan penggunaan SERS dan AI semakin berkembang. Pada penelitian sebelumnya, kemungkinan kesalahan analisis data dapat mempengaruhi pemahaman hasil. Oleh karena itu, penting untuk mempertimbangkan metode penyajian hasil yang akurat, memisahkan antara data pelatihan dan pengujian untuk menjaga keandalan informasi, serta memperhitungkan variasi hasil melalui pengulangan evaluasi.
Kami telah menanggapi kekhawatiran penyunting dengan menjelaskan bahwa akurasi model kami dihitung hanya dari data uji, sehingga menghindarkan dari risiko overfitting. Uji keandalan dengan membagikan data secara acak juga menunjukkan konsistensi hasil, mendemonstrasikan bahwa model kami dapat diandalkan untuk deteksi kanker. Sebagai tambahan, koreksi ukuran sampel yang ambigu di dataset juga telah dilakukan untuk memperjelas pemahaman.
Sumber Asli: www.nature.com