Penelitian tentang genetika memiliki kesalahan karena autoformat Excel

Perubahan format paksa juga terjadi ketika bekerja dengan Calc dari LibreOffice atau Calc dari OpenOffice. Google Documents tidak memodifikasinya secara otomatis

Dalam pekerjaan sehari-hari dengan spreadsheet Anda harus memperhatikan beberapa penghasilan yang dibuat dalam sel, karena perangkat lunak dapat mengubah nilai saat menginterpretasikan data sebagai nilai numerik atau tanggal.

Sebuah laporan yang diterbitkan oleh majalah Genome Biology mendeteksi kesalahan dalam entri data yang dianalisis: Excel, program referensi di segmen ini, secara otomatis mengubah nama beberapa gen ketika menafsirkannya sebagai tanggal.

Laporan tersebut, yang dikutip oleh The Washington Post, menunjukkan bahwa sekelompok peneliti Australia menganalisis 3600 studi yang dilakukan oleh berbagai jurnal seperti Nature, Science dan PLoS One, dan menemukan bahwa satu dari lima makalah memasukkan kesalahan yang disebabkan oleh autoformat yang menjalankan Excel.

Identifikasi gen, yang biasanya dikatalogkan dengan nama pendek, biasanya ditafsirkan sebagai tanggal. Ini adalah kasus gen Septin 2, yang biasanya disingkat SEPT2, sementara Membran-Associated Ring Finger (C3HC4) 1, E3 Ubiquitin Protein Ligase, diidentifikasi sebagai MARCH1.

"Di Excel, program mengidentifikasi catatan ini sebagai tanggal. SEPT2 menjadi 2 September dan disimpan sebagai 2/9/2016," kata para peneliti. Untuk menghindari masalah ini, ketika bekerja di Excel, peneliti harus ingat untuk secara manual mengubah format menjadi teks sebelum memasukkan data apa pun.

Karena kesalahan ini, 20 persen makalah yang terkait dengan studi genetik memiliki kesalahan yang disebabkan oleh modifikasi otomatis yang dilakukan oleh Excel. Para penulis laporan Genome Biology menunjukkan bahwa masalah ini tidak unik untuk Microsoft Excel, karena perubahan format paksa juga terjadi ketika bekerja dengan Calc dari LibreOffice atau Calc dari OpenOffice. Google Documents, sementara itu, tidak secara otomatis mengubah data yang dimasukkan.

Namun demikian Rekomendasi terbaik untuk jenis kasus ini adalah bahwa peneliti menggunakan alat statistik khusus, seperti R dan Python, dan berhenti menggunakan spreadsheet, kecuali Anda berhati-hati dalam format data.

Temukan yang terbaru tentang ekonomi digital, startup, fintech, inovasi perusahaan, dan blockchain. KLIK DI SINI

Pos terkait

Back to top button