Seberapa Penting Asumsi Data?



Data. Entah siapa yang menemukan kata ini untuk merepresentasikan catatan atas kumpulan fakta atau sebuah angka yang terukur, jujur, saya sudah bosan mendengarnya. Bukan karena sentimen negatif terhadap penemunya, namun jika kita terlalu data-oriented dan menjadikan segala keputusan yang kita ambil berdasarkan data-driven. Itu bisa fatal.

Okay, untuk asumsi fatal yang di atas, saya tidak memiliki argumen pendukung. Jadi, jangan terlalu dipikirkan kesimpulannya.

Apa yang menyebabkan saya bosan dengan data? Pertama, disajikan dalam angka. Entah data tersebut kemudian diolah menjadi kontur, grafik, tabel maupun diagram, pada dasarnya ia adalah angka. Kumpulan angka yang mewakili variabel tertentu.

Bagi kalian yang melakukan penelitian, entah itu untuk gelar sarjana maupun pekerjaan instansi terkait, pasti selalu berurusan dengan data untuk menarik kesimpulan. Tugas akhir saya pun begitu. Harus mengambil data untuk menarik sebuah kesimpulan atas penelitian yang dilakukan.

Kemudian, apakah data yang diambil tadi memiliki nilai kebenaran yang dapat dipertanggungjawabkan? Mungkin penelitian tersebut telah dilakukan dengan metode yang sudah teruji memiliki akurasi yang baik. Oke.

Kemungkinan lainnya, penelitian tersebut sudah divalidasi sebelumnya dengan rujukan dari penelitian sebelumnya. Oke. Namun, kecurigaan saya masih begitu besar terkait sebuah pengambilan data. Apakah itu benar?



Bicara masalah data, kita akan lebih jauh berbicara mengenai sampel. Metode tertentu dilakukan untuk menentukan sampel yang akan kita uji. Baik itu secara kualitatif maupun kuantitatif. Namun, lagi-lagi saya meragukan istilah 'sampel' yang diuji coba. Apalagi jika sampel tersebut adalah human behaviour atau perilaku manusia.

Sebagai contoh sebuah startup atau web company, banyak sekali yang menggunakan data untuk urusan pengambilan keputusan. Data yang diambil bisa perhari, bulan bahkan perjam jika perlu. Kemudian dari data tersebut diolah dan dijadikan dasar pengambilan keputusan. Baik untuk keperluan desain sebuah situs web maupun pengembangan produk dari perusahaan tersebut.

Saya juga seringkali berdiskusi dengan +uni dzalika  terkait masalah data untuk sebuah blog. Tentang bagaimana sebuah data memengaruhi tulisan yang akan dibuat sampai tulisan apa yang akan dibuat selanjutnya. Hal tersebut dapat dilihat dari berapa lama sebuah halaman dikunjungi, banyaknya jumlah halaman tersebut dikunjunggi hingga seberapa banyak orang yang 'membenci' halaman tersebut.

Dan sekali lagi, data tersebut saya pertanyakan dalam hati. Apakah memiliki akurasi yang cukup tinggi? Bagaimana jika keputusan menulis artikel tersebut salah sehingga performa dari blog atau situs web tersebut menjadi kian menurun?

Sebagai contoh, Paijo sedang berselancar di dunia maya. Kemudian masuk ke dalam sebuah blog dengan judul artikel "Apa yang Bisa Kita Lakukan Ketika Terjebak Macet Saat Mudik?". Karena Paijo sedang browsing di kantor, ia menandai halaman tersebut dan menyimpannya ke dalam aplikasi Pocket atau Instapaper agar bisa dengan mudah dibaca nantinya. Entah itu di kereta dalam perjalanan pulang atau di rumah nantinya.
New Visitor vs Returning Visitor

Dari kasus di atas, durasi Paijo mengunjungi halaman tersebut mungkin hanya sepersekian menit. Saya asumsikan kurang dari satu menit. Apabila kondisi tersebut dialami oleh sebagian besar pengunjung artikel tersebut, masuk-bookmark-keluar. Maka, artikel tersebut akan memiliki average time on page yang sangat rendah. Apakah average time on page tadi dapat mengindikasikan konten tersebut tidak disukai? Belum tentu.

Itu baru bicara masalah durasi yang mungkin saja artikel tersebut memiliki panjang lebih dari 1000 kata. Cukup panjang bukan?


Designing with Data

Kasus yang sama juga dialami oleh desain suatu perangkat yang berinteraksi dengan manusia. Tidak hanya konten website, desain sebuah mobile app juga bergantung dari data yang diambil. Seperti desain sebuah call to action button, entah ingin diberi warna hijau maupun biru yang bisa dilakukan adalah melakukan validasi.

Mobile app design via graphicloads.com


Bisa dengan berbagai macam cara, seperti mewawancarai langsung pengguna web atau mobile app tersebut maupun mengambil kesimpulan dari data yang sudah ada. Mungkin saya adalah orang yang sedikit pro asumsi, dimana ketika banyak orang yang menyarankan untuk menggunakan A/B testing atau menggunakan tools, saya cenderung tidak terlalu memusingkannya.


Bukan berarti saya anti terhadap keputusan berdasarkan data, tapi lebih kepada mengkhawatirkan data yang tidak akurat dan bernilai salah dengan margin kesalahan yang sangat tinggi. Seringnya, saya menggunakan data untuk mendukung asumsi yang saya buat. Sebab, bagi saya, data tidak bisa berbicara dengan nada "Wah ini bagus! Tapi kurang ini deh".

Belum lagi metode pengambilan data yang dilakukan. Apakah data tersebut sudah mencakup seluruh data yang ada? Apakah metode maupun tools tersebut mampu meng-gather seluruh sistem data yang ada atau hanya sebagian kecil saja?

Fluktuasi data yang tidak dapat dihindari


Sebab, segala sesuatu mengalami perubahan setiap waktunya. Kita tidak pernah mendapatkan kondisi yang benar-benar steady. Tentunya sebuah data selalu mengalami fluktuasi, apalagi jika terkait human behaviour, Entah itu kondisi ekonominya, kesukaannya, tren lingkungan sekitarnya dan lain sebagainya. Dan, sebuah pengukuran data hanya bisa mengambil sebagian kecil tren yang terjadi dalam rentang waktu yang cukup sempit dan skala yang dangkal.


Manipulasi Data

Sebuah kumpulan angka dalam variabel rentan sekali untuk dimanipulasi. Baik manipulasi secara langsung terhadap statistik variabel tersebut, maupun manipulasi dengan cara 'mengakali' pengambil data. Sehingga, data yang terambil memiliki nilai yang diharapkan.

Oke, saya akan coba memberi contoh terkait perhitungan Page View sebuah blog maupun website. Untuk menaikkan jumlah Page View sebenarnya cukup mudah, yakni memaksa user atau visitor mengunjungi halaman tersebut berkali-kali. Mungkin kita sudah cukup familiar untuk memblokir akses dari IP milik kita saat membuka halaman blog milik sendiri. Oke, saya setuju jika data yang diambil dari Page View tidak memperhitungkan kunjungan dari pemilik blog tersebut.

Ah Page View! You lie!


Masalahnya, jika kita melakukan total Page View sebuah blog, persebarannya tidak merata. Tidak semua konten blog tersebut memiliki jumlah Page View yang sama. Beberapa artikel memiliki jumlah Page View yang lebih dominan daripada yang lain. Ini disebut konten pilar dari blog tersebut. Namun, jika kita mengklaim blog tersebut memiliki seribu kunjungan per harinya, apakah pantas menyebutkan bahwa blog tersebut memiliki data yang cukup baik.

Jika saya sebagai pengiklan, tentu akan lebih selektif memilih blog untuk dijadikan mitra. Sebab, bisa jadi ia mampu membuat sebuah konten yang bagus namun tidak memiliki kapabilitas untuk menaikkan konten lain, terutama konten bersponsor. Sehingga saya tidak akan berasumsi terhadap data yang ditunjukkan oleh blog tersebut.

Sebaiknya asumsi data dilakukan ketika kita sudah memiliki visi. Selain itu, kita berada ditengah-tengah obsesi data. Hampir seluruh industri selalu mengatakan data ini itu dan menerbitkan infografiknya sendiri. Dan semua hal itu selalu berdasarkan data untuk memberikan asumsi-asumsi. entah itu benar atau salah.

Jawaban dari pertanyaan di atas, "Seberapa penting asumsi data?" sebenarnya cukup sederhana. Jika algoritma ranking di Google dapat dimanipulasi dengan teknik SEO, artinya data dapat dimanipulasi nilai kebenarannya. Hanya saja, mungkin teramat sulit untuk memanipulasi data tersebut.

Kesimpulannya, data bukanlah asumsi yang harus dipercaya tanpa adanya visi. Begitu pula sebaliknya, keduanya dapat saling mendukung untuk dijadikan sebagai dasar pengambilan keputusan.

Komentar

  1. wah gile, berat bro berat. ini topiknya udah macam topik laporan skripsi aja. yang membuat gue tertarik jadi maksud lo... SEO itu semacam teknik manipulasi? hmm.

    BalasHapus
    Balasan
    1. Manipulasi banget juga nggak, tapi 'optimasi' konten. :D

      Hapus
  2. Bahasanya enak bener, tapi tulisan ini bikin mlonggo.Kelihatan gue kurang banyak baca :o

    BalasHapus
  3. Betul. Penelitian macam skripsi, meskipun proposalnya sudah bagus (latar belakang, metode, teori) tapi kalau pengambilan datanya gak jujur alias dimanipulasi jadi sama aja bohong. XD

    BalasHapus
  4. Apalagi jika untuk menakar apakah seseorang itu jomblo atau tidak. Data se-empiris apapun yang diperoleh tetap saja bisa mengelabuhi. Kalau asmara memang tidak pernah ada yang akurat, Nikita Mirzani sudah membuktikan itu sejak lama.

    BalasHapus
    Balasan
    1. Mungkin data bisa digunakan sebagai argumen sekunder untuk mendukung kejombloan seseorang. Misalnya.

      Hapus
  5. kalau kataku tiap blog ada niche, misal aku ada kerjasama gitu mau ndak mau tak share terus2an biar dapat banyak. nanti kan visitor organik bakal datang setelah postingan itu banyak dibaca. Makanya kalau kerjasama gitu aku biasa kasih yang statistik analitik bukan yang didashboard biar yang ngasih kerjaan juga dihargai,...ga kayak beli dalam karung. Kecuali CP aku diemin karena bukan campaign xD
    Ya Allah panjang ini komenku, trus baca diatas ada nikita mirzani xD jadi berarti kadang data yang terpampang nyata cetar membahana terbalik keadaan sesungguhnya

    BalasHapus
    Balasan
    1. Wah bagus nih, bikin statistik analitik. Soalnya data yang ada di dashboard terutama di blogger kadang kurang begitu relevan, soalnya data yang ditampilkan lebih sedikit daripada yang ada di analytics.

      Hapus
  6. Memang agak susah sih jika datanya adalah human behaviour. Asumsi kita bilang golongan A begini dan golongan B begitu, dan golongan A adalah golongan yang mendominasi dibandingkan dengan golongan B. Yet, everybody has changed, right? Jadi hasilnya tentatif, bisa berubah-ubah. Manipulasi data kadang terjadi di situasi kepepet, dan mungkin ada peluang terjadi. Gue sendiri masih prefer pake tools sih, Rif, meski kadang tools pun masih bisa dimanupulasi.

    Eh, kalau kita masuk ke satu blog/situs/microsite tapi langsung keluar lagi, itu namanya bounce rate kan ya?

    BalasHapus

Posting Komentar

Popular Post

Yuk Kenalan dengan Berbagai Jenis Power Plant yang Ada di Indonesia

Pengalaman Pengembalian Dana (Refund) Tiket Pesawat di Traveloka

LOGO BARU PIZZA HUT