Buku yang benar-benar menarik saya untuk menyelam saat membacanya. Satu penyesalan saya, saya belum membaca buku ini saat menyelesaikan tesis saya. Buku ini banyak memberikan pelajaran dan motivasi mengapa dalam bidang riset social science benar-benar harus komprehensif membuat sebuah model statistik. Untuk yang tertarik mendengarkan ide-ide brilian serta ulasan mengenai betapa menariknya riset di bidang social science, lanjut terus membaca ya!
Buku ini menjelaskan secara komprehensif mengenai apa yang disebut sebagai weapon of math destruction, yakni sebuah perubahan otomatisasi dengan mengandalkan sistem komputer untuk memproses big data dengan harapan dapat memberikan hasil yang tidak bias, akan tetapi pada kenyataannya kekeliruan menentukan proxy yang digunakan di dalam sistem justru menjadikan hasil yang didapat merugikan pihak tertentu dan tak ada yang dapat disalahkan selain mengatakan ini adalah hasil dari sistem. Contoh-contoh yang dipakai dalam buku ini kebanyakan memang tentang hal-hal yang terjadi di Amerika. Namun bukan tak mungkin perkembangan Indonesia yang kini menunjukkan ke arah otomatisasi bisa berakhir dengan kesalahan yang sama jika tidak mengambil pelajaran dari apa yang terjadi di Amerika.
Contoh yang paling familiar dan sering kita lihat yakni perangkingan universitas. Buku ini menjelaskan asal mula terdapat sistem perankingan tersebut yakni berawal dari sebuah perusahaan berita dan majalah yang dalam kondisi sulit bernama U.S News & World Report pada tahun 1983 yang berinisiatif melakukan proyek ambisius untuk meranking 1800 college dan universitas di Amerika Serikat. Akan tetapi hasil yang didapat yakni universitas yang mengajukan komplain karena merasa penilaian tidak adil dan mereka seharusnya meraih peringkat yang lebih tinggi. Saya menyukai pemilihan kata di dalam buku ini yakni algoritma yang disamakan dengan opini yang diformalisasi menggunakan kode dalam sistem komputer. Kesalahan memilih dan juga memproporsikan proxy atau parameter akan membawa kepada suatu hasil yang tidak merepresentasikan kondisi sebenarnya. Lebih jauh lagi sebuah lingkaran setan yang terjadi jika sebuah institusi memiliki peringkat buruk, maka otomatis dihindari siswa, tenaga pengajar, sedikitnya donasi untuk fasilitas pendukung, sehingga pada akhirnya sistem perangkingan ini menjadikan institusi yang sedang berusaha memperbaiki diri akan makin terpuruk dan menemui jalan buntu. Masih banyak argumen lain yang menjadi pembuka mata kenapa kita tidak boleh hanya berpatokan dengan ranking suatu universitas dalam melakukan penilaian dan buku ini membahasnya secara gamblang. Tak jarang beberapa universitas memalsukan data agar dapat memperbaiki peringkatnya.
Pernahkan kita memperhatikan bahwa kolom iklan di website yang sedang kita buka terkadang seolah bisa membaca pikiran kita? Misalkan kita sedang berencana liburan ke Malang, maka secara ‘kebetulan’ terdapat iklan tentang paket wisata ke Malang di website yang sedang kita buka, meskipun saat itu kita tidak sedang membuka website terkait kota Malang. Hal inilah yang disebut Big Data. Di zaman kemajuan internet yang sungguh mengagumkan saat ini, setiap individu memiliki data pribadi yang dapat dengan mudah diektraksi di internet. Sebut saja profil facebook, foto kita di instagram, profil linkedin dan sejenisnya. Begitu pula dengan history pencarian kita di google. Adanya data-data tersebut memudahkan pihak marketing melakukan apa yang disebut ‘targeted marketing‘. Ada satu sisi gelap yang dibahas di buku ini dari praktik targeted marketing yakni iklan yang ditawarkan pada individu-individu yang sedang dalam kondisi labil dan tak punya pilihan dan berakhir mengklik iklan tersebut. Misalnya dengan melihat profil seseorang yang tinggal di kawasan ekonomi bawah (dengan melihat alamat IP komputer yang mengakses maupun deteksi GPS), kebiasaannya mengunjungi supermarket diskon, dan seorang single mom kemudian iklan yang ditampilkan yakni pinjaman jangka pendek dengan pembayaran yang dapat dicicil harian. Terdengar bagai angin segar namun sesungguhnya bunga yang dikenakan bisa mencapai 30% dengan beralasan ia adalah profil yang memiliki resiko tinggi untuk gagal bayar.
Buku ini juga mengajukan pertanyaan yang menohok yakni apakah hal di atas etis untuk dilakukan? Terkait etis atau tidak, lebih jauh buku ini menunjukkkan bahwa zaman sekarang apa yang disebut rasis mungkin sudah mengalami pergeseran. Apabila dahulu hanya sebatas warna kulit, kini penggolongan individu ke dalam kelompok-kelompok bersifat makin masif. Sebut saja penentuan profil seseorang atas kemampuan finasialnya berdasarkan kode pos tempat ia tinggal, apakah ia pernah telat membayar tagihan bulanan listrik dan air, apakah pernah memiliki kredit macet, dan parameter sejenisnya. Kita tahu tak semua orang yang dalam kesulitan finansial akan bernasib dalam kemiskinan sepanjang hidupnya. Banyak kisah anak petani yang pintar dan mampu menjadi ilmuwan pernah kita dengar. Bisa dibayangkan betapa hambatan luar biasa yang dihadapi dan juga kesempatan memperbaiki nasib yang mungkin hilang akibat kesulitan menemukan pinjaman untuk kuliah sang anak diakibatkan penilaian oleh sistem yang mengkategorikan mereka sebagai peminjam dengan resiko tinggi?
Contoh lainnya yang mungkin makin membuat kita bergidik ngeri yakni data kita bahkan diperjualbelikan secara bebas. Mungkin pernah kita memberikan data kita kepada pihak perumahan saat meminta brosur penjualan. Akibatnya data kita berisi email dna data pribadi lainnya dapat berpindah tangan ke pihak lain yang membutuhkan data sejenis. Bisa jadi aplikasi kerja kita ditolak karena calon perusahaan menemukan kita pernah memiliki catatan kriminal yang tak kita sebutkan dalam resume, namun ternyata itu adalah orang yang memiliki kesamaan nama dan tanggal lahir dengan kita. Kemungkina itu ada!
Poin terakhir yang berkesan bagi saya dalam buku ini yakni saat penulis menyoroti mengenai correlation dan causation. Hal ini sangat relevan dengan perjuangan saya dalam menyusun tesis. Bisa dibilang 2/3 dari waktu 2 tahun kuliah saya dipakai untuk menyusun landasan teori. Bolak-balik sensei merevisi landasan teori dan pernah hampir frustasi. Namun buku ini semakin menyadarkan saya mengapa sensei betul-betul menitikberatkan penelitian pada landasan teori.Penelitian di bidang social science sifatnya sangat luas. Berbeda dengan bidang science murni yang eksak. Penelitian social science berusaha memahami fenomena sosial yang terjadi kemudian menemukan parameter-parameter yang potensial dalam mempengaruhi terjadinya fenomena tersebut. Apa parameternya? jawabnya bisa apapun. Di sinilah tantangan dalam melakukan penelitian social science.
Buku ini menunjukkan titik kritis antara correlation dan causation yang terkadang justru menjerumuskan seorang peneliti untuk mengambil kesimpulan yang salah. Sebagai contoh seorang yang tinggal di kawasan kumuh, sekolah di sekolah dengan peringkat buruk, kemudian tertangkap melakukan pencurian. Kita bisa mengatakan bahwa karena ia berada di kawasan kumuh, maka akan banyak berteman dengan orang yang juga kriminil, sehingga kita mengatakan kawasan kumuh adalah penyebab ia melakukan tindakan kriminil itu. Apakah ini valid? Bisa jadi tidak. Mungkin dengan tinggal di kawasan kumuh memiliki korelasi dengan kecenderungan untuk melakukan tindakan kriminil, namun untuk menyimpukan apakah itu penyebabnya, perlu diteliti secara lebih lanjut. Inilah tantangan bagi seorang peneliti di bidang social science. Salah menentukan parameter, dapat berdampak signifikan kepada kehidupan masyarakat apabila model yang ia bangun diimplementasi secara nyata oleh pihak yang berwenang.