Jurnalisme Data dan ‘Big Data’

Oleh : Aditya Rizki Yudiantika – Pindai.org

Terkadang data kuantitatif tidak menghasilkan argumen yang menarik. Ia membutuhkan alur cerita.

DALAM satu diskusi tentang “jurnalisme (dan) data” beberapa waktu lalu, rekan saya, Wisnu Prasetya Utomo, melemparkan dua poin pertanyaan sebelum mengakhiri sesinya:

Apakah jurnalisme data adalah istilah yang dibuat-buat padahal jurnalisme itu memang seharusnya berdasarkan pada data?
Apakah tugas jurnalis hanya menuliskan dan membunyikan data-data tanpa konteks dan tidak menganalisisnya menjadi informasi yang lebih berguna?

Untuk menjawab pertanyaan itu, ada baiknya kembali merujuk ke istilah dasar, apa itu jurnalisme dan apa itu data. Menurut kamus Oxford, jurnalisme adalah aktivitas atau profesi terkait menulis untuk surat kabar, majalah, atau berita daring (online), termasuk aktivitas menyiapkan berita untuk disiarkan kepada publik lewat radio maupun televisi. Adapun data adalah fakta atau statistik yang dikumpulkan untuk keperluan analisis, bisa berupa data kuantitatif maupun data kualitatif, bisa data mentah maupun ringkasan data (summary).

Agar sebuah data menjadi bernilai maka perlu diolah menjadi informasi. Dari penjelasan ini harus dibedakan penyebutan data dan informasi. Dalam studi manajemen informasi, piramida ‘data-information-knowledge-wisdom’ secara jelas menunjukkan bahwa kedudukan informasi lebih tinggi dibandingkan data.

Dari kedua definisi itu, frasa “jurnalisme data” dihadirkan untuk tujuan yang sedikit berbeda dengan jurnalisme secara umum. Istilah jurnalisme data—atau biasa disebut data-driven journalism (DDJ)—mulai digunakan sejak 2009. Istilah ini menggambarkan proses jurnalistik berdasar pada analisis dan penyaringan ‘set data’ untuk membuat berita (news story).

Dalam satu makalah yang ditulis Mirko Lorenz (dimuat dalam prosiding “Data-driven journalism: what is there to learn”) pada satu konferensi DDJ tahun 2010, dia menambahkan bahwa jurnalisme data memiliki pendekatan lebih luas. Ia tumbuh seiring ketersediaan data terbuka (open data) yang bisa diakses oleh publik dan dapat diolah lewat peranti lunak terbuka (open source). Tujuannya menciptakan layanan baru di ranah publik, membantu konsumen, manajer, dan politisi untuk memahami pola dan membuat keputusan dari temuan-temuan yang ada. Harapannya bisa membantu menempatkan wartawan ke dalam peran yang lebih relevan bagi masyarakat dengan pendekatan baru.

Dalam makna lain, jurnalisme data digunakan untuk membedakan jurnalisme yang berbasis set data ketimbang jurnalisme konvensional yang diramu berdasarkan talking news. Jurnalisme konvensional yang saya maksud adalah produk jurnalisme dari sebuah media, terutama media daring, yang diolah tanpa kedalaman, mengutip sumber tanpa memberikan konteks yang jelas, serta menyebarkan informasi dengan data yang kurang akurat dan tidak lengkap hanya untuk mengejar klik.

JIKA MERUNUT sejarahnya—saat itu masih menggunakan istilah computer-assisted-reporting (CAR), bentuk jurnalisme data pertama kali digunakan pada 1952 oleh jaringan CBS untuk memprediksi hasil pemilihan presiden Amerika Serikat. Namun, banyak pakar yang menyangsikan studi kasus itu sebagai bentuk jurnalisme data yang pertama karena ia tidak pernah benar-benar menggunakan data. CAR lebih dikenal sebagai pendekatan sistematis dan terorganisir pertama yang menggunakan peranti komputer untuk mengumpulkan dan menganalisis data, sehingga diperoleh peningkatan kualitas suatu berita atau laporan.

Barulah pada 1967, Philip Meyer (saat itu bekerja untuk The Detroit Free Press) menggunakan mainframe —komputer berukuran besar berkecepatan tinggi—untuk menganalisis survei penduduk kota Detroit guna memperoleh penjelasan terperinci tentang kerusuhan yang meletus di kota itu. Satu dekade berikutnya, The Guardian memakai pendekatan yang sama untuk melihat kasus kerusuhan rasial di Inggris dengan menyitasi karya Meyer. Meyer pernah menulis Precision Journalism: A Reporter’s Introduction to Social Science Methods (1973), sebuah buku berisi teknik “jurnalisme presisi”—istilah lain sebelum dikenal jurnalisme data.

The Guardian, The New York Times, The Texas Tribune, The Los Angeles Times, ProPublica, dan Die Zeit adalah beberapa media daring yang memopulerkan model jurnalisme data belakangan ini. Kendati jurnalisme data sudah dikenal saat media cetak masih populer, proses analisis data selalu memerlukan mesin komputasi atau komputer.

Saya kira kasus Berkas Panama dan film Spotlight adalah dua contoh paling gamblang guna menggambarkan secara konkret mengenai jurnalisme data.

Dalam Berkas Panama misalnya, segundukan dokumen dari Monsack Fonseca masih berupa data mentah. Ia lantas disigi oleh ratusan wartawan di seluruh dunia, lewat koordinasi International Consortium of Investigative Journalists, guna dianalisis untuk mengarah pada konteks-konteks tertentu. Temuan-temuan itu dipublikasikan lewat jaringan kolaborasi media melalui pelbagai cara. Ada yang memaparkan dalam bentuk ringkasan data, ada pula lewat visualisasi data (grafis, video, animasi, dan media interaktif lain). Meski belum memiliki konteks yang jelas, namun informasi singkatnya sudah cukup bisa dipahami publik. Misalnya, informasi dasar soal apa itu Berkas Panama dan cara kerjanya, termasuk nama-nama politikus, pengusaha, selebritas, seniman, dan olahragawan di seluruh dunia yang menjadi klien firma hukum asal Panama itu.

Di Indonesia, bentuk pelaporan mendalam yang diulas oleh tim investigasi Tempo (sebagai salah satu media rekanan ICIJ untuk menginvestigasi Berkas Panama) merupakan satu contoh produk jurnalisme data, kendati isinya masih ringkasan. Sementara ulasan yang dilaporkan di beberapa edisi majalah Tempo—mengaitkan beberapa pengusaha dan politikus Indonesia dengan beberapa nama Indonesia yang terdaftar dalam Berkas Panama—merupakan usaha media itu memberikan konteks dan mengembangkan temuannya.

Sama halnya jika anda pernah menonton film Spotlight yang diangkat dari kisah nyata. Data-data yang dikumpulkan oleh tim investigasi Boston Globe awalnya masih berupa data mentah. Ia masih berupa daftar pastur yang dipindahtugaskan maupun cuti—bukan data para pastur yang terduga pedofil. Ia lantas dicocokkan dengan kesaksian para korban, wawancara dengan pengacara dan bekas pastur, sebelumnya akhirnya melansir temuannya. Begitu laporan investigatif itu dimuat dalam surat kabar, ternyata ada banyak warga yang mengaku pernah menjadi korban dari jaringan sistemik yang melindungi para pelaku. Selain menggambarkan bagaimana jurnalisme data bekerja, saya kira laporan Spotlight juga telah menunjukkan fungsi jurnalisme data, yaitu memberikan wawasan bahwa masih ada banyak korban yang tidak terekspos oleh media dan kasusnya tak pernah diselesaikan selama bertahun-tahun.

APAKAH data-data yang disajikan dalam bentuk infografik sudah informatif? Bisa ya, bisa tidak. Dari definisinya, infografik adalah representasi visual yang dapat berupa informasi maupun data, misalnya dalam bentuk bagan atau diagram. Infografik ialah salah satu bentuk untuk memvisualisasikan data.

Dalam studi analisis data, istilah visualisasi data berarti cara menampilkan data ke pelbagai tampilan multimedia (bisa berupa citra statis, video, maupun web infografis). Tujuannya tak hanya untuk memaparkan data secara lebih menarik dan mudah dipahami, tapi juga memberikan saripati (insight/ keypoint) yang perlu diperhatikan. Infografik menjadi lebih informatif jika disertai dengan ulasan yang kontekstual atas maksud infografik tersebut, bukan sekadar menampilkan data.

Dalam kasus di Indonesia, sangat sering kita menghadapi data-data dari pelbagai sumber resmi yang belum rapi dan tidak terstruktur dengan baik. Ketidakjelasan versi data rujukan juga seringkali jadi masalah tersendiri. Sebagai contoh, ada data statistik soal kemiskinan yang dirilis Kementerian Dalam Negeri dan Kementerian Desa—mana yang benar dan dapat dijadikan acuan? Bagaimanapun jurnalisme data sangat bergantung pada data yang nilainya dapat dipertanggungjawabkan. Meski masih kurang lengkap, direktori milik pemerintah Indonesia yang terangkum dalam data.go.id adalah salah satu sumber terpercaya untuk mendapatkan aneka data yang bisa diakses oleh publik.

Data yang acak dan amburadul akan menyulitkan pra-proses penambangan data sebelum dianalisis lebih lanjut. Perlu proses apa yang disebut “normalisasi data” agar pengolahan data tersebut bisa optimal dan lebih mudah digunakan. Belum lagi jika datanya bervolume besar, bahkan sangat besar: sekumpulan data dari tahun ke tahun, terdiri dari ribuan baris dan ratusan kolom serta jutaan dokumen yang berbeda format (teks, video, audio, halaman web, dll.).

Dari sisi penyimpanan, banyak peranti penyimpanan digital yang cenderung lebih portabel dan mampu menyimpan lebih dari miliaran bit data. Semakin hari jumlahnya semakin bertambah pesat seiring kecepatan transfer data dari satu medium ke medium lain. Bagaimana mengatasi timbunan data yang jumlahnya sangat besar, acak, dan memiliki kecepatan pertumbuhan data yang tinggi?

Kasus-kasus seperti itulah yang melahirkan istilah big data.

Big data menjelaskan sekumpulan set data yang sangat besar—biasanya disimpan dalam storage/server karena mampu menyimpan lebih banyak data—yang dapat diolah untuk menemukan pola, tren, dan asosiasi, yang berhubungan dengan perilaku dan interaksi manusia. Istilah big data saya pikir dipakai untuk membedakan dari istilah data secara umum yang berukuran ramping dan masih mungkin dianalisis lewat pelbagai metode statistik.

Kelompok riset dan studi META Group Research (2001) menyebutkan bahwa istilah big data tidak hanya dicirikan oleh besaran atau volume data, tapi juga oleh dua hal lain—disebut 3V termasuk kecepatan (velocity) dan keragaman (variety).

Volume berhubungan dengan ukuran data. Dalam konteks big data, ukuran minimal sudah level terabit (bukan lagi megabit atau gigabit). Kecepatan terkait aras pertumbuhan data, yang menunjukkan seberapa sering volume data itu bertambah atau diperbarui. Sementara keragaman terkait jenis format data. Jika anda menelusuri web penyedia data terbuka (open data), akan ada banyak jenis format data yang ditawarkan (misal dalam bentuk .XLS, .SQL, .DOC, dll.). Dari definisi ini menjadi jelas bahwa tak semua data dapat dikategorikan sebagai big data.

Dalam implementasinya, big data tak hanya membutuhkan ‘set data’ yang besar, yang keluarannya cenderung kuantitatif. Tricia Wang, etnografer teknologi global, berpendapat bahwa big data sangat memerlukan thick data; keduanya saling melengkapi. Istilah thick data diperoleh Wang dari Clifford Geertz, antropolog yang pernah menulis The Religion of Java, dalam esainya yang berjudul “Thick Description: Toward an Interprettive Theory of Culture”.

Thick data merupakan metode kualitatif dengan pendekatan etnografi untuk mengungkap makna di balik visualisasi dan analisis big data. Thick data menjabarkan konteks sosial dari sebuah data melalui story (cerita). Cerita yang dikumpulkan dan dianalisis menghasilkan sebuah wawasan, yang kemudian menginspirasi desain, strategi, dan inovasi.

“Terkadang data kuantitatif itu sendiri tidak menghasilkan argumen-argumen menarik. Bahkan ilmuwan-ilmuwan membutuhkan alur cerita untuk menjelaskan poin-poin yang mereka dapatkan,” jelas de Waal, primatologis dan ilmuwan biologi yang pernah melakukan eksperimen dengan pendekatan thick data.

Tabel 1. Perbedaan Thick Data dan Big Data

thick-big-data-perbedaan

Pertanyaannya, siapakah yang bertugas untuk menganalisis big data dalam sebuah bisnis atau perusahaan, misalnya?

Ada yang menyebutnya sebagai analis data (data analyst) atau ilmuwan data (data scientist). Meski mirip, tapi profesi keduanya berbeda pada beberapa perusahaan. Analis data sebenarnya dikenal sebelum ada istilah big data. Mereka adalah orang-orang yang bertugas untuk mengamati data dan mencari pola dari data yang dikumpulkan dari pelbagai sumber untuk menentukan kondisi dari sebuah entitas bisnis. Analis data berusaha untuk menerjemahkan data tersebut agar dapat dipahami oleh para pemimpin perusahaan.

Sementara ilmuwan data bertugas melakukan eksperimen-eksperimen guna menemukan hal-hal baru yang bisa bermanfaat untuk entitas bisnis. Ilmuwan data setidaknya memiliki tiga kemampuan, yaitu 1) Memahami logika bisnis perusahaan (seperti yang dilakukan analis data); 2) Mengolah data dengan pendekatan statistik dan matematis untuk mengetahui pola data beserta algoritmanya; 3) Menggunakan peranti (tools) untuk mengolah dan menganalisis data.

Kendati penerapan big data saat ini lebih banyak diterapkan pada situs e-commerce, media seperti New York Times melalui nytlabs.com belakangan sudah mulai melakukan riset media dengan pendekatan big data. Di jajaran tim riset dan pengembangan medianya, mereka telah menempatkan seorang ilmuwan data. Mereka juga telah menciptakan beberapa peranti analisis yang mampu mengolah sekumpulan data menjadi informasi dan visualisasi yang lebih mudah dipahami. Misalnya mereka mengembangkan prototipe Delta yang berfungsi untuk memvisualisasikan navigasi dan durasi waktu pengunjung saat membaca halaman web nytimes.com beserta relasinya.

MEMANGLAH tak ada kewajiban seorang jurnalis untuk menganalisis data. Namun, jika data itu dapat dikumpulkan dan diolah secara cepat, maka hal tersebut perlu dilakukan untuk menguatkan opini penulis. Analisis data maupun analisis big data sekalipun tetap memerlukan konteks yang akan menumbuhkan wawasan bagi pembaca. Dalam hal ini, seorang yang punya kompetensi spesialis pada jurnalisme data, ia dikenal sebagai jurnalis data.

Sarah Cohen, jurnalis asal Amerika Serikat peraih Pulitzer untuk kategori peliputan investigatif (2002), mengatakan bahwa analisis data dapat berguna untuk mengungkapkan “alur cerita” dalam tulisan. Ada juga pendapat dari David McCandless, jurnalis data dan desainer informasi asal Inggris pengelola blog informasi visual bertajuk ‘Information is Beautiful’. Dia mendeskripsikan analisis data sebagai “cara pandang baru” dalam menjelaskan sebuah masalah. Melalui analisis data, setidaknya wartawan bisa menggeser fokus utama profesi dari “seseorang yang paling pertama melaporkan sebuah berita” menjadi “orang pertama yang melaporkan apa yang sesungguhnya terjadi.”

Apakah jurnalisme data adalah momok dan bukan sesuatu yang menarik bagi jurnalis? Ternyata tidak. Dalam sebuah survei yang dirilis oleh European Journalism Centre pada 2011 tentang kebutuhan pelatihan jurnalisme data, sebanyak 134 dari sampel 200 pekerja dan penggiat media menyatakan mereka sangat tertarik dengan jurnalisme data, kendati bentuk jurnalisme ini masih baru bagi mereka. Hasil survei itu menyimpulkan tiga pokok soal tantangan pelatihan jurnalisme data:

Perlu pendekatan sistematis untuk merancang kurikulum jurnalisme data;
Jurnalis dan penerbit harus sama-sama belajar menganalisis data; dan
Perlu sebuah tim untuk melakukan analisis data.

Saya kira dengan kemunculan sejumlah media baru terutama di Jakarta, seiring tren digital yang tak terhindarkan, jurnalisme data mulai dipakai di Indonesia, sebagai upaya adaptasi atas perkembangan jurnalisme secara global. Mengutip saran Hassel Fallas, jurnalis data dari La Nación (Kosta Rika), dalam artikelnya yang cerdas: “Sekali kamu belajar jurnalisme data, kamu harus berkomitmen untuk terus belajar. Bahkan sekalipun kamu sudah sangat mampu dan paham benar atas teknik, perangkat, dan metode dalam menganalisis dan memvisualisasikan data. Selalu ada tantangan di depan: set data lebih besar, aplikasi baru yang perlu diuji, dan teknik-teknik baru menerapkan pendekatan berbeda—yang fungsinya menumbuhkan partisipasi dari orang-orang yang menjadikan ceritamu penting.”*

Rujukan:

Data-driven journalism: what is there to learn? (2010). Data-driven Journalism Roundtable. Amsterdam: European Journalism Centre. Baca juga buku dan panduan jurnalisme data: http://datajournalismhandbook.org/ yang diinisiasi oleh European Journalism Centre dan the Open Knowledge Foundation.
Data Analyst dan Data Scientist. (2014, November 10). (O. B. Indonesia, Produser) Diambil kembali dari https://openbigdata.wordpress.com/2014/11/10/data-analyst-dan-data-scientist/
Data Journalism Handbook 1.0 (Beta). (t.thn.). (E. J. Centre, Produser) Diambil kembali dari http://datajournalismhandbook.org/1.0/en/
Fallas, H (2013, November 4). Data-Driven Journalism’s Secret. Diambil dari ProPublica.org: https://www.propublica.org/nerds/item/data-driven-journalisms-secrets
Houston, B. (2015, November 12). Fifty Years of Journalism and Data: A Brief History. Diambil kembali dari Global Investigative Journalism Network: http://gijn.org/2015/11/12/fifty-years-of-journalism-and-data-a-brief-history
Laney, D. (2001). 3-d data management: controlling data volume, velocity and variety. META Group Research Note.
Lanin, I. (2015, November 30). Infografik atau infografis? . Diambil kembali dari Beritagar.id: https://beritagar.id/artikel/tabik/infografik-atau-infografis
Lorenz, M. (2011, September 21). Training data driven journalism: Mind the gaps. (D. D. Journalism, Produser) Diambil kembali dari http://datadrivenjournalism.net/news_and_analysis/training_data_driven_journalism_mind_the_gaps
Rowley, J. (2007). The wisdom hierarchy: representations of the DIKW hierarchy. Journal of Information and Communication Science, 33, 163-180.
Tempo, T. I. (2016). Jejak Korupsi Global dari Panama. Diambil kembali dari https://investigasi.tempo.co/panama/
Wang, T. (2013, Mei 13). Big Data Needs Thick Data. Diambil kembali dari Etnography Matters: http://ethnographymatters.net/blog/2013/05/13/big-data-needs-thick-data/

Sumber : http://pindai.org/2016/06/27/jurnalisme-data-dan-big-data/

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Protected with IP Blacklist CloudIP Blacklist Cloud