Cara Data Mining dari Twitter dengan R Language

Kemaren siang, bokap gua minta tolong untuk bantuin ekstrak data dari Twitter API pake bahasa pemrograman R untuk data mining project beliau. Ada dua masalah di sini: (1) gua gabisa bahasa pemrograman R, dan (2) gua masih mahasiswa… jurusan kesehatan, tingkat empat. Meskipun begitu, gua bilang ke bokap gua kalo gua bisa, modal yakin aja dulu. Gua yakin kalo gua bisa, lu juga bisa. Kali ini gua akan kasih tutorial step-by-step cara ekstrak data dari Twitter, pake Twitter API dan R Language.

Daftar dulu di sini supaya dapet aksesnya. Isi form doang, pasti akan dapet aksesnya setelah selesai isi pertanyaan-pertanyaannya. Tujuan akhir dari daftar Twitter API ini adalah mendapatkan (1) API Key (2) API Secret (3) Access Token, dan (4) Access Token Secret. Simpan semua kodenya, bisa di dalam file .txt atau .env yang penting jangan sampe hilang atau keshare ke publik.

Buka menu “Keys and tokens”, nanti ada ke-4 key yang kalian butuhkan di sana.

Library rtweet adalah library yang bisa kita pake untuk ekstrak data dari Twitter API. Kenapa harus pake library? Tanpa library, code kita bakalan lebih banyak, harus http request lah, urus auth lah, dll. Library rtweet ini juga adalah library yang paling advanced untuk R Language. Dengan library ini, kita cuma tulis beberapa baris kode langsung bisa akses Twitter API. Repositori dan dokumentasi library twitteR bisa diakses di: https://github.com/ropensci/rtweet

Install dengan command install.packages('rtweet') , lalu load librarynya dengan command library(rtweet).

> install.packages('rtweet')
> library(rtweet)

Terus kita atur autentikasinya supaya bisa akses modul-modulnya dengan cara:

create_token(
app = "Nama Aplikasi Kalian",
consumer_key = api_key,
consumer_secret = api_secret_key,
access_token = access_token,
access_secret = access_secret
)

pastikan replace api_key , api_secret_key, access_token , dan access_secret dengan keys yang udah kalian dapetin dari Twitter API.

Sejauh ini, kita harusnya udah berhasil dapetin akses ke Twitter API dan bisa mulai ekstrak datanya pake fungsi-fungsi dari library rtweet. Seluruh fungsi dan penjelasan yang ada di library ini bisa diakses di https://docs.ropensci.org/rtweet/index.html

Selalu andalkan dokumentasi ya, karna tutorial gak selalu ada untuk kita

Yuk cobain search_tweets(), parameternya seperti contoh di bawah. Atur aja sendiri query string-nya (yang q = “#covid” itu), lalu mau request berapa Tweet (code di bawah: n=25), dan parameter lain kaya language dan include retweets (include_rts) Langsung dicobain aja codenya silakan

search_tweets(q = "#covid", n = 25,
lang = "en",
include_rts = FALSE)

Kalo berhasil kurang lebih ntar akan ada hasil query semacam ini:

Selamat ya, berhasil diekstrak datanya!

Kesimpulan

Jangan takut buat ekstrak data dari API, karna asal udah dapet akses API-nya, pasti ada repository/library/dokumentasi yang bisa kita pakai untuk ngelakuinnya secara mudah. Gua harap tulisan ini dapat membantu proses belajar pembaca, dan mungkin next time gua akan tulis cara ekstrak data dari API lain, pakai bahasa lain (meskipun gua gatau bahasanya), dengan use-case lain. Bisa kontak gue di twitter: @febrilian__ misal ada pertanyaan.

--

--

Software Engineering & Medicine

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store