Tutorial step-by-step cara ekstrak data dari Twitter, pake Twitter API dan R Language.
Daftar Twitter API
Daftar dulu di sini supaya dapet aksesnya. Isi form doang, pasti akan dapet aksesnya setelah selesai isi pertanyaan-pertanyaannya. Tujuan akhir dari daftar Twitter API ini adalah mendapatkan (1) API Key (2) API Secret (3) Access Token, dan (4) Access Token Secret. Simpan semua kodenya, bisa di dalam file .txt atau .env yang penting jangan sampe hilang atau keshare ke publik.
Install Library rtweet
Library rtweet adalah library yang bisa kita pake untuk ekstrak data dari Twitter API. Kenapa harus pake library? Tanpa library, code kita bakalan lebih banyak, harus http request lah, urus auth lah, dll. Library rtweet ini juga adalah library yang paling advanced untuk R Language. Dengan library ini, kita cuma tulis beberapa baris kode langsung bisa akses Twitter API. Repositori dan dokumentasi library twitteR bisa diakses di: https://github.com/ropensci/rtweet
Install dengan command install.packages('rtweet')
, lalu load librarynya dengan command library(rtweet)
.
> install.packages('rtweet')
> library(rtweet)
Terus kita atur autentikasinya supaya bisa akses modul-modulnya dengan cara:
create_token(
app = "Nama Aplikasi Kalian",
consumer_key = api_key,
consumer_secret = api_secret_key,
access_token = access_token,
access_secret = access_secret
)
pastikan replace api_key
, api_secret_key
, access_token
, dan access_secret
dengan keys yang udah kalian dapetin dari Twitter API.
Sejauh ini, kita harusnya udah berhasil dapetin akses ke Twitter API dan bisa mulai ekstrak datanya pake fungsi-fungsi dari library rtweet. Seluruh fungsi dan penjelasan yang ada di library ini bisa diakses di https://docs.ropensci.org/rtweet/index.html
Yuk cobain search_tweets(), parameternya seperti contoh di bawah. Atur aja sendiri query string-nya (yang q = “#covid” itu), lalu mau request berapa Tweet (code di bawah: n=25), dan parameter lain kaya language dan include retweets (include_rts) Langsung dicobain aja codenya silakan
search_tweets(q = "#covid", n = 25,
lang = "en",
include_rts = FALSE)
Kalo berhasil kurang lebih ntar akan ada hasil query semacam ini:
Kesimpulan
Jangan takut buat ekstrak data dari API, karna asal udah dapet akses API-nya, pasti ada repository/library/dokumentasi yang bisa kita pakai untuk ngelakuinnya secara mudah.