Cara Data Mining dari Twitter dengan R Language

Febrilian
3 min readJan 22, 2021

Tutorial step-by-step cara ekstrak data dari Twitter, pake Twitter API dan R Language.

Daftar Twitter API

Daftar dulu di sini supaya dapet aksesnya. Isi form doang, pasti akan dapet aksesnya setelah selesai isi pertanyaan-pertanyaannya. Tujuan akhir dari daftar Twitter API ini adalah mendapatkan (1) API Key (2) API Secret (3) Access Token, dan (4) Access Token Secret. Simpan semua kodenya, bisa di dalam file .txt atau .env yang penting jangan sampe hilang atau keshare ke publik.

Buka menu “Keys and tokens”, nanti ada ke-4 key yang kalian butuhkan di sana.

Install Library rtweet

Library rtweet adalah library yang bisa kita pake untuk ekstrak data dari Twitter API. Kenapa harus pake library? Tanpa library, code kita bakalan lebih banyak, harus http request lah, urus auth lah, dll. Library rtweet ini juga adalah library yang paling advanced untuk R Language. Dengan library ini, kita cuma tulis beberapa baris kode langsung bisa akses Twitter API. Repositori dan dokumentasi library twitteR bisa diakses di: https://github.com/ropensci/rtweet

Install dengan command install.packages('rtweet') , lalu load librarynya dengan command library(rtweet).

> install.packages('rtweet')
> library(rtweet)

Terus kita atur autentikasinya supaya bisa akses modul-modulnya dengan cara:

create_token(
app = "Nama Aplikasi Kalian",
consumer_key = api_key,
consumer_secret = api_secret_key,
access_token = access_token,
access_secret = access_secret
)

pastikan replace api_key , api_secret_key, access_token , dan access_secret dengan keys yang udah kalian dapetin dari Twitter API.

Sejauh ini, kita harusnya udah berhasil dapetin akses ke Twitter API dan bisa mulai ekstrak datanya pake fungsi-fungsi dari library rtweet. Seluruh fungsi dan penjelasan yang ada di library ini bisa diakses di https://docs.ropensci.org/rtweet/index.html

Selalu andalkan dokumentasi ya, karna tutorial gak selalu ada untuk kita

Yuk cobain search_tweets(), parameternya seperti contoh di bawah. Atur aja sendiri query string-nya (yang q = “#covid” itu), lalu mau request berapa Tweet (code di bawah: n=25), dan parameter lain kaya language dan include retweets (include_rts) Langsung dicobain aja codenya silakan

search_tweets(q = "#covid", n = 25,
lang = "en",
include_rts = FALSE)

Kalo berhasil kurang lebih ntar akan ada hasil query semacam ini:

Selamat ya, berhasil diekstrak datanya!

Kesimpulan

Jangan takut buat ekstrak data dari API, karna asal udah dapet akses API-nya, pasti ada repository/library/dokumentasi yang bisa kita pakai untuk ngelakuinnya secara mudah.

--

--