Data Science dalam Bahasa Pemrograman

Bulan lalu, Tekla Perry menuliskan artikel What Programming Languages Do You Need to Work in Data Science?” di Spectrum/IEEE. Artikel ini mungkin bisa dijadikan salah satu rujukan bila ingin masuk ke dunia Data Science atau merekrut seorang data scientist.

Skill-set Data Science

Dalam artikel tersebut terdapat grafik yang menunjukkan kebutuhan skill-set yang diminta perusahaan saat mempekerjakan seorang data scientist melalui Indeed. Grafik tersebut dengan jelas mengeluarkan kebutuhan akan bahasa pemrograman Python karena dianggap skill yang tidak spesifik untuk data science. Python sendiri menduduki peringkat 3 (tiga) dalam kebutuhan skill teknologi secara umum.

Lanjutkan membaca “Data Science dalam Bahasa Pemrograman”

KMeans untuk Pengklasteran dengan R

Metode pengklasteran merupakan salah satu metode pembelajaran mesin yang cukup matang dan paling umum digunakan dalam melakukan eksplorasi data. Tanpa mengetahui apapun mengenai data, kita dapat mengelompokkan data berdasarkan nilai masing-masing variabel. Salah satu algoritma yang digunakan adalah KMeans yang dalam R ada dalam paket stats.

Untuk menerapkan K-Means, ada beberapa hal yang perlu diperhatikan dalam menggunakan algoritma ini dengan R.

Argumen Fungsi KMeans

Berikut argumen yang diperlukan dalam menjalankan fungsi ini.

kmeans(x, centers, iter.max = 10, nstart = 1,
       algorithm = c("Hartigan-Wong", "Lloyd", "Forgy",
                     "MacQueen"), trace=FALSE)
## S3 method for class 'kmeans'
fitted(object, method = c("centers", "classes"), ...)
Lanjutkan membaca “KMeans untuk Pengklasteran dengan R”

Bahasa R: Pengenalan

Bahasa pemrograman R dikembangkan oleh Ross Ihaka dan Robert Gentleman sejak 1993. Arah pengembangan R diutamakan pada fungsi-fungsi statistika dan metode tampilan grafik. Fungsi yang dikembangkan termasuk untuk fungsi analisis regresi linear, analisis runtun waktu (time series), dan metode statistika lainnya.

Logo R
Logo R

Saat ini penggunaan R makin pesat dengan adanya hype mengenai metode analisis baru, yaitu Machine Learning. Dari awalnya berkembang dalam dunia akademisi, saat ini banyak perusahaan yang mengadopsi penggunaannya, diantaranya: Uber, Google, AirBnB, Facebook, dkk.

Lanjutkan membaca “Bahasa R: Pengenalan”