R: sparklyr

Apache Spark is a fast and general-purpose cluster computing system. It provides high-level APIs in Java, Scala, Python and R, and an optimized engine that supports general execution graphs. It also supports a rich set of higher-level tools including Spark SQL for SQL and structured data processing, MLlib for machine learning, GraphX for graph processing, and Spark Streaming.

Mencoba memasuki dunia komputasi paralel, pada awal bulan kemarin kami mulai melakukan riset sehubungan dengan rilisnya RStudio versi 1.0.44 yang memiliki tambahan fitur yang membuat proses pengolahan menuju ‘big data‘ terealisasi. Dimana dari catatan rilis tersebut terdapat 1 fitur menarik yang dimasukkan, yaitu integrasi atas dukungan pengolahan di Spark dengan paket sparklyr. Paket sparklyr ini merupakan antar muka sekaligus menyediakan implementasi dplyr dalam Spark. Untuk lebih lengkapnya silakan menuju halaman pengembangan. Continue reading R: sparklyr

Rintisan Buku Platform Analisis

Mengingat bahwa dari awal pengembangan B2B.Web.ID adalah sebuah acuan dalam penerapan eksplorasi dan pengolahan data dengan menggunakan platform analisis perangkat lunak merdeka, kami sudah mulai menyusun dokumentasi berupa buku. Rintisan ini masih dalam tahap sangat awal, masih perlu banyak waktu dan kesempatan untuk memperbaiki.

Untuk sementara contoh buku sudah kami sediakan melalui google drive. Silakan baca dan berikan masukan Anda baik melalui komentar maupun di channel terbuka kami di Telegram dengan alamat telegram.me/b2bwebid. Kami menerima setiap bentuk kontribusi dari Anda.

Untuk versi rilis, kami berencana menggunakan leanpub sebagai media publikasi.

Biarkan Data Bicara