Sabtu, 17 November 2018

Apa itu Apache Spark

Apa sih apache spark...?

1. Apache Spark adalah engine buat memproses data, didalam engine apache spark data yang diproses adalah data yang berukuran besar yang berukuran terabyte, hexabyte, dan seterusnya.  Keunggulan dari apache spark ini dia bersifat general purpose artinya sangat memungkinkan buat digunakan untuk apa saja, contohnya untuk prosesing data, transformasi data, dan juga untuk machine learning, keunggulan yang lebih dahsyat lagi dari apache spark ini dia sangat cepat dalam melakukan proses data.

2. Apache Spark berjalan secara pararel sehingga memudahkan untuk proses distribusi antar komputer, misalkan kita mempunyai 4 komputer dengan core 4, maka secara keseluruhan dapat diakumasikan menjadi 16 core, sehingga untuk proses upscale bisa lebih mudah karena bisa horisontal upscaling.

3. Apache Spark juga high level API, sehingga lebih mudah digunakan untuk menentukan fungsi-fungsi yang kita inginkan.

4. Apache Spark juga sangat support pada languange programing seperti: Phyton, R, Java, Scala dll, sehingga buat anda yang berprofesi sebagai data scientis yang sering menggunakan Phyton dan R itu sudah tersedia di apache spark.
banner
Previous Post
Next Post

0 komentar: