Data Science

 Data ScienceData Science


    Data Science adalah suatu ilmu yang memadukan dari berbagai bidang seperti matematika, ilmu komputer, strategi bisnis dan statistik.
    Dalam data science juga ada yang namanya OPD yaitu Organizing, Packaging dan Delivering Data. Organizing adalah proses penyimpanan data lalu untuk Packaging proses manipulasi dan penggabungan data dan Delivering adalah untuk memastikan bahwa data diakses oleh yang memiliki wewenang.

Alat Data Science

Big Data

Big data adalah alat pertama yang digunakan oleh seorang Data Scientist untuk mengidentifikasi dan memprediksi segala hal dan kemungkinan.

Machine Learning

Machine Learning adalah alat kedua.  Komponen utama dari Machine Learning adalah algoritma yang secara otomatis bisa belajar dari pengalaman untuk memperbaiki kinerjanya. Dalam berbagai bidang, algoritma sendiri memang digunakan. Sehingga bisa terus menggali dan meningkatkan keakuratan.

Data Mining

Data Mining alat selanjutnya yang digunakan, merupakan penerapan algoritma khusus untuk mengekstraksi pola suatu kumpulan data dan mengumpulkannya. Data Mining ini erat hubungannya dengan Machine Learning dalam hal mengekstrak pola informatif yang tersimpan dalam kumpulan data.

Deep Learning

deep learning dapat diartikan sebagai salah satu teknik dalam machine learning yang mengarahkan sebuah sistem komputer maupun mesin untuk bekerja layaknya manusia secara natural, yakni dengan mempelajari situasi dengan pembelajaran atau pemrograman tertentu. Deep learning juga merupakan kunci dari pengembangan teknologi yang mengandalkan kecerdasan buatan atau Artificial Intelligence (AI).

Artificial Intellligence

AI itu merupakan bidang ilmu komputer yang menekankan penciptaan mesin cerdas yang dapat bereaksi dan bekerja layaknya manusia. Adapun, AI punya komponen inti berupa pemrograman komputer untuk sifat tertentu, misalnya penalaran, pengetahuan, persepsi, pemecahan masalah, pembelajaran, perencanaan, dan lain sebagainya.



Proses Data Science

Menurut Towards Data Science, menjelaskan proses data science adalah hal yang tidak mudah. Penjelasan sebagai berikut.

Obtain

Seperti namanya Obtain adalah untuk mendapat dan mengumpulkan data. Mengambil data bisa seperti melalui MySQL.

Scrub

Setelah data dikumpulkan hal selanjutnya akan dilakukan Scrubbing data. Scrubbing adalah proses pembersihan dan filter data, jika ada data yang tidak sesuai maka disingkirkan, dikenal juga dengan nama standarisasi format data yaitu mengubah semua data menjadi satu format data yang sama. 

Explore

Tahap ini adalah untuk penggalian dan pemeriksaan, di tahap explore ini kita mengecek properti datanya lalu dicek statistik deskriptif setelah itu bisa kita lakukan visualisasi data digunakan untuk identifikasi polan dan tren maka kita akan mendapat gambaran yang jelas.

Model

Tahap ini adalah untuk memprediksi nilai di waktu mendatang serta melakukan klasifikasi dan pengelompokkan grup nilai dari data.

Interpret

Interpretasi data adalah proses penting di mana dilakukan interpretasi model dan data. Output pengolahan data yang diinterpretasi harus bisa dipahami orang luas. Pada tahap ini dibutuhkan kemampuan komunikasi yang baik dalam penyampaian poin poin pentingnya secara efektif pada semua orang orang.


Falah Dwihandoyo - 6706213019

Komentar

Postingan populer dari blog ini

Data Warehouse