Share this on Facebook
Email this via Gmail
Add this to Google Bookmarks
Share this on Reddit
Stumble upon something good? Share it on StumbleUpon
Tweet This!
CRISP-DM (Cross-Industry Standard Process for Data Mining) dikembangkan pada tahun 1996 oleh analyst yang mewakili DaimlerChrysler, SPSS, dan NCR.
CRISP menyediakan standar proses baku untuk data mining yang dapat diterapkan kedalam strategi pemecahan masalah umum pada bisnis atau pada unit penelitian. Standar baku ini merupakan standar nonproprietary, bebas digunakan siapapun tanpa harus membayar lisensi.
Menurut CRISP-DM, sebuah Project Data Mining memiliki Lifecycle yang terdiri dari 6 fase, anda bisa lihat pada gambar dibawah ini
Harap dicatat bahwa ini adalah urutan fase yang Adaptif, artinya fase berikutnya dalam urutan tersebut sering bergantung pada hasil yang berhubungan dengan tahap sebelumnya. Dependensi yang paling signifikan antara fase ditunjukkan dengan tanda panah.
Sebagai contoh, anggaplah bahwa kita berada dalam MODELING PHASE, Tergantung pada perilaku dan karakteristik dari model, terkadang kita mungkin harus kembali ke tahap DATA PREPARATION PHASE untuk perbaikan lebih lanjut sebelum bergerak ke tahap EVALUATION PHASE. Sifat iteratif dari CRISP dilambangkan dengan lingkaran luar.
Seringkali, solusi untuk sebuah bisnis tertentu atau masalah penelitian yang mengarah kepada pertanyaan yang berkaitan lebih dalam, dibalas dengan menggunakan proses umum yang sama dengan yang sebelumnya.
Pelajaran yang diperoleh dari proyek masa lalu harus selalu dibawa sebagai masukan dalam proyek baru. Permasalahan yang ditemui selama EVALUATION PHASE dapat mengakibatkan seorang analyst kembali ke fase-fase sebelumnya untuk perbaikan.
Supaya mudah dipahami, saya hanya menampilkan proses pengulangan yang paling umum, Berikut ini adalah garis besar dari setiap tahap.
6 Fase CRISP-DM
1. BUSINESS / RESEARCH UNDERSTANDING PHASE.
- Melafalkan tujuan dari proyek dan kebutuhan yang jelas dalam Bisnis atau unit penelitian secara keseluruhan.
- Menterjemahkan tujuan-tujuan dan batasan-batasan kedalam formulasi definisi masalah data mining.
- Menyiapkan strategi awal untuk mencapai tujuan ini.
2. DATA UNDERSTANDING PHASE
- Kumpulkan data
- Gunakan analisis data untuk membiasakan diri anda dengan data yang anda olah supaya anda dapat menemukan semacam initial insight.
- Evaluasi kualitas data anda.
- Jika di inginkan, pilih subset data yang paling menarik, mungkin saja disini berisi sebuah pola yang dapat ditindaklanjuti.
3. DATA PREPARATION PHASE
- Siapkan raw data yang akan digunakan untuk seluruh tahap berikutnya. Fase ini cukup membuat sibuk
- Pilih kasus dan variabel yang anda ingin analisa dan yang sesuai untuk analisa anda.
- Jika diperlukan, Lakukan transformasi pada variabel-variabel tertentu.
- Bersihkan raw data sehingga siap untuk digunakan pada modeling tools.
4. MODELING PHASE
- Pilih dan terapkan permodelan yang sesuai
- Kalibrasi setting pada model untuk hasil yang optimal
- Sering-sering ingat bahwa ada beberapa teknik yang berbeda, dapat digunakan untuk memecahkan permasalahan data mining yang sama.
- Jika perlu, ulangi kembali ke tahap PREPARATION PHASE untuk membentuk data ke jalur yang sesuai dengan kebutuhan teknik data mining tertentu.
5. EVALUATION PHASE
- Evaluasi satu atau lebih model demi kualitas dan kefektifannya sebelum digunakan di lapangan
- Menentukan apakah model dalam kenyataannya mencapai tujuan yang diterapkan pada fase awal (BUSINESS / RESEARCH UNDERSTANDING PHASE)
- Menentukan apakah beberapa aspek penting dari permasalahan bisnis atau riset telah diperhitungkan secara memadai.
- Buatlah sebuah keputusan mengenai penggunaan hasil data mining.
6. DEPLOYMENT PHASE
- Gunakan model yang telah dibuat: penciptaan sebuah model bukan berarti proyek telah selesai
- Contoh deployment sederhana: menghasilkan report
- Contoh deployment yang kompleks: menerapkan proses data mining paralel pada departemen yang lain.
Anda dapat lebih banyak mendapatkan informasi tentang CRISP-DM di url sebagai berikut: www.crisp-dm.org
Bagaimana Contoh Penerapannya pada kasus sebuah bisnis? Postingan blog berikutnya akan membahas contoh kasus pada DaimlerChrysler
Comments
Post a Comment