Skip to main content

Contoh CRISP-DM: ANALISA KASUS KLAIM GARANSI MOBIL



logosmall Jaminan Kualitas tetap menjadi prioritas bagi produsen mobil, termasuk Daimler Chrysler. Jochen Hipp dari University of Tubingen, Jerman, dan Lindner Guido dari DaimlerChrysler AG, Jerman, menyelidiki pola-pola di klaim jaminan untuk mobil DaimlerChrysler.


1. Business / Research Understanding Phase


Tujuannya adalah untuk mengurangi biaya yang berkaitan dengan klaim garansi dan meningkatkan kepuasan pelanggan. Melalui pembicaraan dengan insinyur pabrik, yang merupakan ahli teknis di bidang manufaktur kendaraan, para peneliti dapat merumuskan masalah bisnis yang spesifik, seperti berikut:



  • Apakah ada saling ketergantungan di antara klaim garansi?

  • Apakah klaim garansi masa lalu yang terkait dengan klaim serupa di masa mendatang?

  • Apakah ada hubungan antara tipe tertentu klaim dan garasi tertentu?


Rencananya adalah menerapkan teknik data mining untuk mengungkap beberapa hal diatas serta asosiasi lainnya yang mungkin ada.


2. Data Understanding Phase


Para peneliti menggunakan DaimlerChrysler Quality Information System (QUIS), yang berisi informasi tentang lebih dari 7 juta kendaraan dan berukuran sekitar 40 gigabytes.


QUIS berisi rincian produksi tentang bagaimana dan di mana kendaraan tertentu dibangun, termasuk kurang lebih 30 kode penjualan untuk setiap kendaraan.


QUIS juga mencakup informasi jaminan klaim, dimana persediaan garasi, dalam bentuk lebih dari 5000 kemungkinan penyebab potensial klaim garansi terjadi.


Para analyst tidak boleh meremehkan hal-hal yang penting, kesulitannya, dan biaya potensial yang terdapat pada fase awal proses data mining ini, apabila mereka malas dan mengambil jalan pintas (mencari fakta seadanya) hal ini bisa membawa kepada biaya reiteration yang sangat mahal.


3. Data Preparation Phase


Hambatan awal ditemukan pada fase ini, Para peneliti menemukan, bahwa walaupun database QUIS adalah database Relational, tapi database QUIS memiliki Structure Query Language yang terbatas.


Kemudian para peneliti tersebut memilih untuk memilah kasus dan variabel yang di inginkan secara manual, kemudian variabel baru yang didapat, digunakan untuk tahap permodelan. Misal: variabel jumlah hari dari tanggal penjualan klaim pertama harus berasal dari atribut tanggal yang tepat. – harap dipahami bahwa ini adalah proses manual yang tidak mudah dilakukan terhadap data berukuran besar


Para peneliti tersebut kemudian menggunakan perangkat lunak data mining berbayar yang digunakan di DaimlerChrysler pada proyek-proyek sebelumnya. Disini mereka bertemu dengan hambatan umum - bahwa persyaratan format data yang dibutuhkan sangat bervariasi antar satu algoritma ke algoritma lainnya. Hasilnya adalah effort yang dibutuhkan dalam pre-processing data jauh lebih melelahkan, karena mereka harus mengubah atribut kedalam bentuk yang dapat digunakan oleh model algoritma tersebut :) . Para peneliti menyadari bahwa tahap penyiapan data membutuhkan waktu yang lebih lama daripada yang direncanakan di awal.


4. Modeling Phase


Karena problem bisnis secara keseluruhan pada fase 1 adalah untuk menyelidiki ketergantungan antara klaim garansi, para peneliti memilih untuk menerapkan teknik-teknik sebagai berikut:



  • Bayesian Network

  • Association Rules


Model Bayesian Network mewakili semua dependensi kondisional antara berbagai komponen yang tidak pasti, sehingga memberikan visualisasi grafis dari hubungan ketergantungan antar komonen-komponen. Dengan demikian, Bayesian Network merupakan pilihan yang tepat untuk permodelan ketergantungan pada klaim garansi. Association rule juga merupakan cara alami untuk menyelidiki ketergantungan pada klaim garansi, karena dengan Association Rule, kita dapat mendapatkan tingkat Confidence dari sebuah hasil "Jika X maka peluang terjadi Y adalah sekian persen"


Detil dari hasil penelitian bersifat rahasia, tapi kita bisa mendapatkan sebuah gambaran umum tentang dependensi yang ditemukan oleh sebuah model, Satu pencerahan yang didapat para peneliti, mereka menemukan bahwa kombinasi tertentu dari konstruksi yang spesifik, mengakibatkan permasalahan pada kabel listrik mobil.


5. Evaluation Phase


Para peneliti kurang puas dengan hasil yang diperoleh, menurut mereka dukungan untuk Association Rule bertipe Sequential relatif kecil, sehingga menghambat generalisasi hasil.


Para peneliti tersebut mengeluarkan pernyataaan: "pada kenyataannya, kami tidak menemukan sebuah rule yang dinilai oleh para domain expert menarik, setidaknya menarik untuk diteliti pada awal ditemukan."


Dari kriteria yang diiinginkan oleh para peneliti, kemudian disadari bahwa model yang ditemukan ternyata kurang efektif dan terlalu pendek untuk mencapai tujuan-tujuan yang tetapkan pada Business Understanding Phase. Untuk masalah ini, para peneliti menuding struktur lama dari database, dimana komponen dari mobil-mobil tersebut dikategorikan berdasarkan gudang penyimpanan / garasi dan pabrik demi kepentingan historic atau demi alasan teknis, dan tidak didesain untuk data mining. Para peneliti tersebut menyarankan untuk melakukan design ulang dari database demi membuat database tersebut dapat digunakan untuk knowledge discovery / data mining.


6. Deployment Phase


Para peneliti telah mengidentifikasi proyek tersebut di atas sebagai proyek pilot, dan oleh karena itu, tidak bermaksud untuk melakukan deploy model skala besar dari iterasi pertama. Setelah proyek percontohan, mereka telah menerapkan pelajaran dari proyek ini, dengan tujuan untuk mengintegrasikan metode mereka dengan lingkungan teknologi informasi yang ada di DaimlerChrysler. Untuk lebih mendukung tujuan asli menurunkan biaya-biaya klaim, mereka bermaksud untuk mendevelop sebuah system intranet yang mempunyai kemampuan data mining dari QUIS untuk semua karyawan perusahaan.


Pelajaran apa yang bisa kita tarik dari studi kasus ini?


Pertama, Satu menarik adalah bahwa mengungkap sesuatu yang tersembunyi dari database adalah sebuah jalan berbatu yang tidak mudah dilalui. Dalam hampir setiap fase, para peneliti berlari menuju kepada penghalang dan kesulitan-kesulitan yang tidak diduga. Ini memberitahu kita yang benar-benar menerapkan data mining untuk pertama kalinya dalam sebuah perusahaan, membutuhkan untuk meminta orang untuk melakukan sesuatu yang baru dan berbeda, yang tidak selalu diterima. Oleh karena itu, jika mereka mengharapkan hasil, manajemen perusahaan harus 100% mendukung inisiatif baru data mining.


Pelajaran lain untuk menarik adalah bahwa partisipasi manusia dan pengawasan yang intens diperlukan pada setiap tahap proses data mining. Sebagai contoh, algoritma memerlukan format data yang spesifik, yang mungkin membutuhkan preprocessing besar, terlepas dari vendor perangkat lunak dan beberapa iklan mungkin yang mengklaim produk mereka adalah yang terbaik.


Anda tidak dapat hanya membeli beberapa perangkat lunak data mining, menginstalnya, duduk kembali, dan perangkat lunak tersebut menyelesaikan semua masalah, jangan pernah berfikiran sepert ini, Data mining bukan sihir. Tanpa pengawasan manusia yang terampil, ketidaktahuan menggunakan perangkat lunak data mining hanya akan memberikan anda dengan jawaban yang salah.


Analisis yang salah adalah lebih buruk daripada tidak dilakukan analisis, karena mengarah pada rekomendasi kebijakan yang mungkin akan berubah menjadi kegagalan yang mahal.


Data mining bukanlah obat mujarab untuk memecahkan masalah bisnis. Tapi jika digunakan dengan benar, oleh orang-orang yang memahami model yang terlibat, persyaratan data yang dipenuhi, dan tujuan proyek secara keseluruhan, data mining memang dapat memberikan hasil sangat menguntungkan.




Comments

Popular posts from this blog

Ahli / Tukang Urut di Bandung

Bagi yang pernah kecelakaan, keseleo, tulang keluar dari persendian, patah tulang, dan masalah-masalah lain dengan tulang dan otot, ahli urut atau tukang urut adalah seseorang yang kita andalkan untuk pengobatan alternatif diluar kedokteran. Persepsi masyarakat mengenai lembaga rumah sakit dan kedokteran masih terdapat kebimbangan walau sudah lebih lebih baik dibanding 10 tahun lalu. Masih ada pemikiran dokter + rumah sakit lebih mementingkan test-test yang berlebihan untuk pasien. Disinilah celah yang diisi oleh ahli urut. Ahli urut berperan sebagai seorang dokter dan ahli terapi. Perlu diperhatikan, menurut saya, sebaiknya tetap ke dokter dulu, x-ray kalau memang diperlukan. Apabila tulang retak atau patah, sebaiknya kunjungan ke ahli urut ditunda dulu. Berikut daftar Ahli urut yang berhasil dihimpun berkat teman2 di facebook...

ExoticAzza : Lola

Find out the differences between NonaManis.com, MoreNonaManis.com, ExoticAzza.com and IndoAmateurs.com - read our FAQ or go to  NonaManis.com . Your email program/account might have a spam filter which mistakenly marks our emails as spam. Please make sure to add admin@exoticazza.com, admin@indoamateurs.com and admin@morenonamanis.com to your safe senders list. WARNING: ADULT MATERIALS FOR CONSENTING ADULTS OVER 21 YEARS OF AGE

More Nona Manis : Fina

Find out the differences between NonaManis.com, MoreNonaManis.com, ExoticAzza.com and IndoAmateurs.com - read our FAQ or go to  NonaManis.com . Your email program/account might have a spam filter which mistakenly marks our emails as spam. Please make sure to add admin@exoticazza.com, admin@indoamateurs.com and admin@morenonamanis.com to your safe senders list. WARNING: ADULT MATERIALS FOR CONSENTING ADULTS OVER 21 YEARS OF AGE