Share this on Facebook
Email this via Gmail
Add this to Google Bookmarks
Share this on Reddit
Stumble upon something good? Share it on StumbleUpon
Tweet This!
Jaminan Kualitas tetap menjadi prioritas bagi produsen mobil, termasuk Daimler Chrysler. Jochen Hipp dari University of Tubingen, Jerman, dan Lindner Guido dari DaimlerChrysler AG, Jerman, menyelidiki pola-pola di klaim jaminan untuk mobil DaimlerChrysler.
1. Business / Research Understanding Phase
Tujuannya adalah untuk mengurangi biaya yang berkaitan dengan klaim garansi dan meningkatkan kepuasan pelanggan. Melalui pembicaraan dengan insinyur pabrik, yang merupakan ahli teknis di bidang manufaktur kendaraan, para peneliti dapat merumuskan masalah bisnis yang spesifik, seperti berikut:
- Apakah ada saling ketergantungan di antara klaim garansi?
- Apakah klaim garansi masa lalu yang terkait dengan klaim serupa di masa mendatang?
- Apakah ada hubungan antara tipe tertentu klaim dan garasi tertentu?
Rencananya adalah menerapkan teknik data mining untuk mengungkap beberapa hal diatas serta asosiasi lainnya yang mungkin ada.
2. Data Understanding Phase
Para peneliti menggunakan DaimlerChrysler Quality Information System (QUIS), yang berisi informasi tentang lebih dari 7 juta kendaraan dan berukuran sekitar 40 gigabytes.
QUIS berisi rincian produksi tentang bagaimana dan di mana kendaraan tertentu dibangun, termasuk kurang lebih 30 kode penjualan untuk setiap kendaraan.
QUIS juga mencakup informasi jaminan klaim, dimana persediaan garasi, dalam bentuk lebih dari 5000 kemungkinan penyebab potensial klaim garansi terjadi.
Para analyst tidak boleh meremehkan hal-hal yang penting, kesulitannya, dan biaya potensial yang terdapat pada fase awal proses data mining ini, apabila mereka malas dan mengambil jalan pintas (mencari fakta seadanya) hal ini bisa membawa kepada biaya reiteration yang sangat mahal.
3. Data Preparation Phase
Hambatan awal ditemukan pada fase ini, Para peneliti menemukan, bahwa walaupun database QUIS adalah database Relational, tapi database QUIS memiliki Structure Query Language yang terbatas.
Kemudian para peneliti tersebut memilih untuk memilah kasus dan variabel yang di inginkan secara manual, kemudian variabel baru yang didapat, digunakan untuk tahap permodelan. Misal: variabel jumlah hari dari tanggal penjualan klaim pertama harus berasal dari atribut tanggal yang tepat. – harap dipahami bahwa ini adalah proses manual yang tidak mudah dilakukan terhadap data berukuran besar
Para peneliti tersebut kemudian menggunakan perangkat lunak data mining berbayar yang digunakan di DaimlerChrysler pada proyek-proyek sebelumnya. Disini mereka bertemu dengan hambatan umum - bahwa persyaratan format data yang dibutuhkan sangat bervariasi antar satu algoritma ke algoritma lainnya. Hasilnya adalah effort yang dibutuhkan dalam pre-processing data jauh lebih melelahkan, karena mereka harus mengubah atribut kedalam bentuk yang dapat digunakan oleh model algoritma tersebut . Para peneliti menyadari bahwa tahap penyiapan data membutuhkan waktu yang lebih lama daripada yang direncanakan di awal.
4. Modeling Phase
Karena problem bisnis secara keseluruhan pada fase 1 adalah untuk menyelidiki ketergantungan antara klaim garansi, para peneliti memilih untuk menerapkan teknik-teknik sebagai berikut:
- Bayesian Network
- Association Rules
Model Bayesian Network mewakili semua dependensi kondisional antara berbagai komponen yang tidak pasti, sehingga memberikan visualisasi grafis dari hubungan ketergantungan antar komonen-komponen. Dengan demikian, Bayesian Network merupakan pilihan yang tepat untuk permodelan ketergantungan pada klaim garansi. Association rule juga merupakan cara alami untuk menyelidiki ketergantungan pada klaim garansi, karena dengan Association Rule, kita dapat mendapatkan tingkat Confidence dari sebuah hasil "Jika X maka peluang terjadi Y adalah sekian persen"
Detil dari hasil penelitian bersifat rahasia, tapi kita bisa mendapatkan sebuah gambaran umum tentang dependensi yang ditemukan oleh sebuah model, Satu pencerahan yang didapat para peneliti, mereka menemukan bahwa kombinasi tertentu dari konstruksi yang spesifik, mengakibatkan permasalahan pada kabel listrik mobil.
5. Evaluation Phase
Para peneliti kurang puas dengan hasil yang diperoleh, menurut mereka dukungan untuk Association Rule bertipe Sequential relatif kecil, sehingga menghambat generalisasi hasil.
Para peneliti tersebut mengeluarkan pernyataaan: "pada kenyataannya, kami tidak menemukan sebuah rule yang dinilai oleh para domain expert menarik, setidaknya menarik untuk diteliti pada awal ditemukan."
Dari kriteria yang diiinginkan oleh para peneliti, kemudian disadari bahwa model yang ditemukan ternyata kurang efektif dan terlalu pendek untuk mencapai tujuan-tujuan yang tetapkan pada Business Understanding Phase. Untuk masalah ini, para peneliti menuding struktur lama dari database, dimana komponen dari mobil-mobil tersebut dikategorikan berdasarkan gudang penyimpanan / garasi dan pabrik demi kepentingan historic atau demi alasan teknis, dan tidak didesain untuk data mining. Para peneliti tersebut menyarankan untuk melakukan design ulang dari database demi membuat database tersebut dapat digunakan untuk knowledge discovery / data mining.
6. Deployment Phase
Para peneliti telah mengidentifikasi proyek tersebut di atas sebagai proyek pilot, dan oleh karena itu, tidak bermaksud untuk melakukan deploy model skala besar dari iterasi pertama. Setelah proyek percontohan, mereka telah menerapkan pelajaran dari proyek ini, dengan tujuan untuk mengintegrasikan metode mereka dengan lingkungan teknologi informasi yang ada di DaimlerChrysler. Untuk lebih mendukung tujuan asli menurunkan biaya-biaya klaim, mereka bermaksud untuk mendevelop sebuah system intranet yang mempunyai kemampuan data mining dari QUIS untuk semua karyawan perusahaan.
Pelajaran apa yang bisa kita tarik dari studi kasus ini?
Pertama, Satu menarik adalah bahwa mengungkap sesuatu yang tersembunyi dari database adalah sebuah jalan berbatu yang tidak mudah dilalui. Dalam hampir setiap fase, para peneliti berlari menuju kepada penghalang dan kesulitan-kesulitan yang tidak diduga. Ini memberitahu kita yang benar-benar menerapkan data mining untuk pertama kalinya dalam sebuah perusahaan, membutuhkan untuk meminta orang untuk melakukan sesuatu yang baru dan berbeda, yang tidak selalu diterima. Oleh karena itu, jika mereka mengharapkan hasil, manajemen perusahaan harus 100% mendukung inisiatif baru data mining.
Pelajaran lain untuk menarik adalah bahwa partisipasi manusia dan pengawasan yang intens diperlukan pada setiap tahap proses data mining. Sebagai contoh, algoritma memerlukan format data yang spesifik, yang mungkin membutuhkan preprocessing besar, terlepas dari vendor perangkat lunak dan beberapa iklan mungkin yang mengklaim produk mereka adalah yang terbaik.
Anda tidak dapat hanya membeli beberapa perangkat lunak data mining, menginstalnya, duduk kembali, dan perangkat lunak tersebut menyelesaikan semua masalah, jangan pernah berfikiran sepert ini, Data mining bukan sihir. Tanpa pengawasan manusia yang terampil, ketidaktahuan menggunakan perangkat lunak data mining hanya akan memberikan anda dengan jawaban yang salah.
Analisis yang salah adalah lebih buruk daripada tidak dilakukan analisis, karena mengarah pada rekomendasi kebijakan yang mungkin akan berubah menjadi kegagalan yang mahal.
Data mining bukanlah obat mujarab untuk memecahkan masalah bisnis. Tapi jika digunakan dengan benar, oleh orang-orang yang memahami model yang terlibat, persyaratan data yang dipenuhi, dan tujuan proyek secara keseluruhan, data mining memang dapat memberikan hasil sangat menguntungkan.
Comments
Post a Comment