Studi Kasus Kantor Kecil Kami: Krisis Distribusi yang Mengejutkan

Studi Kasus Kantor Kecil Kami: Krisis Distribusi yang Mengejutkan

Pada Januari 2023, di sebuah kantor kecil kami di Jakarta Selatan — ruangan kerja ber-AC yang selalu penuh papan tulis dan sticky notes — saya bangun dengan notifikasi alarm pertama dari sistem monitoring model. Angka metrik tiba-tiba melompat: akurasi turun 18% dalam 48 jam. Jantung saya berdebar. “Ini bukan fluktuasi musiman,” saya pikir. Karena sudah menghabiskan sepuluh tahun membangun pipeline machine learning, naluri saya langsung mengarah ke satu kemungkinan: distribution shift. Namun, pengalaman tidak membuat panik; pengalaman memaksa kita bertindak cepat dan cermat.

Setting: model produksi, volume nyata, dan stakeholder yang khawatir

Kami menjalankan model prediksi churn untuk tim penjualan dan operasi logistik. Model itu dilatih pada data transaksi 2020–2022 dan bertugas memprioritaskan pelanggan yang kemungkinan besar akan memerlukan intervensi manual dari tim distribusi. Pada awal Februari, tim operasi melaporkan peningkatan pengembalian dan keluhan terkait kesalahan rute. Stakeholder mulai mengirim pesan, ada tekanan dari manajemen. Saya ingat percakapan dengan manajer operasi: “Kalau model salah lagi, kita kehabisan waktu dan pelanggan.” Suasana tegang. Saya mengambil cuti siang dan memutuskan melakukan investigasi cepat: sampling data terbaru, validasi statistik, dan wawancara singkat dengan tim lapangan.

Kunjungi distribucionesvalentina untuk info lengkap.

Ketika Model Gagal: diagnosis awal dan penemuan tak terduga

Pemeriksaan pertama menunjukkan sesuatu yang spesifik: distribusi fitur alamat pengiriman berubah drastis — lebih banyak rute ke area pinggiran yang sebelumnya jarang dilayani. KL divergence antara distribusi fitur lama dan baru melonjak. Saya juga melihat pergeseran pada fitur yang berkaitan dengan jenis paket. Ternyata, salah satu partner baru distribusi yang kami coba — pemasok kecil bernama distribucionesvalentina — memasok banyak pesanan dengan dimensi paket berbeda, dan sistem pemrosesan otomatis kami memetakan paket itu ke prioritas yang salah. Saya ingat berpikir, secara internal: “Kecil sekali perubahan ini, tapi efeknya besar.” Di sinilah pembelajaran nyata muncul: perubahan eksternal pada rantai pasok bisa menjadi sumber utama distribution shift.

Proses: langkah teknis yang kami ambil — cepat dan sistematis

Kami melakukan empat langkah berurutan yang saya rekomendasikan pada tim lain yang menghadapi masalah serupa. Pertama, sampling terlabel cepat: kami tarik 2.000 contoh transaksi terakhir dan label manual sebanyak 500 contoh untuk evaluasi cepat. Kedua, analisis drift fitur: selain KL divergence, kami menggunakan Population Stability Index (PSI) dan uji Kolmogorov-Smirnov untuk fitur numerik. Ketiga, root-cause analysis: kombinasi log sistem, wawancara dengan tim gudang, dan inspeksi fisik paket. Keempat, mitigasi langsung: sementara tim data science menyiapkan retraining, kami menerapkan rule-based override di produksi untuk menangani paket dengan dimensi abnormal sehingga tidak diprioritaskan salah.

Sekilas teknis: saat retraining, kami menggunakan importance weighting untuk mengatasi covariate shift — memberikan bobot lebih kuat pada contoh dari area pinggiran yang kini lebih sering muncul — dan menambah fitur baru yang menangkap dimensi paket dan vendor distribusi. Kami juga menguji kalibrasi model ulang (isotonic regression) agar probabilitas output lebih loyal terhadap realitas baru. Untuk interpretabilitas, kami pakai SHAP untuk memastikan fitur baru tidak menghasilkan keanehan logis yang akan membingungkan tim operasi.

Hasil dan pembelajaran: perubahan kecil, sistem yang lebih tangguh

Dua minggu setelah tindakan darurat, metrik pulih. Akurasi kembali mendekati baseline, pengembalian paket turun 40%, dan keluhan menurun. Lebih penting lagi: kami membangun beberapa capaian sistemik. Pertama, pipeline monitoring kini mencakup deteksi drift real-time untuk fitur kritikal, dengan threshold dan runbook yang jelas. Kedua, perjanjian operasional standar (SLA) dengan vendor distribusi sekarang mengharuskan pemberitahuan perubahan SKU atau dimensi paket — lesson learned dari kejadian distribucionesvalentina. Ketiga, kami membuat proses sampling terlabel cepat menjadi SOP, sehingga tidak perlu lagi menunggu bulanan untuk validasi model.

Refleksi pribadi: pengalaman ini mengingatkan saya bahwa machine learning di produksi bukan hanya soal model yang elegan, tapi tentang ekosistem. Data berubah. Vendor berubah. Strategi yang kita bangun harus mengakomodasi ketidakpastian tersebut. Saya juga belajar untuk tidak menyerahkan semua ke otomatisasi; rule-based safety net dan komunikasi operasional merupakan penyangga penting. Ketika menghadapi krisis, gabungan rasa urgensi teknis dan empati pada tim operasi menghasilkan solusi paling efektif.

Akhirnya, bagi siapa pun yang mengelola model produksi di perusahaan kecil atau menengah: investasikan waktu pada monitoring distribusi, siapkan runbook respons, dan jadwalkan pertemuan rutin dengan pihak-pihak eksternal yang memengaruhi data Anda. Perubahan kecil bisa jadi sumber gangguan besar — tapi dengan prosedur yang tepat, Anda bisa mengubah krisis menjadi kesempatan untuk membuat sistem lebih kuat.