getting close to your data…

Pemodelan Klasifikasi dengan Kelas Tidak Seimbang #2

January 8th, 2018 · No Comments

imbalance

Ini merupakan lanjutan dari http://bagusco.staff.ipb.ac.id/2018/01/05/kelas-tidak-seimbang-part1/

 

Cara pertama

Hal pertama yang dapat dilakukan adalah dengan melihat kemungkinan apakah kita dapat melakukan penambahan data.  Memperbanyak data memungkinkan untuk menyebabkan proporsi yang tidak seimbang menjadi (sedikit) lebih seimbang.  Tentu saja ini tidak selalu berhasil dengan beberapa alasan, yaitu (1) Tidak ada waktu lagi untuk menambah data… sudah mepet waktunya untuk segera menghasilkan model, (2) Proporsi yang minoritas memang sangat kecil, mau nambah data berapapun maka proporsinya tidak akan meningkat, (3) Tidak ada data lagi, itu saja yang tersedia saat ini.

 

Cara Kedua…

Lakukan penyeimbangan data dengan melakukan resampling, yaitu menarik sampel dari data yang ada.  Proses penarikan sampel dilakukan dalam dua cara yaitu (1) undersampling, dan (2) oversampling.  Dua proses ini adalah penarikan sampel secara tidak proporsional.

Yang dimaksud dengan undersampling adalah mengambil sampel sedemikian rupa sehingga proporsi kelas mayoritas tidak sebesar (menjadi lebih kecil) proporsi aslinya.  Sering dikerjakan bahwa amatan kelas minoritas dipilih semuanya, sedangkan amatan kelas mayoritas diambil secara acak sebagian saja.  Dengan cara ini maka ketimpangan proporsi mayoritas dan minoritas menjadi berkurang.

Cara lain adalah oversampling.  Secara umum teknik ini adalah mengambil kelas minoritas sedemikian rupa sehingga proporsinya dalam sample lebih besar dibandingkan proporsi asalnya.   Yang dilakukan umumnya pada kasus pemodelan klasifikasi adalah dengan cara menduplikasi amatan minoritas.

 

Cara lain…. kita lanjutkan pada postingan berikutnya

 

 

Tags: Uncategorized

0 responses so far ↓

  • There are no comments yet...Kick things off by filling out the form below.

Leave a Comment