getting close to your data…

and let them speak…

 

Welcome

 

I am really appreciating your visit to this site, and should admit that you might be disappointed not finding anything here.  Believe me, I am working on it.  As soon as I have leisure time, I will post something here.  Keep coming… and let me know how your impression is.

 

Analisis Gerombol — Bagian 2

 

Pada seri tulisan ini akan dipaparkan beberapa hal dasar dan umum mengenai algoritma K-MEANS pada analisis gerombol (cluster analysis) dengan menitikberatkan pada pemahaman konsep dasar dan penjelasan proses algoritmanya. Ilustrasi sederhana dan program R disajikan untuk mempermudah pemahaman.

Kritik, saran dan pertanyaan terhadap materi tulisan ini dapat disampaikan melalui email pada alamat bagusco@gmail.com. Penulis akan sangat mengapresiasi berbagai masukan tersebut. Akhirnya, selamat membaca.

Tulisan dapat didownload pada link berikut: Analisis Cluster — Bagian 2

 

Analisis Gerombol — Bagian 1

 

Pada seri tulisan ini akan dipaparkan beberapa hal dasar dan umum mengenai analisis gerombol (cluster analysis) dengan menitikberatkan pada pemahaman konsep dasar dan penjelasan proses algoritmanya. Beberapa aplikasi akan diberikan dengan uraian yang lebih terbatas. Kritik, saran dan pertanyaan terhadap materi tulisan ini dapat disampaikan melalui email pada alamat bagusco@gmail.com. Penulis akan sangatmengapresiasi berbagai masukan tersebut. Akhirnya, selamat membaca.

berikut link untuk mendownload tulisannya: Analisis Cluster — Bagian 1

 

Pohon Klasifikasi — Bagian 1

 

Ini adalah seri tulisan data mining dengan topik Pohon Klasifikasi (classification tree).  Akan ada beberapa bagian terpisah mengenai topik ini dan ini merupakan Bagian 1.

Tulisan ini memamaparkan beberapa hal dasar dan umum terkait dengan pohon klasifikasi yang perlu diketahui oleh mereka yang ingin mempelajari penggunaan dan pengembangan teknik ini. Untuk diketahui, tulisan ini hanya ditujukan untuk sarana berbagi pengetahuan dan tidak disiapkan sebagai rujukan ilmiah. Sebagian besar isi dalam tulisan ini diilhami oleh beberapa chapter dari buku Tom Mithcell (Machine Learning, McGraw-Hill, 1997), yang kemudian diramu berdasarkan pengalaman penulis menerapkan pohon klasifikasi dalam berbagai kasus dan pengalaman menyampaikan materi ini di perkuliahan maupun berbagai pelatihan. Pembaca yang ingin memperoleh rujukan teoritis dapat menelusurinya pada buku dan artikel jurnal yang relevan. Kritik, saran dan pertanyaan terhadap materi tulisan ini dapat disampaikan melalui email pada alamat bagusco@gmail.com. Penulis sangat mengapresiasi berbagai masukan tersebut. Akhirnya, selamat membaca.

 

Tulisan lengkap dapat di-download pada link berikuthttp://bagusco.staff.ipb.ac.id/files/2016/05/Pohon-Klasifikasi.pdf 

 

Ilmu peluang untuk hidup sehari-hari

 

Kejadiannya belum lama.  Pertemuan pertama kelas Teori Statistika.  Seperti biasa, ada semacam kontrak perkuliahan yang perlu disepakati antara mahasiswa dan dosen, dan salah satunya adalah toleransi keterlambatan.  Saya buka saja opsinya, dan menyerahkan mahasiswa untuk menentukan.

Di luar dugaan saya, tidak kurang dari 40% mahasiswa tidak dapat menyebutkan berapa menit maksimum toleransi, dan memilih opsi tidak ada batasan waktu terlambat, yang berarti kapanpun masuk, silakan.

Dalam aturan formalnya, IPB hanya memperbolehkan mahasiswa ikut ujian hanya jika mereka hadir setidaknya dalam 80% pertemuan.  Bahasa yang sering saya dengar dari mahasiwa adalah mereka dapat jatah 20% bolos kuliah.

Ketika menentukan batas toleransi keterlambatan, mestinya mereka gunakan ilmu peluang yang sudah mereka peroleh semester lalu.  Saya senang sekali kalau seandainya mereka bisa menghitung suatu nilai yang mencerminkan berapa menit waktu keterlambatan sehingga peluang mereka terlambat lebih dari nilai itu adalah 20% atau 0.2.  Bukankah mereka sudah ratusan kali pergi dari tempat tinggal ke ruang kuliah selama ini?  Bukankah seharusnya di benak mereka tergambar histogram distribusi data waktu perjalanan tersebut?  Bukankah mestinya dengan cepat mereka dapat menduga secara kasar berapa kuantil-80-nya?

Mudah-mudahan ini jadi pelajaran terbaik bagi para mahasiswa bahwa ilmu peluang tidak sekedar dipelajari di kelas, dinyatakan ke-bisa-annya dalam lembar jawaban ujian, dan ditampilkan kemampuannya dalam bentuk nilai di transkrip.  Ilmu peluang dan distribusi data dapat secara tidak sadar digunakan dalam kehidupan sehari-hari agar lebih mudah membuat berbagai keputusan.  Semoga.

 

Data Ujian Akhir Semester AED 2014/2015

 

Untuk para peserta ujian akhir semester STK335 Analisis Eksplorasi Data, file data yang digunakan dapat diunduh melalui alamat berikut:

file data yang bersifat tab-delimited

http://bagusco.staff.ipb.ac.id/files/2015/06/data-ujian-AED.txt

atau

file data yang bersifat comma-delimited

http://bagusco.staff.ipb.ac.id/files/2015/06/data-ujian-AED-2.txt

 

Selamat mengerjakan….

 

Modified t-Test (bahan ujian simulasi)

 

Johnson (1978) dan Kleijnen et al. (1986)

 

 

 

Pengenalan Algoritma Genetik untuk Pemilihan Peubah Penjelas

 

Algoritma genetik (genetics algorithm) telah menjadi salah satu algoritma optimasi yang banyak digunakan di berbagai permasalahan.  Tulisan ini memaparkan ide dasar algoritma genetik dan penerapannya dalam pemilihan peubah dalam analisis regresi.  Untuk tujuan memudahkan memahami jalannya penerapan algoritma, ditampilkan pula program sederhana menggunakan SAS/IML yang dengan mudah dapat dimodifikasi pada beberapa bagian.

selengkapnya di FSK 2010 – GA (Pengenalan Algoritma Genetik untuk Pemilihan Peubah Penjelas dalam Model Regresi menggunakan SAS/IML)

 

Pohon Gabungan — Ensemble Tree

 

Pohon regresi dan pohon klasifikasi telah menjadi salah satu teknik analisis prediktif yang banyak digunakan dalam berbagai bidang.  Metode pohon gabungan muncul sebagai pengembangan dari teknik pohon yang diharapkan dapat mengatasi kelemahan-kelemahan yang ada pada analisis pohon tunggal.  Pada prinsipnya pohon gabungan melakukan prediksi dengan menggabungkan nilai-nilai prediksi dari banyak pohon tunggal.  Tulisan ini dimaksudkan sebagai tulisan perkenalan untuk memberikan gambaran singkat metode pohon gabungan yang tersedia dengan rinci di berbagai bahan bacaan.

Selengkapnya di FSK 2010 – Ensemble Tree (METODE POHON GABUNGAN: SOLUSI PILIHAN UNTUK MENGATASI KELEMAHAN POHON REGRESI DAN KLASIFIKASI TUNGGAL)

 

Klasifikasi rancangan percobaan faktorial pecahan strength-three

 

Peneliti seyogyanya memilih dengan baik rancangan percobaan yang akan digunakan. Kegiatan klasifikasi bertujuan untuk memperoleh rancangan yang terbaik berdasarkan kriteria tertentu. Paper berikut mengulas berbagai teknik klasifikasi rancangan percobaan yang berguna untuk kasus rancangan orthogonal strength-three:
classification-st3

 

Menduga dan Menguji Koefisien Regresi Logistik Biner Menggunakan Solver di MS Excel

 

Tulisan lama berjudul “Menduga dan Menguji Koefisien Regresi Logistik Biner Menggunakan Solver di MS Excel” yang terinspirasi pertanyaan seorang teman tentang penghitungan koefisien regresi logistik. Beberapa hal
dalam tulisan ini overlap dengan tulisan banyak orang. Selengkapnya di link berikut: logistic-solver