Era Machine Learning Klasik : Pohon Keputusan dan Rule-Based Learning

Memasuki era 1980-an hingga 1990-an, penelitian machine learning mulai berfokus pada bagaimana komputer dapat menemukan aturan secara otomatis dari data. Jika sebelumnya sistem AI banyak bergantung pada aturan yang ditulis langsung oleh manusia, kini komputer mulai belajar membuat aturan tersebut sendiri melalui proses pelatihan data.

Salah satu pendekatan yang paling populer pada masa itu adalah Decision Tree atau pohon keputusan. Algoritma ini bekerja seperti proses pengambilan keputusan manusia, yaitu dengan mengajukan serangkaian pertanyaan hingga menemukan jawaban akhir. Karena bentuknya mudah dibaca dan dipahami, Decision Tree menjadi salah satu model machine learning yang paling banyak digunakan dalam penelitian maupun industri.

Decision Tree: Belajar Melalui Pertanyaan

Decision Tree merupakan algoritma supervised learning yang digunakan untuk klasifikasi maupun prediksi. Model ini membagi data menjadi beberapa cabang berdasarkan karakteristik tertentu hingga menghasilkan keputusan akhir.

Misalnya, untuk menentukan apakah seseorang akan membeli produk atau tidak, sistem dapat membuat pertanyaan seperti:

Apakah usia di atas 30 tahun?
Apakah memiliki penghasilan tetap?
Apakah pernah membeli sebelumnya?

Setiap jawaban akan membawa data ke cabang berikutnya sampai diperoleh hasil akhir. Keunggulan utama Decision Tree adalah transparansi karena proses pengambilan keputusannya dapat dilihat secara jelas oleh manusia.

ID3: Awal Revolusi Pohon Keputusan

Salah satu algoritma pohon keputusan yang paling berpengaruh adalah ID3 (Iterative Dichotomiser 3) yang dikembangkan oleh Ross Quinlan pada tahun 1980-an.

ID3 menggunakan konsep Entropy dan Information Gain untuk menentukan atribut terbaik yang digunakan sebagai percabangan pohon. Semakin besar Information Gain suatu atribut, semakin penting atribut tersebut dalam membantu proses klasifikasi.

Pendekatan ini membuat komputer mampu memilih pertanyaan yang paling efektif terlebih dahulu sehingga proses pengambilan keputusan menjadi lebih efisien. ID3 menjadi salah satu algoritma yang mendorong popularitas machine learning pada era tersebut.

C4.5: Generasi Penyempurna ID3

Seiring berkembangnya kebutuhan dunia nyata, para peneliti menemukan beberapa keterbatasan pada ID3. Untuk mengatasinya, Ross Quinlan mengembangkan C4.5, yang merupakan penerus langsung dari ID3.

C4.5 mampu menangani data kontinu, data yang memiliki nilai hilang (missing values), serta menerapkan teknik pruning untuk mengurangi overfitting. Selain itu, algoritma ini menggunakan Gain Ratio yang membantu menghasilkan pemisahan data yang lebih baik dibandingkan Information Gain biasa.

Karena lebih fleksibel dan lebih cocok untuk data dunia nyata, C4.5 menjadi salah satu algoritma klasifikasi paling berpengaruh dalam sejarah machine learning.

CART: Ketika Pohon Keputusan Bisa Memprediksi Angka

Selain ID3 dan C4.5, terdapat algoritma penting lainnya yaitu CART (Classification and Regression Trees) yang diperkenalkan oleh Leo Breiman dan rekan-rekannya.

Berbeda dengan ID3 yang fokus pada klasifikasi, CART dapat digunakan untuk dua jenis tugas sekaligus:

Classification → memprediksi kategori.
Regression → memprediksi nilai numerik.

CART menggunakan ukuran Gini Impurity untuk menentukan pemisahan data terbaik pada proses klasifikasi dan menghasilkan struktur pohon biner yang lebih sederhana. Pendekatan ini kemudian menjadi dasar bagi berbagai algoritma ensemble modern seperti Random Forest.

Rule-Based Learning: Dari Data Menjadi Aturan

Salah satu keunggulan besar Decision Tree adalah kemampuannya menghasilkan aturan yang mudah dipahami manusia. Setiap jalur dari akar hingga daun pohon dapat diubah menjadi aturan berbentuk:

IF kondisi A AND kondisi B THEN hasil C

Kemampuan ini membuat model machine learning tidak hanya akurat tetapi juga dapat dijelaskan (explainable AI). Hal ini sangat penting pada bidang seperti kesehatan, keuangan, dan pendidikan yang membutuhkan alasan jelas di balik setiap keputusan yang dibuat oleh sistem.

Warisan Era Machine Learning Klasik

Walaupun saat ini dunia AI banyak didominasi oleh deep learning dan model generatif, algoritma pohon keputusan tetap digunakan secara luas. Banyak algoritma modern sebenarnya dibangun di atas konsep yang lahir pada era machine learning klasik.

Contohnya, Random Forest menggunakan kumpulan banyak Decision Tree, sedangkan Gradient Boosting menggabungkan beberapa pohon keputusan untuk meningkatkan akurasi prediksi. Dengan kata lain, konsep yang dikembangkan pada era ini masih menjadi fondasi penting dalam machine learning hingga tahun 2026.

Kesimpulan

Era Machine Learning Klasik menandai perubahan besar dalam cara komputer belajar dari data. Melalui Decision Tree dan Rule-Based Learning, komputer mulai mampu menemukan aturan sendiri tanpa harus diprogram secara rinci oleh manusia. Algoritma seperti ID3, C4.5, dan CART menjadi tonggak penting yang memperkenalkan teknik klasifikasi dan prediksi yang sederhana, transparan, dan efektif. Hingga saat ini, konsep-konsep tersebut masih menjadi dasar bagi banyak algoritma machine learning modern yang digunakan dalam berbagai bidang industri dan penelitian.