Cara Menghitung Metode Cooks Distance Pada Excel

Jika Anda sering bekerja dengan aplikasi Microsoft Excel, maka Anda pasti sudah paham betapa pentingnya untuk menghitung berbagai nilai dan data dalam bentuk tabel. Salah satu algoritma yang sering digunakan dalam mengolah data adalah algoritma k-NN atau K-Nearest Neighbors. Dalam artikel ini, saya akan membahas cara menghitung distance algoritma k-NN menggunakan Microsoft Excel.

Cara Menghitung Distance Algoritma k-NN Di Excel

Sebelum membahas tentang cara menghitung distance algoritma k-NN di Excel, mari kita bahas terlebih dahulu tentang apa itu algoritma k-NN. K-NN merupakan algoritma machine learning yang digunakan untuk klasifikasi dan regresi data. Algoritma ini bekerja berdasarkan prinsip bahwa objek yang serupa cenderung memiliki label atau nilai yang sama.

Untuk menghitung distance algoritma k-NN di Excel, kita perlu mengikuti beberapa langkah berikut:

Langkah 1: Siapkan Data

Pertama- tama, kita perlu menyiapkan data yang akan diolah. Untuk mengikuti contoh ini, kita akan menggunakan data seperti gambar berikut:

Cara Menghitung Metode Cooks Distance Pada Excel

Data tersebut terdiri dari dua variabel, yaitu x dan y. Variabel ini akan digunakan untuk menghitung jarak atau distance antara dua titik dalam ruang dua dimensi.

Langkah 2: Hitung Distance

Selanjutnya, kita perlu menghitung distance antara dua titik dalam ruang dua dimensi. Distance yang dihitung dapat menggunakan rumus Euclidean, Manhattan, Minkowski, ataupun rumus distance lainnya.

Untuk menghitung distance menggunakan rumus Euclidean, kita dapat menggunakan rumus berikut:

Baca Juga :  CARA BUKA DATA EXCEL COLUM SECARA KESELURUHAN

Rumus Euclidean

Dimana:

  • x1 dan y1 adalah koordinat titik pertama
  • x2 dan y2 adalah koordinat titik kedua

Untuk menghitung distance menggunakan rumus Manhattan, kita dapat menggunakan rumus berikut:

Rumus Manhattan

Dimana:

  • x1 dan y1 adalah koordinat titik pertama
  • x2 dan y2 adalah koordinat titik kedua

Untuk menghitung distance menggunakan rumus Minkowski, kita dapat menggunakan rumus berikut:

Rumus Minkowski

Dimana:

  • x1 dan y1 adalah koordinat titik pertama
  • x2 dan y2 adalah koordinat titik kedua
  • p adalah order, misalnya apabila p=1 maka rumus akan menghasilkan distance rumus Manhattan, sedangkan apabila p=2 maka rumus akan menghasilkan distance rumus Euclidean

Langkah 3: Urutkan Data

Setelah menghitung distance antara dua titik, selanjutnya kita perlu mengurutkan data berdasarkan nilai distance terkecil. Dalam hal ini, kita akan menggunakan fungsi SORT untuk melakukan pengurutan data.

Langkah 4: Tentukan Parameter k

Setelah mengurutkan data, kita perlu menentukan berapa nilai k yang akan digunakan untuk mengklasifikasikan data. Nilai k ini dapat diatur berdasarkan preferensi atau karakteristik data yang diolah. Biasanya, nilai k yang digunakan adalah bilangan ganjil untuk menghindari adanya hasil yang imbang.

Langkah 5: Voting

Langkah terakhir dalam menghitung distance algoritma k-NN adalah melakukan voting. Dalam hal ini, kita perlu menghitung jumlah data yang termasuk dalam kategori tertentu, kemudian menentukan prediksi nilai untuk data yang akan diklasifikasikan. Dalam hal ini, kita dapat menggunakan fungsi COUNTIF untuk menghitung jumlah data yang termasuk dalam kategori tertentu.

FAQ (Frequently Asked Question)

1. Apa kegunaan algoritma k-NN?

Algoritma k-NN memiliki banyak kegunaan dalam dunia data science dan machine learning, antara lain:

  • klasifikasi data
  • regresi data
  • rekomendasi produk atau konten
  • deteksi penipuan
  • pengenalan wajah atau suara
Baca Juga :  Bagaimana Cara Mengubah Format Adk Ke Excel Yang Rapi

2. Apa perbedaan antara algoritma k-NN dengan algoritma lainnya?

Setiap algoritma machine learning memiliki karakteristik dan kegunaan yang berbeda-beda. Perbedaan antara algoritma k-NN dengan algoritma lainnya terutama terletak pada cara pengolahan data dan hasil yang dihasilkan.

Contohnya, dalam klasifikasi data, algoritma Decision Tree lebih cocok digunakan untuk data kategorikal dan berstruktur, sementara algoritma SVM (Support Vector Machine) lebih cocok digunakan untuk data numerik dan rumit. Sedangkan untuk regresi data, algoritma Linear Regression lebih cocok digunakan untuk data yang relatif sederhana dan tak terlalu kompleks.