K-найближчі сусіди (kNN) є техніка керованого машинного навчання, яку можна використовувати для виконання завдань як класифікації, так і регресії.3 серпня 2022 р
Алгоритм k-найближчих сусідів (KNN) — це непараметричний класифікатор із контрольованим навчанням, який використовує близькість робити класифікації або прогнози щодо групування окремої точки даних. Це один із популярних і найпростіших класифікаторів і класифікаторів регресії, які використовуються сьогодні в машинному навчанні.
Як ми бачили вище, алгоритм KNN можна використовувати як для задач класифікації, так і для регресії. Алгоритм KNN використовує «подібність ознак» для прогнозування значень будь-яких нових точок даних. Це означає, що новій точці присвоюється значення на основі того, наскільки вона схожа на точки в навчальному наборі.
K-NN — це непараметричний алгоритм, що означає, що він не робить жодних припущень щодо базових даних. Його також називають алгоритмом ледачого учня, оскільки він не навчається з навчального набору відразу, замість цього він зберігає набір даних і під час класифікації виконує дію з набором даних.
KNN працює, знаходячи відстані між запитом і всіма прикладами в даних, вибираючи вказану кількість прикладів (K), найближчих до запиту, потім голосуючи за найчастішу мітку (у випадку класифікації) або усереднюючи мітки (у випадок регресії).
KNN є найбільш корисним коли позначені дані занадто дорогі або їх неможливо отримати, і він може досягти високої точності в широкому спектрі проблем типу передбачення. KNN — це простий алгоритм, заснований на локальному мінімумі цільової функції, який використовується для вивчення невідомої функції бажаної точності.