Что такое average precision

mAP (mean Average Precision) for Object Detection

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Mar 7, 2018 · 7 min read

AP (Average precision) is a popular metric in measuring the accuracy of object detectors like Faster R-CNN, SSD, etc. Average precision computes the average precision value for recall value over 0 to 1. It sounds complicated but actually pretty simple as we illustrate it with an example. But before that, we will do a quick recap on precision, recall, and IoU first.

Precision measures how accurate is your predictions. i.e. the percentage of your predictions are correct.

Recall measures how g ood you find all the positives. For example, we can find 80% of the possible positive cases in our top K predictions.

Here are their mathematical definitions:

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

For example, in the testing for cancer:

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

IoU (Intersection over union)

IoU measures the overlap between 2 boundaries. We use that to measure how much our predicted boundary overlaps with the ground truth (the real object boundary). In some datasets, we predefine an IoU threshold (say 0.5) in classifying whether the prediction is a true positive or a false positive.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Let’s create an over-simplified example in demonstrating the calculation of the average precision. In this example, the whole dataset contains 5 apples only. We collect all the predictions made for apples in all the images and rank it in descending order according to the predicted confidence level. The second column indicates whether the prediction is correct or not. In this example, the prediction is correct if IoU ≥ 0.5.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Let’s take the row with rank #3 and demonstrate how precision and recall are calculated first.

Precision is the proportion of TP = 2/3 = 0.67.

Recall is the proportion of TP out of the possible positives = 2/5 = 0.4.

Recall values increase as we go down the prediction ranking. However, precision has a zigzag pattern — it goes down with false positives and goes up again with true positives.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Let’s plot the precision against the recall value to see this zig-zag pattern.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

The general definition for the Average Precision (AP) is finding the area under the precision-recall curve above.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Precision and recall are always between 0 and 1. Therefore, AP falls within 0 and 1 also. Before calculating AP for the object detection, we often smooth out the zigzag pattern first.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Graphically, at each recall level, we replace each precision value with the maximum precision value to the right of that recall level.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

So the orange line is transformed into the green lines and the curve will decrease monotonically instead of the zigzag pattern. The calculated AP value will be less suspectable to small variations in the ranking. Mathematically, we replace the precision value for recall ȓ with the maximum precision for any recall ≥ ȓ.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Interpolated AP

PASCAL VOC is a popular dataset for object detection. For the PASCAL VOC challenge, a prediction is positive if IoU ≥ 0.5. Also, if multiple detections of the same object are detected, it counts the first one as a positive while the rest as negatives.

In Pascal VOC2008, an average for the 11-point interpolated AP is calculated.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

First, we divide the recall value from 0 to 1.0 into 11 points — 0, 0.1, 0.2, …, 0.9 and 1.0. Next, we compute the average of maximum precision value for these 11 recall values.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

In our example, AP = (5 × 1.0 + 4 × 0.57 + 2 × 0.5)/11

Here are the more precise mathematical definitions.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

When APᵣ turns extremely small, we can assume the remaining terms to be zero. i.e. we don’t necessarily make predictions until the recall reaches 100%. If the possible maximum precision levels drop to a negligible level, we can stop. For 20 different classes in PASCAL VOC, we compute an AP for every class and also provide an average for those 20 AP results.

According to the original researcher, the intention of using 11 interpolated point in calculating AP is

The intention in interpolating the precision/recall curve in this way is to reduce the impact of the “wiggles” in the precision/recall curve, caused by small variations in the ranking of examples.

However, this interpolated method is an approximation which suffers two issues. It is less precise. Second, it lost the capability in measuring the difference for methods with low AP. Therefore, a different AP calculation is adopted after 2008 for PASCAL VOC.

AP (Area under curve AUC)

For later Pascal VOC competitions, VOC2010–2012 samples the curve at all unique recall values ( r₁, r₂, …), whenever the maximum precision value drops. With this change, we are measuring the exact area under the precision-recall curve after the zigzags are removed.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

No approximation or interpolation is needed. Instead of sampling 11 points, we sample p( rᵢ) whenever it drops and computes AP as the sum of the rectangular blocks.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

This definition is called the Area Under Curve (AUC). As shown below, as the interpolated points do not cover where the precision drops, both methods will diverge.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

COCO mAP

Latest research papers tend to give results for the COCO dataset only. In COCO mAP, a 101-point interpolated AP definition is used in the calculation. For COCO, AP is the average over multiple IoU (the minimum IoU to consider a positive match). AP@[.5:.95] corresponds to the average AP for IoU from 0.5 to 0.95 with a step size of 0.05. For the COCO competition, AP is the average over 10 IoU levels on 80 categories (AP@[.50:.05:.95]: start from 0.5 to 0.95 with a step size of 0.05). The following are some other metrics collected for the COCO dataset.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

And, this is the AP result for the YOLOv3 detector.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

In the figure above, AP@.75 means the AP with IoU=0.75.

mAP (mean average precision) is the average of AP. In some context, we compute the AP for each class and average them. But in some context, they mean the same thing. For example, under the COCO context, there is no difference between AP and mAP. Here is the direct quote from COCO:

AP is averaged over all categories. Traditionally, this is called “mean average precision” (mAP). We make no distinction between AP and mAP (and likewise AR and mAR) and assume the difference is clear from context.

In ImageNet, the AUC method is used. So even all of them follow the same principle in measurement AP, the exact calculation may vary according to the datasets. Fortunately, development kits are available in calculating this metric.

Источник

Русские Блоги

mAP-Mean Average Precision

Основные понятия

Сравнивать и измерять bounding-box с ground Truth Степень совпадения.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

2.TP、TN、FP、FN

Истинные положительные результаты (TP): количество правильно классифицированных как положительных примеров, то есть количество примеров, которые действительно положительны и классифицируются как положительные;

Ложные срабатывания (FP): количество ложных срабатываний, то есть количество экземпляров, которые фактически являются отрицательными, но классифицируются как положительные;

Ложноотрицательные (FN): количество ложноотрицательных результатов, то есть количество экземпляров, которые фактически являются положительными, но классифицируются как отрицательные;

Истинно отрицательные (TN): количество отрицательных примеров, которые правильно классифицированы, то есть количество примеров, которые на самом деле отрицательны и классифицируются как отрицательные классификатором.

При обнаружении цели:

TP: Обнаружение окна предварительного выбора правильное, то есть поле предварительного выбора с IoU> = 0,5

FP: Ошибка обнаружения окна предварительного выбора, то есть поле предварительного выбора с IoU

FN: наземная правда не обнаружена

TN: Не используется. Это будет означать исправление неправильного обнаружения. В задаче обнаружения цели существует множество возможных ограничивающих рамок, которые не должны обнаруживаться на изображении. Следовательно, TN будет всеми ограничивающими прямоугольниками, которые могут быть не обнаружены (на изображении так много возможных прямоугольников), поэтому индикатор его не использует.

3.Precision&Recall

Точность:Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Скорость отзыва:Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

4.Precision-Recall curve

5.Average Precision

Поскольку кривую трудно вычислить, мы используем 11-точечная интерполяция Приходите получать, принят после 2012 года 8 точек, соответствующих максимальному значению Percision, найдите область кривой Это значение AP.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

среди них:Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precisionЭто максимальное значение соответствующей точки восприятия.

См. Ниже метод расчета площади.

расчет карты

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

1. Вычислите значение IoU ограничивающего прямоугольника и наземной истины, используйте порог, чтобы разделить предварительно выбранный прямоугольник на TP&FP.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

2. Рассчитайте совокупную точность и коэффициент отзыва.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

3. Постройте график кривой P-R.

Можно обнаружить, что чем больше выборок выбрано, тем выше скорость отзыва, а точность снижается.Если точность определенной категории детекторов объектов остается высокой по мере увеличения отзыва, это считается хорошей.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

4. Рассчитайте значение AP

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Метод площади:

Среднюю точность (AP) можно интерпретировать как приблизительную AUC (площадь) кривой P-R.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Глядя на изображение выше, мы можем разделить AUC на 4 области (A1, A2, A3 и A4):

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Для расчета общей площади у нас есть AP:

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

5. Рассчитайте карту

Источник

Метрики в задачах машинного обучения

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

В задачах машинного обучения для оценки качества моделей и сравнения различных алгоритмов используются метрики, а их выбор и анализ — непременная часть работы датасатаниста.

В этой статье мы рассмотрим некоторые критерии качества в задачах классификации, обсудим, что является важным при выборе метрики и что может пойти не так.

Метрики в задачах классификации

Для демонстрации полезных функций sklearn и наглядного представления метрик мы будем использовать датасет по оттоку клиентов телеком-оператора.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Accuracy, precision и recall

Перед переходом к самим метрикам необходимо ввести важную концепцию для описания этих метрик в терминах ошибок классификации — confusion matrix (матрица ошибок).
Допустим, что у нас есть два класса и алгоритм, предсказывающий принадлежность каждого объекта одному из классов, тогда матрица ошибок классификации будет выглядеть следующим образом:

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precisionЧто такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision
Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precisionTrue Positive (TP)False Positive (FP)
Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precisionFalse Negative (FN)True Negative (TN)

Здесь Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision— это ответ алгоритма на объекте, а Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision— истинная метка класса на этом объекте.
Таким образом, ошибки классификации бывают двух видов: False Negative (FN) и False Positive (FP).

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Accuracy

Интуитивно понятной, очевидной и почти неиспользуемой метрикой является accuracy — доля правильных ответов алгоритма:

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Эта метрика бесполезна в задачах с неравными классами, и это легко показать на примере.

Допустим, мы хотим оценить работу спам-фильтра почты. У нас есть 100 не-спам писем, 90 из которых наш классификатор определил верно (True Negative = 90, False Positive = 10), и 10 спам-писем, 5 из которых классификатор также определил верно (True Positive = 5, False Negative = 5).
Тогда accuracy:

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Однако если мы просто будем предсказывать все письма как не-спам, то получим более высокую accuracy:

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

При этом, наша модель совершенно не обладает никакой предсказательной силой, так как изначально мы хотели определять письма со спамом. Преодолеть это нам поможет переход с общей для всех классов метрики к отдельным показателям качества классов.

Precision, recall и F-мера

Для оценки качества работы алгоритма на каждом из классов по отдельности введем метрики precision (точность) и recall (полнота).

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Precision можно интерпретировать как долю объектов, названных классификатором положительными и при этом действительно являющимися положительными, а recall показывает, какую долю объектов положительного класса из всех объектов положительного класса нашел алгоритм.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Именно введение precision не позволяет нам записывать все объекты в один класс, так как в этом случае мы получаем рост уровня False Positive. Recall демонстрирует способность алгоритма обнаруживать данный класс вообще, а precision — способность отличать этот класс от других классов.

Как мы отмечали ранее, ошибки классификации бывают двух видов: False Positive и False Negative. В статистике первый вид ошибок называют ошибкой I-го рода, а второй — ошибкой II-го рода. В нашей задаче по определению оттока абонентов, ошибкой первого рода будет принятие лояльного абонента за уходящего, так как наша нулевая гипотеза состоит в том, что никто из абонентов не уходит, а мы эту гипотезу отвергаем. Соответственно, ошибкой второго рода будет являться «пропуск» уходящего абонента и ошибочное принятие нулевой гипотезы.

Precision и recall не зависят, в отличие от accuracy, от соотношения классов и потому применимы в условиях несбалансированных выборок.
Часто в реальной практике стоит задача найти оптимальный (для заказчика) баланс между этими двумя метриками. Классическим примером является задача определения оттока клиентов.
Очевидно, что мы не можем находить всех уходящих в отток клиентов и только их. Но, определив стратегию и ресурс для удержания клиентов, мы можем подобрать нужные пороги по precision и recall. Например, можно сосредоточиться на удержании только высокодоходных клиентов или тех, кто уйдет с большей вероятностью, так как мы ограничены в ресурсах колл-центра.

Обычно при оптимизации гиперпараметров алгоритма (например, в случае перебора по сетке GridSearchCV ) используется одна метрика, улучшение которой мы и ожидаем увидеть на тестовой выборке.
Существует несколько различных способов объединить precision и recall в агрегированный критерий качества. F-мера (в общем случае Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision) — среднее гармоническое precision и recall :

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precisionв данном случае определяет вес точности в метрике, и при Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precisionэто среднее гармоническое (с множителем 2, чтобы в случае precision = 1 и recall = 1 иметь Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision)
F-мера достигает максимума при полноте и точности, равными единице, и близка к нулю, если один из аргументов близок к нулю.
В sklearn есть удобная функция _metrics.classificationreport, возвращающая recall, precision и F-меру для каждого из классов, а также количество экземпляров каждого класса.

classprecisionrecallf1-scoresupport
Non-churned0.880.970.93941
Churned0.600.250.35159
avg / total0.840.870.841100

Здесь необходимо отметить, что в случае задач с несбалансированными классами, которые превалируют в реальной практике, часто приходится прибегать к техникам искусственной модификации датасета для выравнивания соотношения классов. Их существует много, и мы не будем их касаться, здесь можно посмотреть некоторые методы и выбрать подходящий для вашей задачи.

AUC-ROC и AUC-PR

При конвертации вещественного ответа алгоритма (как правило, вероятности принадлежности к классу, отдельно см. SVM) в бинарную метку, мы должны выбрать какой-либо порог, при котором 0 становится 1. Естественным и близким кажется порог, равный 0.5, но он не всегда оказывается оптимальным, например, при вышеупомянутом отсутствии баланса классов.

Одним из способов оценить модель в целом, не привязываясь к конкретному порогу, является AUC-ROC (или ROC AUC) — площадь (Area Under Curve) под кривой ошибок (Receiver Operating Characteristic curve ). Данная кривая представляет из себя линию от (0,0) до (1,1) в координатах True Positive Rate (TPR) и False Positive Rate (FPR):

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

TPR нам уже известна, это полнота, а FPR показывает, какую долю из объектов negative класса алгоритм предсказал неверно. В идеальном случае, когда классификатор не делает ошибок (FPR = 0, TPR = 1) мы получим площадь под кривой, равную единице; в противном случае, когда классификатор случайно выдает вероятности классов, AUC-ROC будет стремиться к 0.5, так как классификатор будет выдавать одинаковое количество TP и FP.
Каждая точка на графике соответствует выбору некоторого порога. Площадь под кривой в данном случае показывает качество алгоритма (больше — лучше), кроме этого, важной является крутизна самой кривой — мы хотим максимизировать TPR, минимизируя FPR, а значит, наша кривая в идеале должна стремиться к точке (0,1).

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Критерий AUC-ROC устойчив к несбалансированным классам (спойлер: увы, не всё так однозначно) и может быть интерпретирован как вероятность того, что случайно выбранный positive объект будет проранжирован классификатором выше (будет иметь более высокую вероятность быть positive), чем случайно выбранный negative объект.

Рассмотрим следующую задачу: нам необходимо выбрать 100 релевантных документов из 1 миллиона документов. Мы намашинлернили два алгоритма:

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Скорее всего, мы бы выбрали первый алгоритм, который выдает очень мало False Positive на фоне своего конкурента. Но разница в False Positive Rate между этими двумя алгоритмами крайне мала — всего 0.0019. Это является следствием того, что AUC-ROC измеряет долю False Positive относительно True Negative и в задачах, где нам не так важен второй (больший) класс, может давать не совсем адекватную картину при сравнении алгоритмов.

Для того чтобы поправить положение, вернемся к полноте и точности :

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Здесь уже заметна существенная разница между двумя алгоритмами — 0.855 в точности!

Precision и recall также используют для построения кривой и, аналогично AUC-ROC, находят площадь под ней.

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Здесь можно отметить, что на маленьких датасетах площадь под PR-кривой может быть чересчур оптимистична, потому как вычисляется по методу трапеций, но обычно в таких задачах данных достаточно. За подробностями о взаимоотношениях AUC-ROC и AUC-PR можно обратиться сюда.

Logistic Loss

Особняком стоит логистическая функция потерь, определяемая как:

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

здесь Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision— это ответ алгоритма на Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision-ом объекте, Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision— истинная метка класса на Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision-ом объекте, а Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precisionразмер выборки.

Подробно про математическую интерпретацию логистической функции потерь уже написано в рамках поста про линейные модели.
Данная метрика нечасто выступает в бизнес-требованиях, но часто — в задачах на kaggle.
Интуитивно можно представить минимизацию logloss как задачу максимизации accuracy путем штрафа за неверные предсказания. Однако необходимо отметить, что logloss крайне сильно штрафует за уверенность классификатора в неверном ответе.

Отметим, как драматически выросла logloss при неверном ответе и уверенной классификации!
Следовательно, ошибка на одном объекте может дать существенное ухудшение общей ошибки на выборке. Такие объекты часто бывают выбросами, которые нужно не забывать фильтровать или рассматривать отдельно.
Всё становится на свои места, если нарисовать график logloss:

Что такое average precision. Смотреть фото Что такое average precision. Смотреть картинку Что такое average precision. Картинка про Что такое average precision. Фото Что такое average precision

Видно, что чем ближе к нулю ответ алгоритма при ground truth = 1, тем выше значение ошибки и круче растёт кривая.

Подытожим:

Полезные ссылки

Благодарности

Спасибо mephistopheies и madrugado за помощь в подготовке статьи.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *