MOT 度量指标

经典

Bo Wu and Ram Nevatia. Tracking of multiple, partially occluded humans based on static body part detection. In 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR’06), volume 1,pages 951–958. IEEE, 2006.

  • Mostly Tracked (MT) trajectories: number of ground-truth trajectories that are correctly tracked in at least 80% of the frames. 在至少80%的帧中被正确跟踪的基真轨迹数。
  • Fragments: trajectory hypotheses which cover at most 80% of a ground truth trajectory. Observe that a true trajectory can be covered by more than one fragment. 轨迹假设最多覆盖80%的真实轨迹。观察一个真实的轨迹可以被多个碎片覆盖。
  • Mostly Lost (ML) trajectories: number of ground-truth trajectories that are correctly tracked in less than 20% of the frames. 在少于20%的帧中被正确跟踪的基真轨迹的数目。
  • False trajectories: predicted trajectories which do not correspond to a real object (i.e. to a ground truth trajectory). 错误的轨迹
  • ID switches: number of times when the object is correctly tracked, but the associated ID for the object is mistakenly changed. 对象的关联ID错误变更的次数

CLEAR MOT metrics

CLEAR : Classification of Events, Activities and Relationships

用来确定真实对象(ground truth)和预测结果目标是否相关的最常用度量是边界框的交集(IoU),如果真实对象oi和假设(预测结果)hj在帧 t − 1中匹配,并且在帧 t 中IoU(oi,hj)≥0.5,则oi和hj在该帧中匹配。
在执行完与先前帧的匹配后,仍尝试使用0.5 IoU阈值将其余对象与其余假设进行匹配。
不能与假设相关联的真实对象的边界框被视为false negative(FN),而不能与真实对象边界框相关联的假设被标记为false positive(FP)。另外,每次真实对象跟踪被中断并随后恢复时,都被计为碎片( fragment ),而每次在跟踪期间内跟踪的真实对象ID被错误地更改,都被计为ID开关。然后,计算出的简单指标如下:

  • FP: the number of false positives in the whole video;
  • FN: the number of false negatives in the whole video;
  • Fragm: the total number of fragmentations;
  • IDSW: the total number of ID switches.

MOTA score

其中GT是真实对象边界框的数量。重要的是要注意分数可能为负,因为该算法可能会犯一些比地面真理框的数目更多的错误。

通常,通常不使用MOTA,而是使用MOTA百分比,MOTA百分比只是先前表示为百分比的表达式。另一方面,MOTP的计算公式为:

其中ct表示帧t中的匹配数,而dt则是假设i与为其分配的真实对象之间的边界框重叠。重要的是要注意,此度量标准很少考虑有关跟踪的信息,而是侧重于检测的质量。

ID scores

MOTA评分的主要问题在于,它考虑了跟踪器做出错误决定的次数,例如ID切换,但是在某些情况下(例如,机场安全),人们可能会对激励跟踪器更感兴趣。这些跟踪器可以在尽可能长的时间内跟踪一个物体,而不失去其位置。

因此,在[21]中定义了几个替代的新指标,这些指标应补充CLEAR MOT指标给出的信息。

构造了一个二部图,并将该问题的最小代价解作为问题解。

IDTP是选择为真实正ID匹配的边缘权重之和(可以看作是在整个视频中正确分配的检测百分比)。 IDFN是来自选定虚假ID边缘的权重之和,IDFP是来自选定虚假ID边缘的权重之和。使用这三个基本度量,可以计算出另外三个度量:





除非注明,否则均为一叶呼呼原创文章,转载必须以链接形式标明本文链接

本文链接:http://www.yiyehu.tech/archives/2020/03/30/mot-metrics

发表评论

电子邮件地址不会被公开。 必填项已用*标注