PTZ 标注登录

PTZ 投篮聚类标注工具
未选择任务

使用说明

这份说明分为两部分:先理解基本操作和基本规则,再参考一套推荐的高效标注流程。推荐流程不是唯一做法,你也可以根据自己的经验采用更适合的工作方式。

一、基本操作和基本规则

标注的核心目标,是把一个任务里的事件整理成可以直接用于业务统计的最终结果。你主要在做三件事:确认这个事件是不是比赛中、确认它属于哪个人物类别、确认关键事件属性是否明显需要修正。

  1. 先从任务列表进入一个任务。如果需要重新聚类,可以调整 k 后重新聚类。
  2. 页面中的每个球员类别代表一个聚类结果。你需要检查这些事件是不是同一个人。
  3. 支持多选事件后一次性批量转移。先勾选多个属于同一个人的事件,再在页面底部的批量操作区选择目标人物类别并执行转移,这样比一条条移动更快,特别适合修正一整批错分样本。
  4. 如果某个事件放错了球员类别,可以把它转移到正确的人物类别。
  5. 比赛中事件应当归到某个最终人物类别中。未分类中的比赛中事件,提交前需要处理完。
  6. 如果事件不属于比赛中内容,可以标记为非比赛中。非比赛中事件不会进入最终业务结果。
  7. 每个最终人物类别都需要选择队伍。号码、队服颜色、备注建议尽量补充完整,后续会更好找。
  8. 待定? 按钮用于先挂起有疑问的事件,避免中途来回打断;确认√ 按钮用于标记当前事件已经看过并确认。
  9. 助攻、篮板结果允许直接采用 AI 结果,不要求每条都人工逐个确认;但如果你发现明显错误,仍然可以修正。

聚类按钮怎么用

  1. 第一次聚类时,k 尽量填写这场比赛里真实参与的主要球员数。
  2. 如果你一开始不能完全确定,可以先凭经验给一个接近的数值,先看结果,再调整。
  3. 如果聚类后类别很多,而且出现很多几乎没有样本、只有零散几条事件的小类别,通常说明 k 偏大,可以适当调小。
  4. 如果一个类别里明显混进了很多不同球员,整体看起来很乱,通常说明 k 偏小,可以适当调大。
  5. 聚类不是一次定死的。你可以重复执行,边看结果边调整,直到类别数量和类别纯度都比较合适,再开始系统性标注。

基础概念说明

概念 含义 标注时怎么理解
比赛中 这个事件属于实际比赛过程中的有效片段。 如果是正常比赛回合里的投篮、助攻、篮板等,通常就是比赛中。和比赛无关的镜头、暂停、回放、观众、空镜头,一般不算比赛中。
几分球 指这次出手按规则应记为 2 分、3 分或罚球。 它描述的是出手类型,不是最后得了几分。比如三分出手没进,仍然是 3 分球;罚球也是单独一种类型。
命中 指这次出手最终是否投进。 命中和几分球是两个概念。先判断这是什么类型的出手,再看它有没有进。大多数情况下算法对命中已经比较准,除非明显错误,否则可以少花时间。
助攻 在得分事件中,与得分前最后有效传球相关的人物结果。 这类结果允许直接采用 AI 输出,不强制你逐条确认。只有你发现明显识别错人、错分组、或者根本不成立时,再手动修正。
篮板 在未命中事件后,与抢到篮板相关的人物结果。 和助攻一样,默认可以直接采用 AI 结果,不会因为你没有逐条确认而阻塞提交。但明显错误还是应当改。
人物类别 系统把看起来像同一个人的事件聚成一类。 你的工作不是从零创建人物,而是检查聚类是否正确,把错放的事件移到正确的人物类别里,并补充这个人的队伍、号码、队服颜色、备注等信息。
多选 / 批量转移 一次勾选多个事件,然后统一移动到同一个人物类别。 当你发现一批事件都属于同一个错误球员时,不需要逐条移动。先多选,再批量转移,会快很多,也更不容易漏掉同一批样本。
未分类 暂时没有归入某个最终人物类别的事件集合。 这里经常会混着几种情况:一是比赛中但还没转移到正确人物;二是本来就不属于比赛中的片段;三是系统没有可靠识别到人物,暂时放在这里。它不是一个真实球员类别,而是待处理区域。
未识别到人 系统没能稳定识别出这个事件对应的人物。 这种情况常见于遮挡严重、画面模糊、角度差、镜头太远。它们通常会落在未分类里,需要你判断是转入某个人物,还是标为非比赛中。
非比赛中 这个事件不应该进入最终比赛业务结果。 例如暂停、回放、切镜、观众、教练席、无效片段等。只要你确认它不是有效比赛事件,就可以标为非比赛中。
废弃 / 非比赛按钮 用于把当前事件排除出最终有效比赛结果。 如果你确认这个事件没有业务价值,或者根本不是比赛过程的一部分,就使用它。使用后,该事件不会再作为有效比赛事件参与最终统计。

其中最容易混淆的是“未分类”。你可以把它理解成一个临时待处理区,而不是一个真正的球员。提交前,未分类里不应该还留着需要保留的比赛中事件。

二、推荐的高效标注流程

下面是一套推荐思路,目的是减少反复跳转、提高确认速度。它不是强制流程,只是目前更稳、更省时间的一种做法。

  1. 先从上到下看,不要急着到处回跳。
    顺着页面往下处理,通常比反复回头更快,也更不容易漏事件。遇到暂时拿不准的事件,先用 待定? 挂起,继续往下走。
  2. 优先把人物类别本身整理清楚。
    先看每个聚类里是不是同一个人,先把明显错分的事件转移走。人物类别清楚之后,后面的得分、助攻、篮板和统计都会更顺。
  3. 发现成批错样本时,优先用多选批量转移。
    如果一眼能看出几条甚至几十条事件都属于同一个人,直接多选后一次性转移,效率会远高于逐条处理。这个操作尤其适合修正聚类里成片混入的错误球员。
  4. 先给每个类别确定“主球员”,再处理零散错样本。
    第一轮先看每个类别里占多数的那个人是谁,先把这个类别的主身份定下来,比如号码、队服颜色、外形特点、护具、发型等。这样每个类别先有一个清晰锚点。后面从上到下处理时,那些样本很少的小类别可以当作“占位类”来用:把本来混在别处的错误球员,逐步转移并填充到这些更合适的小类别里,而不是一开始就反复大范围来回挪动。
  5. 给每个人物类别写清楚描述。
    备注不要只写很短的词,尽量写成便于检索和区分的描述,例如“白队 7 号 后卫 短发 黑护臂”。后面转移球员时,会明显更容易定位。
  6. 尽量记录号码和队服颜色。
    号码、球衣主色、护具、发型这些信息都很有用。尤其是号码和队服颜色,往往能最快帮助你确认是不是同一个人,也方便后续纠错。
  7. 善用 Tab 导航栏做快速定位。
    Tab 导航栏会实时显示每个类别的关键信息,包括你已经填写的备注特征、号码、球队信息和当前类别人数。排查某个错误球员时,可以先在导航栏里快速扫一遍,看他是不是已经在别的类别里出现过,这通常比在页面里来回翻更快。
  8. 优先通过缩略图确认,不要一开始就依赖视频。
    大多数事件用缩略图就足够判断人物、队伍和大致动作。只有缩略图看不清、确实有争议时,再点开视频核对。这样整体速度会快很多。
  9. 是否命中大多数情况下可以少花时间。
    这部分算法通常已经比较准。除非你看到明显不对,或者这个事件会影响后续判断,否则不必把大量时间花在反复确认命中上。
  10. 把待定事件留到最后集中处理。
    前面一路往下做,最后再回到带 待定? 的事件统一处理。这样你的上下文更稳定,也更容易结合已经整理好的人物类别做决定。
  11. 提交前重点检查未分类区域。
    未分类里如果还有比赛中事件,或者还有准备归入某个球员的内容没有转移完成,提交时就会留下脏结果。提交前最好把未分类和待处理事件再快速扫一遍。
  12. 最后做一次轻量复查。
    重点看三件事:比赛中事件是否都在正确人物下、每个人物是否选了队伍、明显错分事件是否已经转移。这个复查通常不需要很久,但能减少大量返工。

三、提交前最少检查项

  • 比赛中事件已经归到正确的人物类别,未分类中没有待处理的比赛中事件。
  • 非比赛中事件已经标记为非比赛中。
  • 每个最终人物类别都已经选择队伍。
  • 有条件的话,尽量补充号码、队服颜色和备注,方便后续复核和问题排查。