近日,HLTV Rating 3.0的上线让社区对于如何完整评价选手的讨论变得愈加火热,不少人对于新算法表示怀疑,也有一部分人相信新算法在大样本的支持下更能直观体现选手在赛场上的真实价值。对此,Mauisnake对NER0进行了深度采访,以下是采访全文:
Q:从你的角度来说,你如何看待当前版本的Rating 3.0?
我对此相当满意。虽然并非100%满意,毕竟任何事物都不可能完美,总需要在某个时间点发布成品,对吧?但我认为只要样本量足够大,它比2.1和2.0版本要好得多。单张地图的回合影响力计算确实存在缺陷,比如当你赢下1v3残局时数据会非常亮眼。但总体而言,随着样本量扩大,这些波动最终会趋于平衡。单地图数据可能略显古怪,但我仍认为它优于2.1版本,因为如果你的大部分伤害输出来自经济局,Rating理应有所调整,这很合理。
总体而言我是满意的。将Leetify式的回合影响力系统与经济局调整版的Rating 2.0相结合,是我们唯一可行的方向。因此这种平衡机制的设计是符合逻辑的。
Q:那么你认为经济局击杀的价值就该如此之低吗?以你提到的EliGE为例,他打出133 ADR却从2.06的Rating跌至1.41,甚至低于ADR少63的broky。这个调整是否过度了?
关于这场特定比赛,说实话我也不清楚具体情况。我只是在数据门户中按3.0与2.1的差值排序后,直接引用到文章里并核对了Skybox数据。他确实有约12个经济局击杀,这会影响数据。但我猜测他在长枪局表现一定很差,因为其回合影响力值极低。通常情况下即使有这么多经济局击杀,回合影响力也会更高。估计他是因为多次白给式死亡导致的。
经济局击杀仍然会计入Rating。其实早期我们还担心对经济局击杀的削弱不够彻底——毕竟现在这类击杀仍相当于半个人头价值,面对全甲Tec-9时甚至会计为0.7-0.8个击杀。我们是基于对战胜率来校准的,虽然难以完全精确,但在最初版本中我们对经济局击杀过于宽容,后续通过计算方式调整才更合理。不过这场比赛中,问题不止源于经济局。他肯定出现了重大失误,只是我还没复盘比赛。
Q:你提到玩家通过高价值击杀能获得大量分数,从而抵消经济局击杀的影响。这种动态平衡在大样本数据中如何体现?
这其实是早期版本的另一个问题。那些主要使用冲锋枪的选手Rating会疯狂上涨。就像前几天donk的情况,大家都说他发挥不佳,但他用沙漠之鹰完成了五杀左右,最终Rating反而持平。很多时候数据会自我修正。这实际上证明了HLTV团队最初的观点,我刚加入时就主张:我们需要3.0版本,需要经济局调整系统,而他们则认为:六个月周期内这些影响微乎其微。现在看来他们是正确的,在足够大的样本量下,大多数选手的Rating基本保持一致。纵观全年数据,经济局调整的主要效果其实是变相加强了SMG选手,同时削弱了狙击手。
Q:你在开发过程中与HLTV其他成员的合作程度如何?
最初的概念是由其他几位成员提出的。记得在颁奖典礼那天凌晨三点,Martin突然把我堵在会场说:"Rating 3.0就交给你负责了"。这就是项目的开端。主要是我和一位开发人员在推进,期间会请Petar、Striker等元老进行可行性校验。但没错,我确实是核心负责人。所以如果系统出现问题,基本就是我的责任。我们的开发人员虽然不是资深游戏玩家,但拥有数学博士学位。他负责数学建模、标准差计算等精密运算,而我负责直觉验证——确保数据“看起来合理”。
Q:你的统计学背景是?
我根本没有统计学背景(笑),纯属江湖骗子,被拆穿了吧。之所以接手这项工作,是因为CS领域当时缺乏数据专家。我本身喜欢足球统计数据,中学时数学成绩不错,但大学主修的是历史。大部分技能都是自学而成,比如为了写文章专门学了Python编程。不过团队里确实有科班出身的数学专家。
Q:现在CS电竞圈最关心的问题是:donk是否已经超越ZywOo成为世界第一?
单从数据看,确实超越了。上次TOP20选手评选后我的私信刚消停没多久,现在又炸了。如今donk的粉丝们也开始讨厌我,我真是两面不讨好。ZywOo和donk的竞争非常有趣,大半年时间里我都在抵制这种比较,但最近两场赛事让这个话题彻底爆发。我认为现在还没到"更好团队与更强个人"的对比阶段。如果此刻终止评选,鉴于donk的三个MVP来自次级赛事,根据评级标准ZywOo应该仍能保持第一——他连续获得七个MVP且含金量极高。但donk carry比赛的方式...简直是在上帝行为,如果保持这种态势,他的原始数据将会形成碾压优势。ZywOo与donk之争不仅会毁掉我今年十二月的HLTV TOP选手评比,估计2026年前半年也别想清静。
Q:如何看待BB别墅杯MVP的争议?
确实,sh1ro的实际数据更出色。当时我在现场宣布donk获得MVP时,他本人都露出难以置信的表情——他也认为sh1ro更配得上这个奖项。需要说明的是,当时我们尚未完善现有统计体系。当时的处理方式是将线上赛部分视为权重较低的小组赛阶段:虽然计入评估,但会乘以较小的系数。
Q:为什么w0nderful的Rating波动如此剧烈?2.0版本是1.10,2.1降至1.06,现在3.0又回升了?
2.1版本本质上是为紧急修复CS2转型期数据异常的临时方案。我们修正了保枪机制和CS2平均数据,但并未处理助攻等细节问题。25伤害助攻对步枪手加成就很夸张——你的KAST和impact数据会飙升。而当被动型狙击手的生存分数被削减后,他们的数据就显得特别难看。所以尽管经济局调整机制削弱了狙击手,但3.0版本对他们反而更友好,这点可能会让人感到困惑。
Q:你收到过哪些恶劣的回复或私信?
我现在反而开始享受这些了,简直娱乐性十足。一月份每天都有二十多个中国粉丝因为去年ZywOo仅获得TOP3的事找我理论,还有个法国哥们甚至建议我把法棍插进喉咙。最过分的是有人说我孩子该夭折,因为m0NESY是我爹。这种言论确实恶毒,但我永远记得它,因为实在太滑稽了。既然都要发死亡威胁,至少得有点创意吧。
Q:这些言论确实有伤大雅,关于Rating 3.0的未来发展,你计划重点修正哪些方面?
我想观察对狙击手的调整效果。基于对战胜率的计算逻辑让我有些担忧:究竟是因为AWP本身是容易操作的武器,还是因为顶尖选手都爱用狙击枪?这可能对狙击手不太公平,他们需要付出更多努力才能获得相同Rating。另外还需要监控平均数据,因为我们发布新版本时游戏正好变得更偏向CT方,而当前平均值是基于稍偏向T方的版本设定的。
至于4.0版本的构想,运用AI和比赛录像数据能做很多事,比如热力图击杀比、选手角色分析等。但HLTV的挑战在于我们使用日志文件而非录像数据。像Btrams这样的推特用户可以直接解析录像获取任何数据,而我们要想获取玩家坐标之类的新数据,就得先说服V社将其加入日志文件。
Q:副狙战术对Rating 3.0会产生什么影响?击败双狙配置的队伍是否会获得巨额Rating加成?
确实,击杀狙击手能获得更多积分。系统可不会区分你击杀的是拿AWP的HooXi还是ZywOo,但在回合影响力计算中,系统只参考队伍经济总值,它无法识别英雄AK47这类特殊情况,只会看你身上最贵的武器。所以即使你用的是Tec-9但背着AWP,系统在计算对战胜率时仍会判定你是狙击手。
相关阅读:
禁止灌水刷屏违者禁言3天,详情查看 >> 评论(14)
最新评论(14)