当前位置: 首页 > 网游 > 绝地求生

吃鸡或者吃蛋糕?——集齐勋章!走上巅峰!

来源:网络 时间:2022-08-09 04:15:14
导读通过这个数据集,本萌妹将从玩家个体和小队的角度,分两个方面给大家介绍我们的发现。

点击上方蓝色字体,关注我们

好久不见!本萌妹又回来给大家讲吃鸡啦上次推文链接请戳这里~!光阴似箭,日月如梭,在本萌妹离开的这段时间里,腾讯最新吃鸡游戏《和平精英》正式过审,而《刺激战场》的测试则在5月8日突然迎来了永久停服。腾讯的新版吃鸡游戏和原版换汤不换药,游戏玩法完全一致,但是《和平精英》淡化了竞争概念,枪击不再见血,玩家死亡之后挥手离开,而每局游戏的冠军将会获得一个蛋糕。

游戏版号一拿到,就意味着腾讯吃鸡游戏(或者应该叫吃蛋糕游戏啦)正式进入了氪金时代。大家准备好自己的钞能力了吗?在日后的吃鸡游戏中,大家很有可能面临着你用步枪,而氪金大佬使用导弹的情况。如何在这样的情况下勇猛吃鸡呢?

吃鸡这个词大家都比较熟悉了,它是指以《绝地求生》为代表的一系列竞技类型的游戏,每一局游戏将有100名玩家参与,他们将被运送到绝地岛的上空,游戏开始所有人都一无所有,玩家赤手空拳地分布在岛屿的各个角落,利用岛上多样的武器与道具。随着时间的流逝,岛上的安全地带越来越小,安全区还会发生爆炸ヽ(。>д<)p。如果玩家在游戏中途死亡,会在死亡的原地留下一个装备箱子,里面包含了玩家死亡前获得的装备,这些装备可以被其他玩家再次获得。这也就是大家平时所说的成盒。而落地成盒则是指开局不久,刚刚落地时就因为种种原因死亡。游戏进行到最后,玩家在遭遇战和毒圈中不断死亡,最终只有一人或者一队获得胜利,也就是大家平时说的吃鸡

在这次的分析中,本萌妹同样在kaggle上找到了一个叫PUBG Finish Placement Prediction的数据集。实际上,这个数据集是一个PUBG排名预测竞赛,包括了6万多场比赛中所有玩家的赛后信息,每一条数据都是一名玩家在一场吃鸡游戏里面的统计数据,而竞赛的内容是预测玩家的最终排名。数据集的具体变量描述见下图所示。

通过这个数据集,本萌妹将从玩家个体和小队的角度,分两个方面给大家介绍我们的发现。分别是①吃鸡玩家颁奖典礼——从个体角度分析玩家特征;②如何走上人生巅峰?——通过玩家行为,对玩家最终的排名进行预测。

另外,需要声明的是,虽然所有数据集都是来自《绝地求生(PUBG)》的数据,但在分析时,我们借鉴了《绝地求生》、《全军出击》、《绝地求生:刺激战场》和《荒野行动》等同类型游戏中的概念。(这么多游戏谁能分得清楚啊摔 (`Д´*)9

吃鸡玩家颁奖典礼

女士们!先生们!欢迎收看本期的吃鸡玩家颁奖典礼!雄关漫道真如铁,而今迈步从头越。在PUBG游戏里,各位狂暴战士仓箱可期,丰收高产;各位快递员离奇自杀,花样作死;各位伏地魔宁死不屈,一心求苟。就在今天!我们要为各位吃鸡玩家将会走上领奖台,领取自己命中注定要获得的容易勋章。接下来,就是各位玩家的高亮时刻!

击杀勋章——击倒数和击杀数

首先,我们可以先分析下跟游戏结果最息息相关的变量,击倒数和杀人数。分别画出击倒与击杀数与归一化排名相关的箱线图,可以发现,随着击倒数和击杀数的增多,排名也相应得逐渐升高。这与我们的一般认知相同,杀人越多,说明玩家水平越高,也越容易获得更高的名次。

而画面最右上角,本萌妹框起来的位置,杀人数超过了十个,是吃鸡的种子选手。这些玩家让本萌妹忍不住想给他们发刚枪王的勋章啊!而方框的上半部分,杀人多又吃到了鸡的玩家,暴走鸡神的勋章非你们莫属了!

治疗勋章——治疗量

接下来,我们分析以下玩家在一局游戏中使用功能饮料和急救包的数量,用玩家排名做纵坐标,画出折线图,其中蓝色折线代表能量饮料,红色折线代表急救包。可以发现,大体趋势上,随着排名的升高,使用消耗品的数量也会增多。这是因为排名高的玩家存活时间较长,所以需要消耗品的量也会随之增大。

从上面的图中,我们可以看出,一局使用急救包最多的玩家用了超过8个!可以想象,这些玩家是怎样出入毒圈、怎样枪林弹雨、怎样遇到种种生命危险的,简直让人想给他们高歌一曲。正是他们的视死如归,才使他们最终获得了前20%的优异成绩!再次鼓掌!他们获得的是医疗兵勋章!

行走勋章——行走距离

接着,我们将玩家的行走距离和相应玩家数的对数画出直方图,可以发现,基本所有玩家的行走距离都在8000米内即一个地图的长度,但是图片下方框出来的位置,仍有少量玩家的行走距离超过8000米。把整个地图的长度都走完了,不禁想知道这些人是经历了什么样的天谴圈…话不多说,长跑运动员勋章就颁给你们了!

综合素质勋章——整体表现

接下来,我们去掉玩家的最终排名,对玩家的其他行为属性进行聚类,在忽略名次的情况下,单纯看看大家的整体表现如何。我们将所有属性进行归一化后,采用k-means聚类算法,将玩家聚成3类。选取典型特征计算簇均值,画出雷达图。

从图中可以看出,最外圈玩家的杀人数、行走距离、总伤害、治疗、击倒和助攻数都是最强的,相应地,对应的玩家实力也最强,本萌妹在这里称呼他们为大佬玩家

中间一圈的玩家只有行走距离助攻数治疗数比较突出,但是总伤害杀人数都比较差,是比上一类玩家要差,但是仍然有贡献的选手类型。对于这些选手,本萌妹称之为一般玩家

最内圈玩家整体实力都比较差,唯一突出的变量就是助攻数,也就是最强选手钢枪的时候在旁边跟着突突的选手,从他们的行走距离和伤害也可以看出,这批玩家把好端端的吃鸡完成了跳伞模拟器(是说跳完伞就结束了本局游戏的我本人了)。我们把他们称为菜鸡玩家

团队勋章——组内表现

最后,我们来看看这三类选手在比赛中分别获得了怎样的名次吧。我们将玩家按照最终排名进行划分,分为小组排名前10%、小组排名10%-50%、小组排名后50%三类,并分析三组中分别属于大佬玩家、一般玩家、菜鸡玩家的组员。可以发现,在排名最高的组中,大部分组员属于大佬玩家少部分属于一般玩家只有极少的玩家属于菜鸡玩家这些玩家也就是被带赢的啦。

作为一只长期躺鸡萌妹获得者,我要隆重介绍本场颁奖典礼的最后一对奖项——带妹吃鸡和躺鸡萌妹勋章,分别授予小组排名前10%中的最强选手和最弱选手!

如何走上人生巅峰?

我们要做什么?——问题分析

在这部分,本萌妹就带领大家来看一看,如何根据玩家的局内表现来预测玩家的最终名次。在本次竞赛中,我们的最终名次使用的是归一化排名(在变量里面叫做winPlacePerc),简单来说,就是把第一名设成1,最后一名设成0,其余名次均匀分布在0和1之间。竞赛使用平均绝对误差MAE评价预测结果。

本萌妹觉得这是一个具有一定特殊性的回归问题。绝地求生是个团队游戏,解决这个回归问题从团队角度出发是更为合适的。游戏的参赛队伍可能为20到100不等,并且一个队伍中的所有人的最终排名是一致的。因此我们可以将团队中的不同玩家视角进行统计,最终通过团队视角来预测团队的最终名次。

来提取特征吧!——特征工程

在特征工程部分,本萌妹做了下面这些处理:

1.对于超过99%的数据都为0的属性,直接删除;

2.添加组合属性:总移动距离 = 步行距离 + 载具距离 + 游泳距离,爆头率 = 爆头击杀 / 总击杀;

3.将比赛持续时间转化为地图类型0-1变量;

4.将所有数据按照matchId(游戏ID)和groupId(小队ID)进行分组。对于每一个组,计算每一个变量的平均值、最大值和最小值以及中位数,同时计算每个小组平均值、最大值、最小值以及中位数在一场比赛中的排名;

5.将matchType处理为哑变量。

通过上述操作,我们一共得到147个属性。

通过随机森林回归和XGBoost回归,本萌妹得到了各个变量在模型中的重要性,然后分别取两个模型的重要性程度前20的变量取并集,得到最后的变量列表,其中变量的顺序是按照重要性程度进行排序的:

从重要性程度表中可以看出,移动距离和击杀数是两个最为关键的属性,并且两者的排名而非绝对数量左右着一个小队的排名。下图分别为XGBoost回归得出的变量重要性top20。

调包大法好!——模型选择

本萌妹在模型选择上进行了一些尝试:

1.线性回归在该问题的解决上表现不好,故采用树模型进行回归;

2.使用未进行任何调参的随机森林回归、XGBoost回归、GradientBoosting回归、AdaBoost回归、LGBM回归对数据集进行训练,其中AdaBoost效果过差所以不展示其结果。

从上表3-2可以看出XGBoost回归、GradientBoosting回归和LGBM回归的效果相对较好。但考虑到训练时间问题,最后我们选择了LGBM进行kernel提交。

黎明之前!——回归结果处理

在获得回归结果之后,本萌妹对结果还进行了后续处理,来降低预测的误差。具体包括:

1.将所有预测值调整到0-1之间;

2.调整边界情况:将maxPlace属性为0的玩家的预测值置为0,将该属性为1的玩家的预测值置为1,因为maxPlace是一场比赛中玩家可能的最差排名;

3. 游戏的参赛队伍可能为20到100不等,并且一个队伍中的所有人的最终排名是一致的。所以,小队归一化排名(winPlacePerc)从一场比赛的角度来看是一系列的离散值只不过间隔比较小。也就是说,如果一局比赛只有26支队伍参加,那么对应名次应该就是1、0.96、0.92、0.88…而不可能出现0.96和1之间的取值。这个间隔我们称其为gap对于每场比赛,通过比赛中的队伍数,计算这场比赛对应的gap,并以此计算出这场比赛中winPlacePerc能够取得所有可能值。最后,我们可以将回归结果调整到与其最近的离散值上。

最终,不同模型的MAE分别如下图所示。

我们获得了什么?——结论分析

得到结果后,本萌妹来带领大家分析一下这次我们能获得什么结论吧!

首先,从最后的回归结果不难看出,以上的几种模型得到的绝对平均误差均在3%左右,可以说是非常的低。但是如果从游戏本身的角度出发,这样的回归结果则恰好说明了绝地求生这款游戏的获胜机制是相对固定的,也就是说,玩家排名的决定性因素在不同对局中变数不大。

因此,那些在回归模型中重要性比较高的属性,也就相当于是每场比赛中能否获胜的决定性因素。我们回顾下在上文的特征工程中重要性比较高的变量。其中重要性最高的三个变量分别是:小队中击杀数最高的玩家的击杀数排名,这相当于小队中的击杀数的排名的上限,也就是小队的长板;小队中击杀数最低的玩家的击杀数,这相当于小队中的击杀数的排名的下限,也就是小队的短板;小队中最长的步行距离在整局游戏中的排名,这相当于是小队的步行距离长板。

分析到这里,结论已经十分明显啦。绝地求生是一款团队游戏,一个团队中的长板和短板成了决定是否能吃鸡的决定性因素。首先,队伍中的长板确实可以大大提高全队水平,就算队伍的其他人都祭天了,大神们往往也可以苟到吃鸡。在吃鸡的战场上,三个臭皮匠可赛不过诸葛亮。其次,有大佬带飞固然重要,但是也不要出现只知道躺好的队友,这样的人也是很影响队伍整体水平的。虽然躺鸡一时爽,一直躺鸡一直爽,但是本萌妹觉得,要想提高吃鸡频率,好好提升自己的实力,让自己不要成为队伍的短板也是非常有必要的呢。

在这里,本萌妹也想跟大家讨论一下本次数据比赛本身存在的问题。首先,吃鸡称号本身就是存活到最后的小队获得的,因此吃鸡的队伍一定是存活时间最长的。而从实验结果中,我们可以看出,和游戏最终排名最相关的属性,例如杀人数、全局移动距离等,在实际上是会受到存活时间的影响的。玩家的存活时间长,意味着排名高,而在较长的存活时间内,这些玩家的杀人数或者移动距离就会排名靠前。这说明,移动距离和杀人数这些变量是和最终排名有逻辑关系的,但是这个关系并不绝对实际上,我们也发现数据中存在很多队伍杀人很多,但是最后排名并不理想的case。我们把跑动距离和杀人数作为了衡量指标,一方面是为了获得更精确的预测结果,另一方面也想看看除了这些大家认为理所应当的数据之外,还有哪些变量会影响游戏排名。因此,我们在分析结论时,重点放在了队伍协作上,这些结论的得出比单纯分析移动距离和杀人数更加有意义。

说了这么多,想必大家对整个游戏的了解也更加清楚了吧。下次在军事演习中,记得实践我们的结论,让自己走上人生巅峰呀!希望看到这篇推送的大家,都能大吉大利,今晚吃鸡!

小组:平底锅炖鸡

小组成员:徐佳杭 赵桂越 罗文棋 黄烨翀 佟文畅

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:704559159@qq.com

Top
加盟网