|
|
|
|
移动端

菜鸟学分析:通过数据分析发现服务器性能问题

在最近导入大量新用户后,留存发生了突然的下降,还好最近没有什么更新动作,所以能比较明确的感觉到留存可能跟量有比较大的影响。

作者:悟空来源:GameRes游资网|2018-06-13 09:39

技术沙龙 | 6月30日与多位专家探讨技术高速发展下如何应对运维新挑战!


 一、发现问题

问题背景:在最近导入大量新用户后,留存发生了突然的下降,还好最近没有什么更新动作,所以能比较明确的感觉到留存可能跟量有比较大的影响。

拿出注册人数与留存的曲线图,很明显的反比曲线。

菜鸟学分析-通过数据分析发现服务器性能问题 ...

同时也用EXCEL做出两者之间的相关系数:

相关系数:-0.875713539399122 (-1为百分之百负相关)

无论是从直觉还是从数字意义上都可以证明注册人数与留存关系是存在着明显的反比关系的。

菜鸟学分析-通过数据分析发现服务器性能问题 ...

二、排查原因

首先从游戏设计以及流程来寻找问题

正如我之前所说是留存下降前没有更新任何东西的,所以游戏配置,新手流程啥啥的这些策划都有检查过无修改,好,那暂且相信他们,并且注册用户与留存的反比关系实在太明显了,我们决定主要还是从玩家行为这块来。

确定从注册玩家行为来寻找问题这个方向

从源头开始,首先怀疑的是渠道用户质量的问题,因为之前也出现过渠道将位置放在了首屏-一键安装,然后留存下降的现象。通过分渠道查看留存下降,发现没上量的渠道留存也下降了。

排除掉渠道上大量导致留存下降这个原因,或者说这个原因并非是主要原因。

寻找注册玩家具体流失行为(溯源法)

这一次运气比较好,一开始就发现了 注册无效用户有增多。并且呢。并且通过计算无效用户留存,这部分无效用户正好可以补上留存的缺口。DONE!问题找到!

注册无效用户定义:玩家有登录或者注册表有存在,但是在服务端没有任何行为。

找到原因

当注册玩家增多的时候,无效用户会增多,无效用户增多,留存会下降。(如下图)

菜鸟学分析-通过数据分析发现服务器性能问题 ...

三、沟通找到根本原因

主要找前后端的技术沟通了一下,服务端表示:这个数据很明显了,可能当注册人数某个值的时候,影响到了服务器的性能,如果能提供分时段的最高在线人数,注册人数,该时段的注册无效用户率。就可以排查一些原因,以便技术更加方便的找到问题。OK~ 拿出数据。

然后技术排查代码找到原因:当注册用户进入服务器的时候,在拿注册用户数据的时候进行了一个不该有的聚合运算,导致假如注册人数过多,则服务器性能会很差,会影响到注册玩家体验,删除这段代码后,服务器CPU利用率从60%下降到了20%。

四、解决并验收

直接看图吧,无效用户很明显下降了,留存也提升了~

【编辑推荐】

  1. 数据中心管理:DMaaS提供了哪些DCIM所不具备的功能?
  2. 使用云服务器的7条安全提示
  3. 如何通过反向 SSH 隧道访问 NAT 后面的 Linux 服务器
  4. 一文看懂2018云计算八大数据!
  5. 6G技术来临,网络供应商要重新设计数据服务器吗?
【责任编辑:武晓燕 TEL:(010)68476606】


点赞 0
分享:
大家都在看
猜你喜欢
24H热文
一周话题
本月最赞

视频课程+更多

热门职位+更多

读 书 +更多

Ajax经典案例开发大全

针对Ajax技术的日益流行,本书对Ajax技术的典型应用进行了归纳总结,基本上覆盖了Ajax技术应用的典型场景。书中共有45个实例,分为9章:动...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊