快捷搜索:  汽车  科技

前端机房监控技术(前端监控系统之)

前端机房监控技术(前端监控系统之)(1)js 运行时报错为了更好地保证网站正常的运行,我们会通过window.onerror捕获,js具体的堆栈信息和错误行和列。一般我们的js都是打包压缩、混淆后上传到cdn的(无法定位到具体错误)。因此在打包时,同时生产.map文件,用sourcemap js库(nodejs)来还原具体错误信息。如下图(出自个人博客中的数据): 2、错误监控1、页面性能监控从前面我们了解到,网站的性能怎么样。不能单单是靠某种工具去检测,就能得出的结果。因为影响它的因素有很多(dns解析、网络、缓存...) 再者如果没有拿到实际用户访问的数据,去跟别人交谈,心里也是没有底气的。一般我们会通过浏览器的performance对象,来上报我们需要统计的数据和关键性能指标。一般统计的指标有以下: let timing = performance.timing // DNS 解析耗时 ti

相信前端开发的朋友们,都有类似的经历。项目上线后,突然有一天收到部门Boss的反馈消息。
Boss: 咦,小张呀!你看我们网站啊,有人反馈打开有点慢、打不开啊!你看下是怎么回事?
Me: 好的,我去查下原因。最后通过各种手段来检查,都没有发现什么问题(我这打开挺快的呀,cdn资源加载也正常、后端数据调用接口速度也ok...心想,应该是部分用户网络的原因造成的吧!)。然后屁颠、屁颠的跑去Boss办公室去汇报,Boss 我通过xx的手段,看了下。没啥问题呀!应该是部分用户网络造成的吧!

上述的例子,我想大家都肯定遇到过。那么有没有什么好的办法去解决呢?或者说从被动变为主动,第一时间掌握我们网站的健康情况。
想必有经验的朋友,肯定会说:这还不简单,上监控啊。可是具体怎么去搭建一个前端监控系统呢?别急,听我一一道来:

一、JS SDK 设计

首先我们来试想一下,我们做的这个前端监控系统,希望它能解决什么样的痛点:

前端机房监控技术(前端监控系统之)(1)

1、页面性能监控
从前面我们了解到,网站的性能怎么样。不能单单是靠某种工具去检测,就能得出的结果。因为影响它的因素有很多(dns解析、网络、缓存...) 再者如果没有拿到实际用户访问的数据,去跟别人交谈,心里也是没有底气的。


前端机房监控技术(前端监控系统之)(2)



一般我们会通过浏览器的performance对象,来上报我们需要统计的数据和关键性能指标。一般统计的指标有以下:

let timing = performance.timing // DNS 解析耗时 timing.domainLookupEnd - timing.domainLookupStart // TCP 连接耗时 timing.connectEnd - timing.connectStart // SSL 安全连接耗时 timing.connectEnd - timing.secureConnectionStart // 网络请求耗时 timing.responseStart - timing.requestStart // 数据传输耗时 timing.responseEnd - timing.responseStart // DOM 解析耗时 timing.domInteractive - timing.responseEnd // 资源加载耗时 timing.loadEventStart - timing.domContentLoadedEventEnd /* 关键性能指标 */ // 首包时间 timing.responseStart - timing.domainLookupStart // 首次渲染时间 / 白屏时间 timing.responseEnd - timing.navigationStart // 首次可交互时间 timing.domInteractive - timing.requestStart // HTML 加载完成时间, 即 DOM Ready 时间 timing.domContentLoadedEventEnd - timing.navigationStart // 页面完全加载时间 timing.loadEventStart - timing.navigationStart

Copy


2、错误监控

(1)js 运行时报错
为了更好地保证网站正常的运行,我们会通过window.onerror捕获,js具体的堆栈信息和错误行和列。一般我们的js都是打包压缩、混淆后上传到cdn的(无法定位到具体错误)。因此在打包时,同时生产.map文件,用sourcemap js库(nodejs)来还原具体错误信息。如下图(出自个人博客中的数据):

前端机房监控技术(前端监控系统之)(3)

有种情况 因为跨域的原因,浏览器捕获到的错误信息,很可能是“Script error.”,无法知道具体的错误行和列。因此面对此情况,可以在script标签添加crossorigin="anonymous" 属性,同时通过cdn开启cors跨域,即可解决。
(2)资源加载出错

为了防止加载资源失败,而导致网站打不开。一般我们会通过 window.addEventListener('error') 对资源加载进行监控。

3、后端api接口监控
一般对于小公司而言,可能连后端都很少会有接口方面的监控。一旦出现问题,却又不好排查问题,因此我们可以通过对浏览器底层的xhr对象进行拦截,上报相关调用数据和接口耗时。一方面可以检测到接口的实时调用情况,同时也方便后期对接口的数据统计。

前端机房监控技术(前端监控系统之)(4)

二、数据处理和展示

在设计完成sdk后,需要把数据进行统计分析和展示。因此我们用到 es(elasticsearch)来对数据进行实时查询和分析。可是怎么把数据推到es里面呢?这对于前端同学来说,这又是一个难点。别急,“logstash” 了解一下。logstash主要对数据进行采集、分析、过滤的工具,然后推送到es里面。数据既然有了,那么怎么展示呢?这时候 Kibana 出来了,来作为数据展示的承托。这就是后端开源届的日志分析系统“ELK”。

前端机房监控技术(前端监控系统之)(5)



其实对于数据的展示,可以不用kibana或者其他开源的产品进行展示,也可以自己通过es的restful接口,来搭建数据展示(如上图)。整体架构如下图:

前端机房监控技术(前端监控系统之)(6)

写在最后:本文只是阐述前端监控基本的一些理论方面的知识,没有涉及到具体实战环境。比如:sdk该如何设计、采用哪种方式上报比较好!数据处理部分应该注意那些点... 如果感兴趣的朋友,可以点击观看我的下篇文章“前端监控系统之实战篇”。

猜您喜欢: