线上问题定位

  • 1.找出系统包含哪些部分
  • 2.找出各部分的边界
  • 3.找出各部分内部资源限制

线上问题也分很多种类型,
分硬件,软件
软件又分系统和应用
系统可能分物理机系统虚拟机系统docker容器等
应用可能分环境应用,业务服务应用,
以上各个环节和部分都可能会产生问题
而通常问题产生最多的地方一般是业务服务应用

首先我们需要从上到下,从整体到局部对系统有一定的了解,才能快速定位问题
那么对系统的了解有哪些呢
首先就是系统资源的掌握
cpu使用率,内存使用率,磁盘io,网络io,
接下来是docker容器级别的的各个资源,接下来是jvm的资源
再接下来是连接池等资源
线上问题通常也是资源不够用引起的

收集信息,看错误日志,流量变化曲线,看资源使用情况,如果都没问题可能需要看jvm等
针对jvm又是一大学问

关于线上问题定位,是可以总结出一系列的文章

results matching ""

    No results matching ""