翼度科技»论坛 编程开发 .net 查看内容

聊一聊 tcp/ip 在.NET故障分析的重要性

9

主题

9

帖子

27

积分

新手上路

Rank: 1

积分
27
一:背景

1. 讲故事

这段时间分析了几个和网络故障有关的.NET程序之后,真的越来越体会到计算机基础课的重要,比如 计算机网络 课,如果没有对 tcpip协议 的深刻理解,解决这些问题真的很难,因为你只能在高层做黑盒测试,你无法看到 tcp 层面的握手和psh通讯。
这篇我们通过两个小例子来理解一下 tcp 协议在故障分析中的作用。
二:tcp协议的两个小例子

1. 程序突然大量超时

这个故事起源于一位朋友遇到的问题:
起初程序跑的一直都是好好的,但会有偶发性突然无法访问,奇怪的是在故障时手工访问域名时又是正常的,后面又莫名奇怪的好了,请问这是怎么回事?
这种问题朋友虽然抓了dump,但在dump中寻找问题很难,因为大概率是在 http 通讯中出了问题,需要用类似 wireshark 去做流量监控,最后发现的原因是代理服务器偶发的抽风,导致 C# 的 HttpClient 无法访问。
为了方便演示,这里用一段简单的测试代码。

  • WebAPI 代码
创建一个 WebApi 骨架代码,然后部署 Windows 虚拟机上。
  1.         [HttpGet]
  2.         public IEnumerable<WeatherForecast> Get()
  3.         {
  4.             return Enumerable.Range(1, 5).Select(index => new WeatherForecast
  5.             {
  6.                 Date = DateTime.Now.AddDays(index),
  7.                 TemperatureC = Random.Shared.Next(-20, 55),
  8.                 Summary = Summaries[Random.Shared.Next(Summaries.Length)]
  9.             })
  10.             .ToArray();
  11.         }
复制代码
并且在 appsetttings.json 中配置对外端口为 80。
  1. {
  2.   "Logging": {
  3.     "LogLevel": {
  4.       "Default": "Information",
  5.       "Microsoft.AspNetCore": "Warning"
  6.     }
  7.   },
  8.   "Kestrel": {
  9.     "Endpoints": {
  10.       "Http": {
  11.         "Url": "http://0.0.0.0:80"
  12.       }
  13.     }
  14.   }
  15. }
复制代码

  • Client 的 HttpClient
这里面我用 hosts 做了虚拟机 192.168.25.133 myproxy.com 的映射,然后通过域名的方式访问。
  1.     internal class Program
  2.     {
  3.         public static HttpClient client = new HttpClient(new HttpClientHandler()
  4.         {
  5.             Proxy = new WebProxy("http://myproxy.com")
  6.         });
  7.         static async Task Main(string[] args)
  8.         {
  9.             for (int i = 0; i < 100000; i++)
  10.             {
  11.                 try
  12.                 {
  13.                     // 发送 GET 请求
  14.                     HttpResponseMessage response = await client.GetAsync("http://youtube.com/WeatherForecast");
  15.                     // 检查响应状态码
  16.                     response.EnsureSuccessStatusCode();
  17.                     // 读取响应内容
  18.                     string responseBody = await response.Content.ReadAsStringAsync();
  19.                     // 输出响应内容
  20.                     Console.WriteLine(responseBody);
  21.                     await Task.Delay(1000);
  22.                 }
  23.                 catch (HttpRequestException e)
  24.                 {
  25.                     Console.WriteLine($"{DateTime.Now} HTTP 请求异常:{e.Message} {e.GetType().Name}");
  26.                 }
  27.             }
  28.         }
  29.     }
复制代码
打开 wireshark 进行流量监听,将程序运行起来,发现一切都是那么太平,截图如下:

由于某些原因,代理服务器出了问题,这里用 关闭的方式来模拟,再次观察 wireshark 可以发现,没有收到服务器对154号包的响应,client 这边根据 RTO=1s 进行重试。

2. DNS解析到的IP无法访问

有些朋友程序出现了卡死,原因在于设置了很长的 Timeout,这种 Timeout 挺有意思,域名能够通过 DNS 解析到 IP,但 IP 无法被访问到,导致 client 这边在不断的重试,直到 timeout 的时限到时抛出异常。
接下来还是用 HttpClient 做一个小例子,直接访问 youtube.com ,参考如下代码:
  1. static async Task Main(string[] args)
  2.         {
  3.             HttpClient client = new HttpClient();
  4.             for (int i = 0; i < 100000; i++)
  5.             {
  6.                 try
  7.                 {
  8.                     // 发送 GET 请求
  9.                     HttpResponseMessage response = await client.GetAsync("http://youtube.com");
  10.                     // 检查响应状态码
  11.                     response.EnsureSuccessStatusCode();
  12.                     // 读取响应内容
  13.                     string responseBody = await response.Content.ReadAsStringAsync();
  14.                     // 输出响应内容
  15.                     Console.WriteLine(responseBody);
  16.                     await Task.Delay(1000);
  17.                 }
  18.                 catch (HttpRequestException e)
  19.                 {
  20.                     Console.WriteLine($"{DateTime.Now} HTTP 请求异常:{e.Message} {e.GetType().Name}");
  21.                 }
  22.             }
  23.         }
复制代码
打开 wireshark 启动监控,然后将程序运行起来,截图如下:

从卦中可以看到 client 发起了一个 DNS 查询,DNS服务器查询到 youtube.com 所对应的 IP 是 104.244.46.85,接下来应该就是 client 对这个 ip 发起 握手请求,截图如下:

从图中信息看,真的很尬尴,有如下两点信息:

  • client 发起了 SYN 请求,结果没人鸟它,没人鸟主要是因为路径上的防火墙把这个 SYN ACK 给没收了。
  • client 端按照 1s,2s,4s,8s 的RTO计时器超时进行重试,直到 HttpClient 等不及抛 TimeoutException 异常。
三:总结

人是活在错综复杂的关系网里,同样程序也是,要想解决更多的.NET程序故障,对 tcp/ip 体系知识的了解也同样必不可少。

来源:https://www.cnblogs.com/huangxincheng/archive/2023/11/07/17815469.html
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

举报 回复 使用道具