华为超聚变2288H V5 服务器安装Windows系统后 PCI数据捕获和信号处理控制器
2288H v5服务器安装Windows系统后,PCI数据捕获和信号处理控制器 出现感叹号解决方案:
1、可以在IBMC界面的“诊断-黑匣子” 关闭黑匣子功能,然后重启设备
2、可以在操作系统侧安装IBMA软件
软件下载链接:https://support.xfusion.com/support/#/zh/server-management-software/ibma-pid-21099187/software
安装手册:https://support.xfusion.com/support/#/zh/server-management-software/ibma-pid-21099187/document
上述任意操作后问题解决:
注意:iBMA安装时需要完全解压,不能在压缩包内执行,否则出现“版本10.0.x.xxx不支持”。
iBMA可以支持服务器CPU、内存、硬盘、网卡、IB卡、PCIe、RAID卡、光模块等各个组件的状态监控、性能监控、事件监控。
iBMA同时提供了黑匣子功能,开启黑匣子功能后,能记录系统发生异常宕机时的状态信息和调试信息,可以辅助异常定位。iBMA提供了事件上报功能,iBMA周期性检测物理盘、逻辑盘、RAID控制器等状态变化事件,有事件变化情况下通过Redfish事件订阅接口上报事件信息到上层管理软件。
用户在系统上安装iBMA软件后,iBMA提供的主要功能如表示。
功能
介绍
系统信息获取
将操作系统、网卡、IB卡、硬盘、RAID卡等信息提供给iBMC。
文件上传
支持esight和其它工具通过iBMC的Redfish接口将文件上传至iBMA运行的服务器,详细请参考服务器 iBMC Redfish 接口说明。
驱动升级
支持eSight和其他工具通过iBMC的Redfish接口进行驱动升级,详细请参考服务器 iBMC Redfish 接口说明。
说明
l 进行驱动升级前需中断业务。
l 升级过程中不允许对系统进行下电、复位等操作。
系统状态监控
定时监控系统信息和健康状态的变化情况,用于上报给iBMC进行告警。
软件管理
支持FusionDirector和其他工具通过iBMC的Redfish接口进行软件的查询、安装、升级操作。
BOB
l BOB是一个帮助带内网络远端主机通过带内组网与本机iBMC进行通信的转发工具。包括服务连接,如SSH、IPMI、HTTPS等;事件上报,如SNMP Trap等。
l BOB支持服务管理(启动/停止/重启),不支持独立部署和工作。
l BOB提供了一个命令行bobCmd,用于启动/停止/重启BOB服务以及其他相关配置,转发配置支持在线配置,无需重启服务。配置支持持久化,即重启系统后不会丢失。
iBMC事件转储
Linux/Windows系统上支持将iBMC事件转储至系统日志文件中。
说明
对于版本号为Vxxx格式的iBMC,需要配套V294及以上版本;对于版本号为x.xx.xx.xx格式的iBMC,需要配套3.01.00.00及以上版本。
Redfish服务兼容HTTPS协议
Redfish服务支持以HTTPS或HTTP协议启动。
说明
l 对于版本号为Vxxx格式的iBMC,需要配套V316及以上版本,如果是V316之前版本,配置成以HTTPS协议启动Redfish服务,则无法与iBMC通信;对于版本号为x.xx.xx.xx格式的iBMC,需要配套3.01.00.00及以上版本。
l iBMA支持HTTP和HTTPS两种协议,HTTP协议明文传输,安全性较差;HTTPS协议密文传输,安全性较高。
网卡配置追溯
Linux系统支持周期性记录网卡配置信息。
说明
在Linux系统下,iBMA会定时收集网卡的ethtool最新配置信息,文件存储在iBMA安装目录的log/ethtool_log目录下,可以使用FusionServer Tools在收集操作系统日志时一并收集。
网卡故障检测
l Linux系统支持Mellanox网卡的internal error检测,并记录在iBMA安装目录的log/common.log日志中。
说明
需配套Mellanox网卡4.2及之后的驱动版本。
l VMware系统支持检测网口状态短时间变化事件并上报更新给iBMC。
存储诊断
定时监控硬盘IO性能降低、硬盘Sense Code错误和文件系统只读的存储诊断信息并上报给iBMC。支持RAID卡下硬盘日志的收集,用于硬盘耗损分析。
说明
l 硬盘IO性能降低和文件系统只读检测只支持Linux系统。
l 硬盘Sense Code错误检测支持Linux系统、ESXi 6.5及以上版本。
内存隔离
支持对操作系统出现故障的物理内存页,通过Redfish接口进行软隔离操作。
说明
l FusionServer服务器上iBMA支持内存隔离的操作系统为:Redhat 7.3、Redhat 7.4、Redhat 7.5、Redhat 7.6 、CentOS 7.3、CentOS 7.4、CentOS 7.5、CentOS 7.6、CentOS 7.7、CentOS 7.8、CentOS 7.9、CentOS 8.0、CentOS 8.1、CentOS 8.2、CentOS 8.3、EulerOS 2.0 SP3、EulerOS 2.0 SP5和EulerOS 2.0 SP9系统。
iBMC通过iBMA的RESTful接口可实现服务器系统信息的查询功能,如表所示。
组件
描述
操作系统
查询OS的基本信息,包括主机名称、描述、OS的版本(主版本、子版本及补丁主版本及子版本)、内核版本、厂商、系统时间等。
CPU
查询CPU的基本信息,包括系统CPU占用率及CPU的个数,型号,单个CPU占用率等CPU信息。
GPU
查询GPU的基本信息,包括GPU利用率和GPU内存使用率。
NPU
查询NPU的基本信息,包括内存资源使用率、HBM资源使用率、内存带宽资源使用率、HBM带宽资源使用率、AiCore资源使用率、AiCpu资源使用率、CtrlCpu资源使用率。
内存
查询内存基本信息,包括查询系统的内存大小及占用率。
网口
查询网卡个数、规格速率、Link状态、OAM状态、双工模式、固件版本、驱动名、网卡驱动版本、槽位信息、PCI-E设备号、功能号、网口名、网口IP、掩码、网关、MAC地址、VLAN信息、收发包统计等,同时支持系统VLAN、Team及Bridge信息的查询。
查询物理网口的速率,当前占用率。
IB卡
查询IB卡个数、芯片型号、固件版本、驱动名、驱动版本、槽位信息、PCI-E设备号、UUID、网口类型、设备类型、功能号的全球唯一标识、全球唯一标识、默认gid、端口lid、SM lid、选路掩码、端口类型、能力地图、网口名、网口IP、掩码、网关、MAC地址、规格速率、Link状态、双工模式、自协商模式、MTU大小等信息。
说明
只支持Linux系统。
硬盘
查询物理硬盘个数、厂商、类型、固件版本、序列号、容量、转速、接口速率、物理槽位、硬盘丝印等信息查询。
查询物理硬盘状态(ONLINE/OFFLINE)、温度、运行时长、巡检状态、重构状态/进度、SMART信息等。
查询系统下逻辑盘的容量,已使用大小,使用率等信息。
RAID
支持主流RAID卡,支持服务器有多RAID卡场景。
查询RAID卡个数、控制器型号、固件版本、驱动版本、槽位信息、条带深度、Memory大小、ECC计数等。
查询RAID电池健康状态、电池类型、名称、序列号、额定容量、电压、当前容量、电压、充放电次数、温度等信息。
查询RAID逻辑盘的RAID级别信息、正常/降级/离线状态,获取RAID组配置状态,获取RAID组中的硬盘物理槽位信息,获取操作系统盘符与RAID组的关系、支持RAID组条带宽度、访问策略、读写策略、逻辑盘Cache状态及是否为启动盘等信息。
查询RAID卡链路误码,硬盘背板链路误码。
FC/FCoE
支持FC/FCoE卡的厂家、型号、固件版本、驱动版本、槽位信息、WWN、FC_ID、链路状态及端口信息的查询。
iSCSI
支持iSCSI的厂家、型号、固件版本、驱动版本、槽位信息、链路状态、端口数量及配置信息的查询。
NVMe
支持NVMe磁盘的厂家、型号、序列号、槽位信息、固件版本、驱动版本、硬盘状态、接口类型、介质类型、容量、最大速率、协商速率、SMART等信息的查询。
光模块
支持光模块基本信息显示。包括如下信息:厂家名称、厂家部件号、序列号、生产日期、光模块类型(10GBASE_SR)、波长、多模/单模,温度,电压,功耗的门限。
支持光模块诊断包括:光模块Los检测、温度、电压和功耗超过门限的检测。
支持光模块匹配检测(类型匹配和速率匹配):iBMA上报光模块类型和速率。
说明
只支持Linux系统。
OAM链路检测
刀片服务器OAM(802.3ah)检测,支持OAM链路故障检测,包括链路状态检测(误码越限、误帧越限或者误帧秒越限)。
说明
只支持Linux系统,配合E9000交换单板。
来源:https://www.cnblogs.com/88223100/p/2288H_v5_PCI_ERROR.html
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!
页:
[1]