r7000纯独显模式下长时间睡眠,或长时间关机后开机异常
本帖最后由 lenovo60861205 于 2021-2-23 21:30 编辑装上固态,开机后用任何方法点睡眠,等一小时,用任意方式唤醒,即可触发故障 原装硬盘+最新bios+NV 460.89测试一下 本帖最后由 lenovo60861205 于 2020-12-22 22:00 编辑
只加原厂硬盘的情况,在上一次咨询的时候,测试少数几次没有发现问题;但近期测试时,仍然出现异常。每种硬件组合的测试的数量也就大约7-8次,无法达成精确的统计。
bios已是最新。
460.89和460.97(据称解决了其他笔记本的睡眠问题)都试了,问题依旧。
睡眠出现问题大不了不用睡眠(反正这功能本来就容易触发bug),但关机再开机出现问题,就很影响使用体验了。
由于异常仅发生在启动时和睡眠唤醒的前几秒钟,而其他时候运行一切正常,混合显示模式下故障发生的概率低到可以接受;在启动Windows会故障的温度下,BIOS/PE下不加载驱动时没有发生问题,同样的温度下混合显示模式也没有问题,接在nvidia显卡上的外接显示器显示也正常不会花屏之类的。
从两种显卡模式的启动情况(屏幕亮度设置的变化和动画播放的过程)来看,amd和nvidia对这个内置屏幕的初始化的行为不太一样,这也可能是混合显卡模式没有出现问题的部分原因。
至于负责切换的MUX芯片,不知道会导致什么样的问题,但它的关系可能不大,因为大部分情况下问题都出在屏幕点亮而且显示内容正确的时候。
按下电源键后,会发生的事情有:(1)键盘背光点亮,过2-3秒钟后灭
(2)再过两秒钟屏幕上显示logo并慢慢变亮
(3)屏幕亮度接近最大时开始win10转圈圈第一部分,这个圈圈大概有60fps,转大约3圈-3圈半屏幕黑掉(win10快速启动关闭),这个地方n卡和a卡行为有差异,n卡是最后一帧定住0.3秒左右,然后屏幕变黑(背光亮度似乎不变,但这屏幕素质还不错,我不太看得出来背光究竟有没有关),进入下一阶段;a卡是最后一帧不定住或者定住比n卡更短的时间,然后屏幕黑掉背光灭掉,进入下一阶段
(4)win10转圈圈第二部分,这个圈圈看起来只有20-30fps,转1/3圈左右结束。这个地方,n卡(纯独显模式)下还是屏幕最大亮度,a卡(混合显卡模式)是跟开机时一样有个背光从暗到亮的过程。
(5)如果有密码则进入输入密码的界面,没有密码就出现 [欢迎] 了。
在阶段1-3过程中,如果没有按功能键进入BIOS,那么按键盘任何按键都是没反应的,包括大写锁定的灯。就跟win8时代的UEFI快速启动一样,跳过了部分硬件初始化。但是在操作系统加载前可以按部分按键进BIOS,我也不太清楚这究竟是什么样的行为。BIOS里我也没找到地方关闭它的快速启动,即使改成legacy support也一样。
开机时出现问题始终都在阶段3的最后半秒,这个时候按任何按键都没有反馈,从用户可交互的任何地方来看都是死机,也没有办法看出来是真死机还是假死。
上电后的时间与故障出现的时间无关(如果一开始机器已充分冷却)。即使我开启电源后进BIOS然后过一分钟(如果普通启动,已经过了触发故障的时间了)按Esc放弃修改并继续启动,故障还会在阶段3的最后出现。
根据微软的文档,阶段3是加载内核和枚举设备,(但阶段4的内容完全没有提,但我在很多电脑上都有看到),然后如果一切正常,其中最后半秒内u盘的灯也会从长亮(或不亮)到闪动,可能与初始化设备有关。因此简单推论这个故障是低温下部分设备初始化出现问题——联想到前面的蓝屏DPC_WATCHDOG_VIOLATION,出现问题的设备长时间没有响应导致蓝屏。
可惜我始终未能分析出是哪个设备出了问题。
也许使用其他的驱动程序可以解决问题,然而windows下只有厂商自己的驱动,这个机子的linux兼容性又一般,而且显卡驱动还是得装nvidia自己的(之前装Ubuntu也是长时间唤醒失败,近期也没有再去装一遍验证低温开关机的问题了,太费事了)。
在部分唤醒成功后卡住的情况下,我手快点进了资源管理器,所有的硬盘都在,故这个故障和硬盘的关系可能存在,但出现问题的,非常可能不是硬盘。
综上所述,我仍然认为这大概率是个驱动/固件层面上的bug,可能与芯片个体差异,电压/温度/频率曲线,或者低温下pcie通道的稳定性等有关。
目前来看我准备继续观望一段时间,看未来温度回升,以及更新的bios和驱动程序推出后能否解决问题。
继续更新情况:nv的461.09驱动自然也没有解决问题
目前考虑的一个方向还是,在显卡驱动不加载的情况下,就没有问题,至少开关机没有
最近在msconfig里找到了启动日志的选项
于是复现了一下问题,抓了个日志
在附件的第1228行,1 17 2021 11:30:07.500,是复现故障的启动
下面是第1365到1380行
BOOTLOG_LOADED \SystemRoot\System32\drivers\hidi2c.sys
BOOTLOG_LOADED \SystemRoot\System32\drivers\mshidkmdf.sys
BOOTLOG_LOADED \SystemRoot\System32\drivers\UsbHub3.sys
BOOTLOG_LOADED \SystemRoot\System32\drivers\mouhid.sys
BOOTLOG_LOADED \SystemRoot\System32\drivers\mouclass.sys
BOOTLOG_LOADED \SystemRoot\System32\drivers\MTConfig.sys
BOOTLOG_LOADED \SystemRoot\system32\drivers\nvhda64v.sys
BOOTLOG_LOADED \SystemRoot\system32\drivers\ksthunk.sys
BOOTLOG_LOADED \SystemRoot\system32\drivers\RTKVHD64.sys
BOOTLOG_LOADED \SystemRoot\System32\drivers\usbccgp.sys
BOOTLOG_LOADED \SystemRoot\System32\DriverStore\FileRepository\ibtusb.inf_amd64_8d188cefd348cd43\ibtusb.sys
BOOTLOG_LOADED \SystemRoot\System32\drivers\BTHUSB.sys
BOOTLOG_LOADED \SystemRoot\System32\drivers\usbaudio2.sys
BOOTLOG_LOADED \SystemRoot\System32\drivers\hidusb.sys
BOOTLOG_LOADED \SystemRoot\system32\drivers\WdmCompanionFilter.sys
BOOTLOG_LOADED \SystemRoot\System32\Drivers\usbvideo.sys
最后一行到usbvideo.sys停止
从搜索结果来看是与摄像头有关的驱动
在其他正常的启动中,接下来加载的驱动是usbaudio2.sys(usb声卡,但是,拔掉该声卡时故障依旧),kbdhid.sys(键盘过滤器),和monitor.sys(显示器),都是微软自家的组件
usb声卡因为能拔掉,自然我也试过拔掉了,没有用
显示器和键盘我可拔不掉
结合故障现象:“卡住时屏幕不动,键盘无响应”,且正常启动时,在该加载阶段系统未接管键盘,在卡住大约0.2秒之后内置显示器重置,外置显示器点亮来看,键盘显示器都有可能是原因
至于文件损坏的问题,我也考虑了,然而这3个文件(usbaudio2,kbdhid,monitor)都没有我能看到的数字签名,我也不知道有什么办法能直接证明其完整性
但是sfc /scannow和dism /online /cleanup-image /scanhealth都表示没有问题
再说重装系统也没有解决问题,镜像我都校验过了
msconfig里的OS启动信息也许会有用,但是,win10里勾选了没显示什么信息,还是转圈圈进桌面,一行字都没见着
我也试了启动阶段的内核调试,这个文档太难读了,最终也没搞成功
刚才又想到,amd的显卡会在windows加载第一阶段结束后重置显示器,至少我看到背光灭了
但nv的显卡不会
这个会不会是显卡BIOS或者UEFI GOP之类的问题? 几天前把BIOS更新到了EUCN31WW,在经过测试后发现问题似乎解决了。
开机速度和睡眠唤醒速度也比之前有所改善。
不过近期气温较高,不排除是由于机器无法冷却到会发生问题的温度而表现为没有故障的可能性。
以下是最后使用的硬件和驱动版本,供未来的读者参考:
4600h+1650+8gx2海力士(原厂)+512g镁光(原厂,安装在原厂默认安装的位置)+1T SN550闪迪版(自购,安装在出厂时空闲插槽)
amd显卡驱动是联想的27.20.11028.5001(2021年1月19日),虽然后来改回独显直连故实际上没起作用
nvidia驱动是公版461.40 DCH
系统是1909 我是r9000p,也加装了sn550,一样出现了长时间休眠或者长时间关机后开机卡住蓝屏的问题,蓝屏代码一致,问下你研究了这么久有没有什么比较好的建议能给到我,谢谢 我也有和你类似的问题,你说的低温导致故障的思路很有意思。
我的BIOS已更新到31WW,仍然频繁观察到睡眠状态下自动重启,正在测试切换到独显直连是否有效。
我的机器在低温时曾经出现过CPU频率锁死2.X GHZ 以及直接关机。但我之前以为低温关机是电池的正常表现,没想到过与睡眠异常可能有关。
很详细的记录贴,看上去31版本的bios会更稳定一点?
页:
[1]