C-Korey 发表于 2018-1-25 09:54:43

连续开机半年死机,STM32F030使用内部晶体,现在冬天出现...

本帖最后由 C-Korey 于 2018-1-25 10:01 编辑

STM32F030使用内部晶体,开机半年,现在冬天出现死机状态使用STM32F030做了一个室外机的内部的电源电压读取部分的一个小模块,使用内部振荡器产生时钟,未使用外部晶体。现在有几百个产品在吉林省使用,目前出现了三十四个设备无法与单片机STM32F030通讯,读不到单片机信息。出现死机状态。
STM32F030单片机编程时使用了两种保护:
1.独立看门狗
2.当进入异常中断时会进行软件复位重启。
但是现在出现死机状态,如果当重新关电重启后恢复正常。由于产品需要常年开机。所以这是一个很大的问题。
由于死机后看门狗和软重启都没起作用。在家测试软重启和看门狗编程验证都是可以的。现在怀疑是单片机低温稳定性不好,内部晶体停振。在家无法复现,也只能怀疑。
以前在家也做过-40℃启动与运行测试,没出现过死机状态,现在批量以后,吉林零下二三十度就死机了。
通讯协议在家也做过压力测试和乱码测试,不会把单片机由于通讯数据错误而卡死。

大家有没有遇到过类似情况?
STM32F030稳定性怎么样?
内部晶体性能怎样?

MrJiu 发表于 2018-1-25 11:22:40

   换一句话说就是,人没去吉林?然后猜测的结论?不开机,也有可能是MCU连电都没有。。。因为低温环境下,其他很多原件也会有要求的。。。最简单的一个例子,电源的各种滤波电容,特别是那种电解电容。。。低温分分钟让你奔溃,如果选择的不合适的话。
    回到MCU的稳定性上面,一般情况下,至少目前我没遇到不稳定的情况,而且从稳定性来说,内部晶振应该比外部晶振反而更加稳定,只是精度欠缺而已!!!

toofree 发表于 2018-1-25 12:41:00

STM32F030稳定性先不用怀疑,还是先排除硬件电路是否有缺陷。
电路中,其它器件是否能保证全宽温;如果在室外,电路外围的防水、防潮、防静电是否考虑充分;
还有其它电磁兼容性问题,是否有考虑。比如,是否有金属屏蔽壳体,壳体是否充分接地;放置的位置,是否有电机等强电磁设备;通信口有没有隔离;电源是否稳定等。


C-Korey 发表于 2018-1-25 13:31:05

MrJiu 发表于 2018-1-25 11:22
换一句话说就是,人没去吉林?然后猜测的结论?不开机,也有可能是MCU连电都没有。。。因为低温环境下 ...

设备是通过3G/4G或网络远程可远程控制,设备中有cortex—A8,直接可以远程登录linux查看原始数据。CMU控制着A8这边的电源,A8自己重启可以联网上线。但是就是无法与MCU通信。MCU控制着A8的供电,如果MCU重启或复位,都会断电重启A8。如果A8一段时间不发送握手心跳包给MCU,MCU会复位断电重启A8,我们试过停止发送心跳包,但是MCU不断电重启A8。这种情况下自由切断外部供电后,就能恢复正常通讯。
设备设计时,全是按照-40℃选用的所有器件。机箱压铸铝IP65等级。防雷、低温启动、低温运行、防水、静电、脉冲群、电磁抗扰、电压跌落等等都是做过认证测试的。之前都没出现过这个假死的问题。

C-Korey 发表于 2018-1-25 13:31:27

toofree 发表于 2018-1-25 12:41
STM32F030稳定性先不用怀疑,还是先排除硬件电路是否有缺陷。
电路中,其它器件是否能保证全宽温;如果在室 ...

设备设计时,全是按照-40℃选用的所有器件。机箱压铸铝IP65等级。防雷、低温启动、低温运行、防水、静电、脉冲群、电磁抗扰、电压跌落等等都是做过认证测试的。之前都没出现过这个假死的问题。

wenyangzeng 发表于 2018-1-25 13:34:15

查阅数据手册,-40摄氏度已经是F030的下限了,如果F030是工作在F最高系统时钟频率,可能已经在极限临界点了。建议降低工作频率试看看。


C-Korey 发表于 2018-1-25 13:47:03

wenyangzeng 发表于 2018-1-25 13:34
查阅数据手册,-40摄氏度已经是F030的下限了,如果F030是工作在F最高系统时钟频率,可能已经在极限临界点了 ...

现在开的48M,降频确实可以试一试。在家测试时冻到过-45℃。在低就不行了。

wenyangzeng 发表于 2018-1-25 13:54:14

本帖最后由 wenyangzeng 于 2018-1-25 13:58 编辑

C-Korey 发表于 2018-1-25 13:47
现在开的48M,降频确实可以试一试。在家测试时冻到过-45℃。在低就不行了。 ...
那证明你也早知道这个低温有隐患。你可以让VCC达到最高值的3.6V。还有是否应该考虑PCB有否结冰了引起短路。

C-Korey 发表于 2018-1-25 14:11:04

wenyangzeng 发表于 2018-1-25 13:54
那证明你也早知道这个低温有隐患。你可以让VCC达到最高值的3.6V。还有是否应该考虑PCB有否结冰了引起短路 ...

现在电压是3.5V,由于客户需求就是-40℃,器件都是按照-40℃选型设计的。机箱是压铸铝IP65等级,做过认证测试的。防雷测试、静电、脉冲群、电磁抗扰度、电压跌落等等都是做过认证测试的。之前都没出现过这种假死现象,所以感觉很奇怪。
设备中还有一块A8平台ARM和3G/4G通讯模块,A8与MCU通讯的,MCU控制着A8的电源,A8通过移动网络上网、我们可以远程直接登录到linux中,查看原始原始数据和进行控制。A8需要向MCU发送心跳包,如果A8一段时间不发送正确的包,MCU就会断A8的电重启A8。我们试过远程关闭心跳发送,MCU没有任何断电复位操作重启A8。第一版当时一个设计缺陷就是,没设计A8复位MCU的功能,第二版就有了,但是现在第一版出去了几百台,冬天来了就有部分假死了。

stm1024 发表于 2018-1-25 14:36:10

MrJiu 发表于 2018-1-25 11:22
换一句话说就是,人没去吉林?然后猜测的结论?不开机,也有可能是MCU连电都没有。。。因为低温环境下 ...

我觉得你说的有一定的道理,特么到冬天电池比MCU还弱鸡,或者板子上其他元器件不耐操呢?
不过这种事情也只是个人猜测,具体还得去现场才能知道。
页: [1] 2 3 4
查看完整版本: 连续开机半年死机,STM32F030使用内部晶体,现在冬天出现...