主机论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 123|回复: 7

友情提醒,在HZ有AX NVME的MJJ注意了

[复制链接]

25

主题

6403

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

积分
13687
发表于 2022-2-3 21:29:44 | 显示全部楼层 |阅读模式
如果你是用的三星PM9A1,请立即升级固件
HZ已经出了紧急通知
我也已经中标了,10多天的新硬盘报废。

SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        43 Celsius
Available Spare:                    37%
Available Spare Threshold:          10%
Percentage Used:                    0%
Data Units Read:                    2,520,655 [1.29 TB]
Data Units Written:                 1,375,575 [704 GB]
Host Read Commands:                 4,947,732
Host Write Commands:                33,533,886
Controller Busy Time:               840
Power Cycles:                       5
Power On Hours:                     377
Unsafe Shutdowns:                   1
Media and Data Integrity Errors:    465
Error Information Log Entries:      465
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 1:               43 Celsius
Temperature Sensor 2:               46 Celsius
回复

使用道具 举报

243

主题

3544

帖子

8349

积分

论坛元老

Rank: 8Rank: 8

积分
8349
发表于 2022-2-3 21:32:13 | 显示全部楼层
原因?                 
回复

使用道具 举报

25

主题

6403

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

积分
13687
 楼主| 发表于 2022-2-3 21:32:39 | 显示全部楼层

三星固件问题,大量坏块
回复

使用道具 举报

3

主题

14

帖子

47

积分

新手上路

Rank: 1

积分
47
发表于 2022-2-3 21:32:00 | 显示全部楼层
我也收到邮件了,有19台受到影响。。。怪不得总是出现数据丢失情况。是不是只要执行update_samsung命令就完事了?
回复

使用道具 举报

33

主题

1387

帖子

3487

积分

论坛元老

Rank: 8Rank: 8

积分
3487
发表于 2022-2-4 08:32:01 | 显示全部楼层
感谢楼主,已升级。
回复

使用道具 举报

25

主题

6403

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

积分
13687
 楼主| 发表于 2022-2-4 12:50:20 | 显示全部楼层
本帖最后由 sdqu 于 2022-2-4 12:54 编辑
wunaizhuce 发表于 2022-2-4 08:32
我也收到邮件了,有19台受到影响。。。怪不得总是出现数据丢失情况。是不是只要执行update_samsung命令就完 ...


是的
我昨天一天大爆发,300个坏块,用掉40%的可用空间,以前平均每天10多个坏块。。才是新盘就这样
用了update_samsung后,坏块就没有再增加了
smart自己可以看一下,如果实在坏得太多,work order让他们换新盘

回复

使用道具 举报

70

主题

2333

帖子

6126

积分

论坛元老

Rank: 8Rank: 8

积分
6126
发表于 2022-2-4 12:52:58 | 显示全部楼层
吓的我赶紧看了下我OVH的机器,还好不是这款
E: ID_MODEL=SAMSUNG MZQLB960HAJR-00007

[root@OVH3800X ~]# sudo smartctl -A  /dev/nvme0n1
smartctl 7.0 2018-12-30 r4883 [x86_64-linux-3.10.0-1160.el7.x86_64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF SMART DATA SECTION ===
SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        36 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    1%
Data Units Read:                    111,793,560 [57.2 TB]
Data Units Written:                 127,893,264 [65.4 TB]
Host Read Commands:                 939,795,057
Host Write Commands:                1,900,453,386
Controller Busy Time:               2,454
Power Cycles:                       57
Power On Hours:                     7,511
Unsafe Shutdowns:                   54
Media and Data Integrity Errors:    0
Error Information Log Entries:      0
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 1:               36 Celsius
Temperature Sensor 2:               39 Celsius
Temperature Sensor 3:               45 Celsius

[root@OVH3800X ~]# sudo smartctl -A  /dev/nvme1n1
smartctl 7.0 2018-12-30 r4883 [x86_64-linux-3.10.0-1160.el7.x86_64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF SMART DATA SECTION ===
SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        36 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    1%
Data Units Read:                    138,846,792 [71.0 TB]
Data Units Written:                 129,167,470 [66.1 TB]
Host Read Commands:                 2,093,870,599
Host Write Commands:                1,919,572,618
Controller Busy Time:               3,947
Power Cycles:                       57
Power On Hours:                     7,511
Unsafe Shutdowns:                   54
Media and Data Integrity Errors:    0
Error Information Log Entries:      0
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 1:               36 Celsius
Temperature Sensor 2:               39 Celsius
Temperature Sensor 3:               44 Celsius
回复

使用道具 举报

8

主题

53

帖子

168

积分

注册会员

Rank: 2

积分
168
发表于 2022-2-4 08:32:00 | 显示全部楼层
大佬 帮看下  我的需要update嘛, 直接SSH 嘛,我的已经改组RAID 0
是ssh 下执行update_samsung,再reboot ?  不太明白,

  1. [root@CentOS-84-64-minimal ~]# smartctl --all /dev/nvme0n1
  2. smartctl 7.1 2020-04-05 r5049 [x86_64-linux-4.18.0-348.2.1.el8_5.x86_64] (local build)
  3. Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

  4. === START OF INFORMATION SECTION ===
  5. Model Number:                       SAMSUNG MZVLB1T0HBLR-00000
  6. Serial Number:                      S4GJNX0R613062
  7. Firmware Version:                   EXF7201Q
  8. PCI Vendor/Subsystem ID:            0x144d
  9. IEEE OUI Identifier:                0x002538
  10. Total NVM Capacity:                 1,024,209,543,168 [1.02 TB]
  11. Unallocated NVM Capacity:           0
  12. Controller ID:                      4
  13. Number of Namespaces:               1
  14. Namespace 1 Size/Capacity:          1,024,209,543,168 [1.02 TB]
  15. Namespace 1 Utilization:            440,278,593,536 [440 GB]
  16. Namespace 1 Formatted LBA Size:     512
  17. Namespace 1 IEEE EUI-64:            002538 8611b03554
  18. Local Time is:                      Fri Feb  4 06:43:03 2022 CET
  19. Firmware Updates (0x16):            3 Slots, no Reset required
  20. Optional Admin Commands (0x0017):   Security Format Frmw_DL Self_Test
  21. Optional NVM Commands (0x005f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp
  22. Maximum Data Transfer Size:         512 Pages
  23. Warning  Comp. Temp. Threshold:     84 Celsius
  24. Critical Comp. Temp. Threshold:     85 Celsius

  25. Supported Power States
  26. St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
  27. 0 +     8.00W       -        -    0  0  0  0        0       0
  28. 1 +     6.30W       -        -    1  1  1  1        0       0
  29. 2 +     3.50W       -        -    2  2  2  2        0       0
  30. 3 -   0.0760W       -        -    3  3  3  3      210    1200
  31. 4 -   0.0050W       -        -    4  4  4  4     2000    8000

  32. Supported LBA Sizes (NSID 0x1)
  33. Id Fmt  Data  Metadt  Rel_Perf
  34. 0 +     512       0         0

  35. === START OF SMART DATA SECTION ===
  36. SMART overall-health self-assessment test result: PASSED

  37. SMART/Health Information (NVMe Log 0x02)
  38. Critical Warning:                   0x00
  39. Temperature:                        36 Celsius
  40. Available Spare:                    100%
  41. Available Spare Threshold:          10%
  42. Percentage Used:                    0%
  43. Data Units Read:                    351,716 [180 GB]
  44. Data Units Written:                 4,129,104 [2.11 TB]
  45. Host Read Commands:                 4,035,342
  46. Host Write Commands:                81,797,886
  47. Controller Busy Time:               1,127
  48. Power Cycles:                       2
  49. Power On Hours:                     1,306
  50. Unsafe Shutdowns:                   0
  51. Media and Data Integrity Errors:    0
  52. Error Information Log Entries:      1
  53. Warning  Comp. Temperature Time:    0
  54. Critical Comp. Temperature Time:    0
  55. Temperature Sensor 1:               36 Celsius
  56. Temperature Sensor 2:               44 Celsius

  57. Error Information (NVMe Log 0x01, max 64 entries)
  58. No Errors Logged

  59. [root@CentOS-84-64-minimal ~]# smartctl --all /dev/nvme1n1
  60. smartctl 7.1 2020-04-05 r5049 [x86_64-linux-4.18.0-348.2.1.el8_5.x86_64] (local build)
  61. Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

  62. === START OF INFORMATION SECTION ===
  63. Model Number:                       SAMSUNG MZVLB1T0HBLR-00000
  64. Serial Number:                      S4GJNJ0N606856
  65. Firmware Version:                   EXF7201Q
  66. PCI Vendor/Subsystem ID:            0x144d
  67. IEEE OUI Identifier:                0x002538
  68. Total NVM Capacity:                 1,024,209,543,168 [1.02 TB]
  69. Unallocated NVM Capacity:           0
  70. Controller ID:                      4
  71. Number of Namespaces:               1
  72. Namespace 1 Size/Capacity:          1,024,209,543,168 [1.02 TB]
  73. Namespace 1 Utilization:            440,336,117,760 [440 GB]
  74. Namespace 1 Formatted LBA Size:     512
  75. Namespace 1 IEEE EUI-64:            002538 8601401ac8
  76. Local Time is:                      Fri Feb  4 06:43:57 2022 CET
  77. Firmware Updates (0x16):            3 Slots, no Reset required
  78. Optional Admin Commands (0x0017):   Security Format Frmw_DL Self_Test
  79. Optional NVM Commands (0x005f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp
  80. Maximum Data Transfer Size:         512 Pages
  81. Warning  Comp. Temp. Threshold:     84 Celsius
  82. Critical Comp. Temp. Threshold:     85 Celsius

  83. Supported Power States
  84. St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
  85. 0 +     8.00W       -        -    0  0  0  0        0       0
  86. 1 +     6.30W       -        -    1  1  1  1        0       0
  87. 2 +     3.50W       -        -    2  2  2  2        0       0
  88. 3 -   0.0760W       -        -    3  3  3  3      210    1200
  89. 4 -   0.0050W       -        -    4  4  4  4     2000    8000

  90. Supported LBA Sizes (NSID 0x1)
  91. Id Fmt  Data  Metadt  Rel_Perf
  92. 0 +     512       0         0

  93. === START OF SMART DATA SECTION ===
  94. SMART overall-health self-assessment test result: PASSED

  95. SMART/Health Information (NVMe Log 0x02)
  96. Critical Warning:                   0x00
  97. Temperature:                        39 Celsius
  98. Available Spare:                    100%
  99. Available Spare Threshold:          10%
  100. Percentage Used:                    0%
  101. Data Units Read:                    8,459,195 [4.33 TB]
  102. Data Units Written:                 18,573,768 [9.50 TB]
  103. Host Read Commands:                 76,643,029
  104. Host Write Commands:                197,190,429
  105. Controller Busy Time:               1,438
  106. Power Cycles:                       21
  107. Power On Hours:                     1,712
  108. Unsafe Shutdowns:                   13
  109. Media and Data Integrity Errors:    0
  110. Error Information Log Entries:      59
  111. Warning  Comp. Temperature Time:    0
  112. Critical Comp. Temperature Time:    0
  113. Temperature Sensor 1:               39 Celsius
  114. Temperature Sensor 2:               50 Celsius

  115. Error Information (NVMe Log 0x01, max 64 entries)
  116. No Errors Logged
复制代码
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|主机论坛

GMT+8, 2024-4-26 02:08 , Processed in 0.083738 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表