11

问一个群晖数据恢复问题~

 2 years ago
source link: https://www.v2ex.com/t/804212
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

V2EX  ›  NAS

问一个群晖数据恢复问题~

  RiESA · 1 天前 · 1106 次点击

数据无价,数据数据,我是傻子

前因是这样的,之前的黑裙突然崩了,然后搜网上的教程开始重装

硬件是一个 U 盘作为引导,一个 32G 的 SSD 作为系统盘,然后一个 10T 的机械

格式化了每个硬盘的第一个分区,第一个分区粉红色的是系统,数据在后面的分区? 应该是这样理解(对这个教程存疑目前,因为我失败了)

然后重装了系统,重装系统又遇到提示“无法安装此文件,文件可能已损毁。( 13 )”,然后我把 10T 的机械拔出来,格式化了 32G 的固态,重新安装了 DSM

按网上的教程重装完系统把 10T 的机械硬盘装回去,应该会提示硬盘有问题,然后修复完事才对

然而...静悄悄,群晖压根没有提示所谓的修复,倒是能识别到 10T 的硬盘,但是显示未初始化,只能新增存储池,而且会提示格式化硬盘全部数据

这咋整,我麻了

发帖前我大概搜索了一下,有挂载到其他 linux 下然后复制文件出来的抢救办法

但是问题来了,我没另外一个 10T 那么大的硬盘来腾笼换鸟,有没有什么办法可以直接恢复数据而不用格式化掉的吗

目前的样子,下面那个 10T 的显示未初始化

https://www.hualigs.cn/image/614f36b12ff84.jpg

33 条回复    2021-09-27 00:11:45 +08:00

jfdnet

jfdnet   1 天前 via iPhone

你至少得有个 raid 才能修复什么的吧。你这就单块硬盘,你还动了分区。先看看数据还在不在吧。

RiESA

RiESA   1 天前

@jfdnet #1 数据大概还是在的吧,因为我只操作格式了群晖所在的第一个 2.4G 分区,然后重装 DSM 的时候这块硬盘是拔下来没有做任何操作的,数据应该还在里面

Cursor1st

Cursor1st   1 天前

要恢复的 10T 硬盘不能格式化第一个分区呀,这样就丢失了群晖识别的信息
我之前是硬盘有点坏道,出现硬盘“堪用”提示,并且检测不到了,然后通过拔插后修复恢复

RiESA

RiESA   1 天前

@Cursor1st #3 那如何是好,我试过用 PE 克隆目前这个 32G 固态的第一个分区到机械的第一个分区里了,也是一样没有效果

jfdnet

jfdnet   1 天前 via iPhone

@RiESA

先把数据捞出来吧。数据无价。NAS 最好还是上个 raid

RiESA

RiESA   1 天前

@jfdnet #5 那估计得下血本再搞一个 10T 的盘来腾笼换鸟了,长记性了,唉

Cursor1st

Cursor1st   1 天前

@RiESA 可以用 UFS_Explore 来在 win 下读取群晖硬盘,网上找找破解版吧,5.22 的可以用

RiESA

RiESA   1 天前

@Cursor1st #7 也就只能试试看这个办法了,就是得再搞块大盘

lifanxi

lifanxi   1 天前

你先去命令行 fdisk -l 看看,这块盘上的分区是不是还在,讲道理群晖的盘至少会有三个分区,第三个是数据分区。

如果数据分区还在,那就自己 mount 起来看看,应该数据是不会丢的。如果你不是 Basic 存储空间,用了 SHR,那可能需要有操作 LVM 和 Linux RAID 的经验。LVM 和 Linux RAID 的基本操作可以参考群晖官网上在 Ubuntu 下恢复数据的文档,这些命令在群晖自己的命令行上应该都是可以用的。https://kb.synology.cn/zh-cn/DSM/tutorial/How_can_I_recover_data_from_my_DiskStation_using_a_PC 如果数据在就先备份吧,理论上应该有希望把这块盘修到在群晖上能正常挂起来,但是还是有些风险,先保数据要紧。

如果分区都不在了,就有点讨厌,可以用第三方工具看看能不能先把分区修复出来。

RiESA

RiESA   1 天前

@lifanxi #9 分区还在,但是 mount 的时候提示"mount: unknown filesystem type 'linux_raid_member'
"
https://www.hualigs.cn/image/614f4017ca649.jpg

LionXen

LionXen   1 天前

黑群晖 企业级数据中心硬盘 + Basic Ext4 存储空间,就不会有这个问题~

lifanxi

lifanxi   1 天前

@RiESA 你这就是有 RAID 的情况,多半是因为你用了 SHR 。所以你需要用 mdadm 把这个 RAID 重建起来以后再 mount 。参考一下我上面给你的文章试试。

RiESA

RiESA   1 天前

@lifanxi #13 好的,我试试看,但是我一直是 basic 使用的,难道这也算 RAID 么

RiESA

RiESA   1 天前

@lifanxi #13 另外我用 ssh 连上去群晖试了一下,没办法用像上面的文章那样用 apt-get 安装所需要的软件,然后我参考其他文章弄了 ipkg,利用 ipkg 安装了 mdadm ,但是用 ipkg 没办法安装 lvm2,目前卡在这一步,如果没办法用群晖自己的命令行搞定的话,还是得准备另外一块盘来挪数据吧

lifanxi

lifanxi   1 天前

@RiESA 貌似现在 Basic 也会套一层 Linux RAID 的。

你不需要在群晖上 apt-get 装软件,要用的 mdadm 等命令群晖都有的,直接 sudo 运行就可以了。

你自己 mount 起来也是需要另一块硬盘来导一遍数据的。如果要修到群晖直接能自己挂起来,估计要费点力气,我也没试过。原理上是把三个分区都正确重建,然后加到对应的 md 组里,RAID 同步完应该就好了,但是不知道是不是还要修修什么元数据之类的才能在 DSM 里看到。

vteng

vteng   1 天前 via iPhone

明知道数据无价还用黑群

nameuser

nameuser   21 小时 7 分钟前

@RiESA 我现在有两个黑群。一个 x86,一个猫盘(几十块钱)。
猫盘每周定时开两次,非常重要的数据用群晖套件同步至猫盘。我觉得比所谓的 raid 香。
再配合网盘备份,风险再次降低。

yazoox

yazoox   21 小时 0 分钟前

@vteng 这个和黑群晖有必然关系么?难道正式的白群晖就不会崩系统?这个是概率问题吧......

就好像,你买的联想台式机电脑,正版,安装好的 windows 10,开机即用,谁能保证在正常使用的情况下,报废前,win 系统肯定不会崩掉?(windows 硬盘管理确实简单,硬盘直接拿下来,挂到另外一台机器上,就好了)

当然,你可以说黑群晖系统,硬件自己组装的,兼容性不好,可能系统崩的机率大,这个没毛病。

@RiESA 楼主,你要是搞定了,恢复好了。能够总结一下,帖个帖子 /文章出来么?最近本来也在看群晖,打算买一台。
但一直纠结,担心它的数据格式,生怕系统坏了,硬盘里面的数据拿不出来。你这就碰到了,正好我学习一下。

谢谢!

RiESA

RiESA   20 小时 14 分钟前

@yazoox 我也是新手刚用,现在回去看那些教程,原理应该是利用了群晖会在每一个硬盘都安装系统的特性,

具体是我误操作还是教程有坑就不清楚了,我经验尚浅未能有准确判断

我是按教程说明格式化掉了全部硬盘第一个 EXT4 分区,但是现在仔细想想,大概坑就在这里

应该是拔出来这个 10T 的硬盘,不做任何处理,然后直接格式化 32G 的 SSD,重装 DSM 完成之后,再把这个 10T 的硬盘原封不动的插进去,这样应该群晖自己会检测到两个硬盘之间的系统问题,进行下一步处理才对,(这点存疑,是我自己反思后的理解)

我把 10T 这个硬盘分区信息都格了,而 32GSSD 里的 DSM 又是重新安装的,理论上它就压根不认识这个 10T 的硬盘,重装后的群晖系统怎么识别呢?

不过现在想通了似乎也对问题于事无补了,所幸只格式化了第一个分区,只是导致群晖无法识别而已,实际文件还在的,只是现在陷入一个死胡同,要把这个 10T 的盘放进去群晖里使用,必然群晖会初始化掉这个盘

所以只能再准备一个硬盘,通过其他方式和软件,直接读取数据分区里的内容,复制出来后,放到另外一个硬盘里腾笼换鸟,再重新把这个 10T 的硬盘放进去群晖里初始化了

顺便附上当时参考的网络教程:
https://panfake.com/2020/05/black-synology-system-recovery/
https://post.smzdm.com/p/and20ed7/

顺便搜了一下,好像这种操作不是少数,难道真的是我操作或者理解有误? 希望能得到指点

AirBai2

AirBai2   20 小时 10 分钟前

我回复过,如果你不动 10T 硬盘的分区,可以直接恢复的

RiESA

RiESA   20 小时 9 分钟前

@vteng 前文的数据无价是在批判我自己在对问题没有足够的了解情况的错误操作,
而不是黑群晖,如果是因为黑群晖不稳定的数据损坏我也认了

RiESA

RiESA   20 小时 8 分钟前

@AirBai2 看来我理解的没错了,但是为什么网上的教程教人格式化掉每个硬盘的第一个分区,坑人

"3. 格式化掉每个硬盘的第一个分区,保留 EXT4 文件系统"

gtgc2005

gtgc2005   17 小时 46 分钟前

我印象里,硬盘上应该有 3 个分区,要格式化掉前 2 个分区。最后一个是数据分区

gtgc2005

gtgc2005   17 小时 37 分钟前

我记错了,麻烦忽略我这个错误的方式

sorsens

sorsens   16 小时 52 分钟前

嗯,应该是硬盘的锅,小概率事件,硬盘还能修复后接着用,但是修复需要重新做群晖的识别(很漫长),重新写入文件。
建议还是 riad1 这些。
现在最好是 linux 系统下买个新硬盘,拷贝过去数据

zerohzd

zerohzd   16 小时 24 分钟前

学习了,其实楼主不需要另一块 10T 的盘,几块硬盘加起来 10T,分几次挪也是可以的...吧?

TerranceL

TerranceL   14 小时 57 分钟前

@yazoox 白群晖系统崩了有 reset 键,其作用推测和楼主删除所有硬盘上第一个分区类似。另外白群晖可以寻求官方技术支持。(虽然也无法提供 rm -rf 删除数据的恢复方案)

geniussoft

geniussoft   14 小时 56 分钟前

如果在意数据安全,就不要使用黑裙。

您不但用黑裙,而且还是单盘,还没有冷备份?

...

TerranceL

TerranceL   14 小时 55 分钟前

楼主是不是开机状态下充新插的 10T 盘?关机插进去再开机试试,删除第一个分区操作本身没问题,我以前黑群晖的时候干过一次,印象里和开关机有关系。

RiESA

RiESA   14 小时 46 分钟前

@TerranceL #30 关机插入,开机插入都试过了,都是提示需要初始化

defunct9

defunct9   14 小时 25 分钟前

卖一块 16TB 的全新 SAS 盘

lifanxi

lifanxi   6 小时 56 分钟前

我今天在 PVE 上用虚拟机黑群晖( DSM 6.2.3 )测试了恢复分区的逻辑。

步骤:

1. 先建一个 DSM ( test1 ),加一块硬盘,用 SHR 模式建一个 Volume,放点文件,关机。(模拟原来故障的 NAS 。)
2. 再建一个 DSM ( test2 ),也一块硬盘,建一个 Volume,关机。(模拟重装后的 NAS 。)
3. 把 test1 的硬盘,挂到 test2 上,test2 开机。群晖提示系统分区损坏,修复后,数据都在。(正常的硬盘重新挂到一台新建的 NAS 是可以无损恢复数据的)
4. 在 test2 上,强行用 fdisk 把 test1 的硬盘上的前两个分区(系统,SWAP )删除。重启 test2 。(模拟楼主的修复操作)
5. 重启后,test2 上提示第二块硬盘为未初始化状态。什么都看不到了。

修复过程:

1. 先用 fdisk 把 test1 的硬盘上被删除的前两个分区重建,都设成 fd 类型,具体大小可以抄 test2 的情况,不同时期的 DSM,创建的分区型式略有差异,类似这样:
Device Boot Start End Sectors Size Id Type
/dev/sdc1 2048 4982527 4980480 2.4G fd Linux raid autodetect
/dev/sdc2 4982528 9176831 4194304 2G fd Linux raid autodetect
2. 然后,把这两个分区分别加到系统 md0 和 md1 中,靠 RAID 修复系统分区:
sudo mdadm -a /dev/md0 /dev/sdc1
sudo mdadm -a /dev/md1 /dev/sdc2
做完这步后,在 Storage Manager 中就能看到磁盘状态由未初始化变成了已初始化,但看不到上面的 卷。
3. 这时 cat /proc/mdstat 能看到一个 md127 的 RADI 设备,就是 test1 硬盘的数据区。看上去不太对,把它删掉重建成 md3,重建命令的-N 后面是名字:序号,可以抄下 md2 设备里的名字,序号跟 mdX 中的数字一样。系统会提示已经有 RAID 信息了,直接 y 继续创建:
sudo mdadm -S /dev/md127
sudo mdadm --create /dev/md3 --level=1 --raid-devices=1 --force /dev/sdc5 -N <机器名>:3
(我后来又演练了两次,这两次都没有出来 md127,我就直接创建 md3 了)
4. 下面就是要恢复 LVM 了,这步比较迷,我也不知道怎么就恢复了(好像就是只要多等一会儿就行了)。
我先运行了 vgchange -ay,但只列出了一个 vg,我就尝试着用下面这些命令看 LVM 的状态,到 vgs 时,突然看到多了一个 vg1000,然后后面那些命令看起来都符合预期了。但是 DSM 界面上看,相关的卷还没出来。
# pvs
# vgs
# lvs
# pvdisplay
# vgdisplay
# lvdisplay
5. 直接 reboot 重启,然后就都正常了

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK