はじめに

  • EBSの初期サイズを増やしすぎた。
  • ボリューム拡張で増やしすぎた。

見積もりのミスで、こういうときが偶にある。
特に規模感が見えないプロジェクトではありがち…。
今回は、EBSのボリュームを縮小するということをやってみる。

環境

1
AWS EC2 (t4g.nano)

シチュエーション

下記のような状況でのシミュレーションを行う。

  • AWS EC2インスタンスを作成
  • EBSを12GBでつくった!けど8GBで良かった…。

準備

シチュエーションを再現するためにインスタンスを作成する。

EC2インスタンスの作成

項目設定値
名前web-server
OSAmazonLinux2023 AMI
アーキテクチャ64ビット(Arm)
インスタンスタイプt4g.nano
キーペアweb-server(新規で作成)
セキュリティグループssh, http (自分のIPのみ)
ストレージ12GB (gp3)

create-test-instance-1

SSHログイン

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
   ,     #_
   ~\_  ####_        Amazon Linux 2023
  ~~  \_#####\
  ~~     \###|
  ~~       \#/ ___   https://aws.amazon.com/linux/amazon-linux-2023
   ~~       V~' '->
    ~~~         /
      ~~._.   _/
         _/ _/
       _/m/'
[ec2-user@ip-172-31-45-77 ~]$ 

ログインできた!

確認のためにApacheをいれておく

1
sudo dnf install -y httpd
1
2
sudo systemctl start httpd
sudo systemctl enable httpd

IPにアクセスして、 It works! が表示されることを確認する。

EBSの縮小 手順

おおまかな流れは下記になる。 ※もし本番環境など重要な環境で作業する場合は、2の手順の後に対象のインスタンスのAMI を作成したほうが良い。

  1. 新ボリュームを作成する。
    このボリュームは、後のルートボリュームとなるので 8GBとする。
  2. 作業用のインスタンスを作成する。
  3. 対象のインスタンスを停止し、ボリュームをデタッチする。
  4. 作業用のインスタンスに新ボリュームと旧ボリュームをアタッチする。
  5. 作業用のインスタンスにログインし、旧ボリューム(12GB) と 新ボリュームのディスクで同期を取る。
  6. 作業用のインスタンスを停止し、旧ボリュームと新ボリュームをデタッチする。
  7. 対象のインスタンスに新ボリュームをアタッチし、ルートボリュームとして起動するようにする。

ボリュームを作成する

  1. サイドメニュー > ボリューム から ボリュームの作成を選択する。
    create-volume-1

  2. ボリュームを8GBで作成する。 ※アベイラビリティゾーンに気をつけること create-volume-2

作業用のインスタンスを作成する

下記で作成する。

項目設定値
名前work-instance
OSAmazonLinux2023 AMI
アーキテクチャ64ビット(Arm)
インスタンスタイプt4g.nano
キーペアweb-server
セキュリティグループssh (自分のIPのみ)
ストレージ8GB (gp3)

対象のインスタンスを停止し、ボリュームをデタッチする

  1. インスタンスから アクション > インスタンスを停止を選択する。 detach-volume-1

  2. 対象のインスタンスのIDを控え、ボリュームで検索する。

  3. ボリュームから アクション > ボリュームのデタッチを選択する。 detach-volume-2

作業用のインスタンスに新ボリュームと旧ボリュームをアタッチする

  1. ボリュームからアクション > ボリュームのアタッチを選択する。 attach-volume-1

  2. ボリュームのアタッチで対象のインスタンスを選択し、ボリュームのアタッチを選択する。 attach-volume-2

※もう一つのボリュームも同じ手順でアタッチする。

作業用のインスタンスにログインし、旧ボリューム(12GB) と 新ボリュームのディスクで同期を取る

  1. SSH で対象のインスタンスにログインをする。

  2. lsblk でディスクを確認する。

1
2
3
4
5
6
7
8
9
[ec2-user@ip-172-31-37-241 ~]$ lsblk
NAME          MAJ:MIN RM SIZE RO TYPE MOUNTPOINTS
nvme1n1       259:0    0  12G  0 disk 
├─nvme1n1p1   259:2    0  12G  0 part /
└─nvme1n1p128 259:3    0  10M  0 part 
nvme0n1       259:1    0   8G  0 disk 
├─nvme0n1p1   259:4    0   8G  0 part 
└─nvme0n1p128 259:5    0  10M  0 part 
nvme2n1       259:6    0   8G  0 disk 
  1. fdisk -l /dev/nvme1n1 で古いボリュームの情報を表示する。
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
[ec2-user@ip-172-31-37-241 ~]$ sudo fdisk -l /dev/nvme1n1
Disk /dev/nvme1n1: 12 GiB, 12884901888 bytes, 25165824 sectors
Disk model: Amazon Elastic Block Store              
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disklabel type: gpt
Disk identifier: 9EEB8434-C088-40E5-8C9E-46F9A237FA80

Device           Start      End  Sectors Size Type
/dev/nvme1n1p1   22528 25165790 25143263  12G Linux filesystem
/dev/nvme1n1p128  2048    22527    20480  10M EFI System

Partition table entries are not in disk order.
  1. ブート パーティションを古いルート ボリュームnvme1n1から新しいルート ボリュームnvme2n1にコピーする
1
dd if=/dev/nvme1n1 of=/dev/nvme2n1 bs=512 count=24576
1
2
3
4
[root@ip-172-31-37-241 ec2-user]# dd if=/dev/nvme1n1 of=/dev/nvme2n1 bs=512 count=24576
24576+0 records in
24576+0 records out
12582912 bytes (13 MB, 12 MiB) copied, 1.52274 s, 8.3 MB/s
  • if : 入力ファイル/デバイス; 古いルートボリューム。
  • of : 出力ファイル/デバイス; 新しいルートボリューム。
  • bs : バイト単位のブロック サイズ。これはセクターサイズと同じ
  • count : コピーするブロックの量; これは、(最初の) データ パーティションの開始セクターと等しくなる。
  1. 古いボリュームのUUIDを表示する。 (これは控えておく)
1
2
[root@ip-172-31-37-241 ec2-user]# blkid /dev/nvme1n1p1
/dev/nvme1n1p1: LABEL="/" UUID="6bc0fdc0-ccc5-4301-89d9-b7a2cd0a2c67" BLOCK_SIZE="4096" TYPE="xfs" PARTLABEL="Linux" PARTUUID="f7cda471-6c2a-4e59-b64d-6c10c894b2bf"

6bc0fdc0-ccc5-4301-89d9-b7a2cd0a2c67 を控える。

  1. gdiskを実行し、新しいボリュームの更新をする
1
gdisk /dev/nvme2n1

パーティション テーブル (GPT) を調整する

1
2
3
4
Command (? for help): x

Expert command (? for help): e
Relocating backup data structures to the end of the disk

メニューに戻る

1
Expert command (? for help): m

古いデータ パーティションを削除する

1
2
Command (? for help): d
Partition number (1-128): 1

正しいサイズで新しいデータ パーティションを作成する。

1
2
3
4
5
6
7
Command (? for help): n
Partition number (1-128, default 1): 1
First sector (34-16777182, default = 22528) or {+-}size{KMGTP}: 22528
Last sector (22528-16777182, default = 16777182) or {+-}size{KMGTP}: 0
Current type is 8300 (Linux filesystem)
Hex code or GUID (L to show codes, Enter = 8300): 
Changed type of partition to 'Linux filesystem'

First sector は、これの /dev/nvme1n1p1Start の部分

1
2
3
Device           Start      End  Sectors Size Type
/dev/nvme1n1p1   22528 25165790 25143263  12G Linux filesystem
/dev/nvme1n1p128  2048    22527    20480  10M EFI System

変更をディスクに書き込む

1
2
3
4
5
6
7
8
Command (? for help): w

Final checks complete. About to write GPT data. THIS WILL OVERWRITE EXISTING
PARTITIONS!!

Do you want to proceed? (Y/N): y
OK; writing new GUID partition table (GPT) to /dev/nvme2n1.
The operation has completed successfully.
  1. 新しいボリューム dev/nvme2n1p1に xfsファイルシステムを作成する
1
mkfs -t xfs -f /dev/nvme2n1p1
  1. マウント先を作成する。
1
2
sudo mkdir -p /mnt/web-server-origin
sudo mkdir -p /mnt/web-server-new
  1. マウントを実行する。
1
sudo mount -t xfs -o nouuid /dev/nvme1n1p1 /mnt/web-server-origin
1
sudo mount -t xfs -o nouuid /dev/nvme2n1p1 /mnt/web-server-new
  1. rsync コマンドで同期を実施する。
1
sudo rsync -axvP --delete /mnt/web-server-origin/ /mnt/web-server-new/
1
2
sent 1,863,625,623 bytes  received 806,968 bytes  55,654,704.21 bytes/sec
total size is 1,860,315,090  speedup is 1.00

同期完了したので確認をする。

web-server-new を確認する。

1
2
3
[root@ip-172-31-37-241 web-server-new]# ls
bin   dev  home  lib64  media  opt   root  sbin  sys  usr
boot  etc  lib   local  mnt    proc  run   srv   tmp  var

良さそう。

  1. 新しいルートボリューム上の (最初の) データ パーティションの UUID と LABEL を更新して、古いルート ボリュームの値と一致させる
1
sudo umount /mnt/web-server-origin /mnt/web-server-new
1
2
xfs_admin -U 6bc0fdc0-ccc5-4301-89d9-b7a2cd0a2c67 /dev/nvme2n1p1
xfs_admin -L / /dev/nvme2n1p1
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
[root@ip-172-31-37-241 ec2-user]# blkid /dev/nvme1n1p1
/dev/nvme1n1p1: LABEL="/" UUID="6bc0fdc0-ccc5-4301-89d9-b7a2cd0a2c67" BLOCK_SIZE="4096" TYPE="xfs" PARTLABEL="Linux" PARTUUID="f7cda471-6c2a-4e59-b64d-6c10c894b2bf"
[root@ip-172-31-37-241 ec2-user]# sudo umount /mnt/web-server-origin /mnt/web-server-new
[root@ip-172-31-37-241 ec2-user]# xfs_admin -U 6bc0fdc0-ccc5-4301-89d9-b7a2cd0a2c67 /dev/nvme2n1p1
Clearing log and setting UUID
writing all SBs
new UUID = 6bc0fdc0-ccc5-4301-89d9-b7a2cd0a2c67
[root@ip-172-31-37-241 ec2-user]# xfs_admin -L / /dev/nvme2n1p1
writing all SBs
new label = "/"

作業用のインスタンスを停止し、旧ボリュームと新ボリュームをデタッチする。

  1. インスタンスから アクション > インスタンスを停止を選択する。 work-instance-detach-volume-1

  2. 対象のインスタンスのIDを控え、ボリュームで検索する。 work-instance-detach-volume-2

/dev/xvda はルートボリュームなので、これはそのままにしておく。

  1. ボリュームから アクション > ボリュームのデタッチを選択する。 work-instance-detach-volume-3

対象のインスタンスに新ボリュームをアタッチし、ルートボリュームとして起動するようにする

  1. ボリュームからアクション > ボリュームのアタッチを選択する。 web-server-attach-volume-1

  2. ボリュームのアタッチで対象のインスタンスを選択し、ボリュームのアタッチを選択する。 web-server-attach-volume-2

※ルートボリュームとして /dev/xvda を指定すること

  1. web-server を起動する。

できたあああああ

参考

おわりに

最初は、grub2-install とかで、ブートローダのUUIDを更新する方針でやっていたがどうやってもできなかった。
解決しても起動してくれないので、これOSが新しくなってブートローダの機構も違うのでこのあたりの手順は使えないのでは…と考えた。
なので、amazonlinux2023 ebs volume shrink とかで検索をかけてみたところ、https://medium.com/@benedikt.langens/how-to-shrink-an-ebs-root-volume-xfs-on-amazon-linux-2-2023-a7705c16e839 の素晴らしいサイトに出会った。
この手順で実施したところできました…!ありがとうございます…!
EBSのルートボリュームの縮小大変すぎるので、ちゃんと見積もりはしたほうが良いですね…。本当に面倒くさい。