わくわく鮟鱇ランド(mstdn.anqou.net)を初めとするいくつかのサービスが 2026/04/21 から 4/25 までダウンしていました。
#期間と範囲
2026/04/21 17:00 頃から 4/25 18:30 頃まで、以下のサービスにアクセスできませんでした。
- わくわく鮟鱇ランド(mstdn.anqou.net)
- nefmolojten.anqou.net
- waq.anqou.net
#時系列
年は全て 2026 年、時刻は JST です。
-
4/21
- 16:33 k3s がログにエラーを記録し始める。
- 16:47 サーバがダウンしていることを知らせるアラートが発報し始める。
- 17:08 mstdn.anqou.net のダウンが uptimerobot によって検知される。
- 17:09 nefmolojten.anqou.net のダウンが uptimerobot によって検知される。
- 17:10 waq.anqou.net のダウンが uptimerobot によって検知される。
- 18:04 anqou が障害対応を始める。
- 18:11 サーバを手動でシャットダウン。その後手動で電源ボタンを押してもブートしない。CPU ファンは回るが画面には何も表示されず、起動しなくなった。
- 19:00 ディスクを取り外して別マシンで確認したところデータに異常はなかった。マザーボードの故障を疑い始める。
- 19:38 jiskey.dev でマシン故障を告知。
- 22:20 新しいマザーボード(ASRock B550M Pro-A)を購入。
-
4/22
- いつものクセで mstdn.anqou.net を開くと動いていなくて憂鬱な気持ちになる。
-
4/23
- 19:20 B550M Pro-A に切り替えたが起動しない。絶望する。Post Status Checker(PSC)の CPU と DRAM が点灯していることを確認。PSU を疑い始める。
- 23:40 CH160 PLUS を購入。
-
4/24
- 店頭で新しい PSU(Thermaltake PS-TPT-0750FNF)を購入。
- 22:00 PSU を取り替えたが同じ PSC の状態で起動しない。絶望する。CPU を疑い始める。
-
4/25
- 店頭で新しい CPU(AMD Ryzen 5 5500GT)を購入。
- 15:00 CPU を取り替えるとマシンがブートすることを確認。
- 18:05 CH160 PLUS に詰め替えブート、インターネットにつなぎ各種設定を実施。
- 18:21 k3s を起動。
- 18:27 nefmolojten.anqou.net の復旧が uptimerobot によって検知される。
- 18:30 mstdn.anqou.net の復旧が uptimerobot によって検知される。
- 18:36 waq.anqou.net の復旧が uptimerobot によって検知される。
#原因と対応
CPU を取り替えたら問題が解決したので、状況証拠的にこれが故障したことが直接の原因のようです。この CPU は 2024 年 12 月ごろに購入したものでまだ 3 年の保証が残っているので問い合わせてみようと思います。
#感想
CPU はそんなに簡単に壊れることないやろ!wみたいな気持ちで障害対応していたら本当に CPU が壊れていてびっくりしました。PSU (と PC ケース)はそのうち変えようと思っていたので今回買い替えたのはまぁ良かったのですが、マザーボードを買い替えることになったのは想定外でした。Money on the fly です。
結果的に手元に正常動作していそうなマザーボードと PSU と PC ケースと、あと保証を要求すると治りそうな CPU があるので、メモリと SSD を調達するともう一台組めそうです。まぁ昨今の情勢ではメモリと SSD を調達するのが一番難しいんですけど。
#謝辞
わくわく鮟鱇ord の皆さんに #ランド運営 チャンネルでご声援をいただきつつ障害対応しました。ありがとうございました。