久しぶりに書く記事がこう言った渋い話でいいのか?と思うところではありますが、 事実としてこう言った話が起きたので、今回はその辺りの話を書きます。
事の顛末
話の流れ:
- 2025年3月頃にLinuxで使うためRTX 5070を思い切って買う
- しかしRTX 5070が
GPU has fallen off the bus
と吐く突然死が頻発する - どうしようもなかったので代理店で検査してもらうもWindowsでは異常なし
- 結果どうにもならなかったのでRX 9070を購入する←今ココ
という感じです。
なお今回購入していたハードウェアは次の通り:
具体的に何が起きていたのか?
まず、今年の3月中旬頃に、
もうそろそろローカル生成AI全般をまともに触ってみて〜
という動機と、
将来的にはVRヘッドセットを買ってVRChatをやりて〜
という事への事始めとして、
を購入しました。まぁ生成AI回りでRTXシリーズは鉄板だし、VRにしてもNVIDIAが前提な面もありますからね。
ところがです。ウチのPCだと、
RTX 5070が
GPU has fallen off the bus
と言うエラーを突如吐いてGPUがロストする
という事が頻発し、GPUがロストした瞬間にファンがフルスピードで回り出す、とか、 そう言う事が起きてました。
具体的にもう少し状態を詳しく書くと、
- GPUのアイドル時に
GPU has fallen off the bus
というエラーが出る - 上記エラーは何の前触れもなく、ワークロードの有無に関係なく発生する
- 上記のエラーでGPUが死ぬとrebootしない限り復帰しない
といった辺りです。
この辺りについてはNVIDIAのLinux forumを探し漁り、BIOSの設定を変える、 Linux kernelとNVIDIA open driverの組み合わせも変える、 とか色々試したんですが結局ダメで、完全に手詰りとなってました。
んで、自分の環境では完全に手詰りだったのでInno3Dの代理店であるELSAのサポートへ連絡し、
RMAを使って検査してもらうも異常なしだったので、まぁしょうがないね
、
という事で、
を買った、という辺りが今回のオチになります。
何が原因だったのか
これは多分環境固有の問題で、考えられる原因としては:
- 自分のマシンとRTX 5070の相性問題
- Linux driverの不具合
のどちらか、という感じでした。
一応ELSAのサポートセンター側の検証ではWindows機でまったく問題がなかった、 という事なのでLinux driverが非常に怪しい(というか今のLinux driverは問題が多発している)か、 あるいは可能性の一つとしてハードウェアの相性問題だったのかなーと思ってます。
今後の対策
まーLinuxで出始めの新しいハードウェアは止めとけという話ですね。今回はそれで買い直しになってますし。
また新しいハードウェアを買うにしても、やりたい事に対してソフトウェア側の対応が行なわれているか、 とか、あるいはドライバの不具合が多発していないか、といった事を事前によく調査して買ったほうが良かったかなーと考えています。
ちなみにRX 9070も生成AIで使ったり、GPU Passthroughして使ったり、を目的として買ったんですが、 今使っているLinux DistroであるNixOSで提供されるROCmのバージョンが6.3.3だった、という話もあるので、 そこも調べた方が良かったのでは?と今となっては思いますね。
※なおROCmの問題については自力で巨大なパッチを書いてなんとかしました、4日ほど溶かして気合で作った6.4.1への対応 パッチはGitHubで公開しています。
ちなみにRTX 5070はどうするの?
これについては手放す予定です。
パソコン工房に買取り額の割り増しサービスがあるので、そちらを利用しようかな、 と考えていますが、まー5万ぐらいの値が付けばそのまま売るか、と言った感じです。
もっとも新しいハードウェアでまだ保証期間は切れてないし、 RTX 5070は今のところ値崩れしてないはずなので、そこまで低い評価額にはならんのでは? とは思ってますが、まー購入時の半額ぐらいで見とけばいいかーと思ってます。
またメルカリとかのフリマアプリならもう少し高値で売れるのかもしれませんが、 すり替え詐欺とかあるらしいですし、フリマアプリは普段まったく利用していないので、 そこは無しで、という感じです。
なお今回の一件で合計23万円ぐらいは支払ってるので、これについては結構な勉強代になったなーという感じですな。
以上
今回はハードウェア的な相性か、もしくはドライバがダメダメだったのかの判定が出来ないので余計やっかいでしたが、 結果としては、RX 9070を買うことで結着が付いた、という感じでした。
ちなみにELSAのサポートについては印象が良く、かつRTX 5070自体も結構モノとして良い感じだったので、
購入したモノとサービスについては文句は無かったんですが、どうして……
と言った辺りが正直な気持ちです。
まー今のLinux環境だとGPUはIntel ArcかAMD Radeon辺りが安定しているので、 NVIDIAは枯れてきたことが分かってから買うという覚悟でやっていた方がいいのかなーと思ってます。