動画編集ソフトDavinci Resolveに最適なグラフィックボードとは?

2019年12月16日

高性能動画編集ソフト、Davinci Resolveに最適なグラフィックボードは何か。

主に、スマホやミラーレス一眼で動画を撮影してWindows PCでDavinci Resolveで編集してYoutubeにVlogをアップしたい!みたいな人向けで書いてます。

Davinci Resolveの私の環境設定については下記リンクで紹介してます。

解像度別のおすすめのグラボはこちらで紹介しています。

結論

  • OSがWindowsならシステム上の関係でRADEONシリーズを使うべきではない後述部分に移動する

  • VRAMは8 GB以上、できれば16 GB欲しい。
  • つまり、最新版のミドルクラスのNVIDIA製のグラフィックボードが最適。
  • 高性能グラボを買うなら、まず有償版のDavinci Resolve Studioを買わなければいけない。(有償版じゃないとグラボもDavinci Resolveもフルパワーを発揮できない)

DDRGDDRの互換性と相性

初歩的な話ですが一応しておきます。
メインメモリにはDDR4とかDDR5といった規格があって、メインメモリとマザーボードは同じ規格でないと使えません。そもそもソケット形状が違うので刺さらない。

一方、グラフィックボードにはGDDR5やGDDR6やGDDR6Xがありますが、仮にマザーボードがDDR2やDDR3対応の古い機種でも、グラフィックボードのGDDR6Xは問題なく稼働します。古いマザーボードだとパフォーマンスが出ませんが、ソケットは一緒なので刺さりますし、動くのは動きます。
なので、古いマザーボードでも新しいグラフィックボードは使えます。

Davinci Resolveって何や?

Davinci Resolveは、高性能な動画編集ソフト。買い切り式でライセンス取得が可能なので、AdobeのCC(Creative Cloud)のような月額・年額のコストが掛かりません。しかも無償版でも全然不自由しない機能で商用利用もできるソフトです。個人的には本当にコスパ最強の神ソフトだと感じます。

まずは有償版のDavinci Resolveを買うべき

Davinci Resolveの有償版と無償版ではグラボの振る舞いが異なります。たとえば無償版ではエンコードでNVENCが使えない(俗に言うハードウェアエンコード)。
高性能グラボをフルに活用したいなら、まずは有償版のDavinci Resolve Studioにしたほうが賢明です。そうじゃないと高いグラボを買っても意味がありません。

Davinci Resolveにおけるグラフィックボードの役割

Davinci Resolveでのパーツごとの役割
PCのパーツ Davinci Resolveでの役割
CPU デコード、エンコード、プロキシ生成など
グラフィックボード 作業時のエフェクト処理、作業時の処理全般、エンコード
メインメモリ(DRAM VRAMとの橋渡し

ソフトの性能がどのパーツに大きく依存するかは使用する編集ソフトによって違いますが、Davinci Resolveの場合はCPUよりもグラフィックボード性能に大きく依存しています。

WindowsのDavinci ResolveでRadeonを使ってはいけない理由

冒頭で触れた「後述部分」をここで説明します。

  • OSがMacならNVIDIA製(GeForce等)でもAMD製(Radeon等)でも良い
  • でもWindowsならNVIDIA製(GeForce等)にするべき

なぜなら、WindowsのDavinci ResolveではRadeonの性能を十分に引き出せないからです。

RadeonMetalというAPIで動作するのが理想です。MacでRadeonを使えばMetalで動作するのですが、WindowsではMetalではなくOpenCLで動作してしまいます。これが良くない。なのでWindowsならNVIDIA製を買うべきなんです。NVIDIA製ならCUDAで動作するからです。

ちなみにMacならNVIDIA製でもAMD製でもどっちでもOK。でもDavinci ResolveはMetalに最適化されているらしいので、同じ価格帯、同じベンチマークスコアという条件ならば、AMD製のほうが動作が軽くなります。もちろん、NVidiaの圧倒的に高性能なグラボならそっちのほうがパフォーマンスは高いですが。

詳細は下記リンクでも紹介しています。

解像度別のおすすめのグラボはこちらで紹介しています。

6 GBと8 GB、どっちがいいのか

Davinci Resolve上でのグラフィックボードの優劣は、Flopsの数値、またはベンチマークスコアに直結すると言われています。同じクラスの製品を比較した場合、メモリの容量やFlopsの数値が大きい方がDavinci Resolveには適しているということです。

同価格帯で比較した場合、GeForceのほうがベンチマークスコアは優勢の場合が多いですが、AMD製のほうが価格が安くてVRAM容量が大きいことが多いので、この数値を見てどっちにしようか悩んでいる人もいると思います。(私がそうでした)

上でもRadeonはダメだという話に触れました。まぁ結論としてはGeforceを買うべきなんですが、この悩みを払拭するきっかけをくれたのが下の動画。
この動画で検証しているのは次の3つですが、とても興味深い結果です。

  • GTX 1060
  • RX 480
  • GTX 980

動画を見ると、ベンチマークスコアではグラボごとの特色が見えてくるものの、やはりレンダリングではそこまで大差が無いように見えます。(1分53秒から)

レンダリングでも一応グラフィックボードは活躍していてその処理時間に影響を与えるはずですが、レンダリングでここまで差が無いとなると、編集作業中のエフェクト処理でも同様の結果になるのではないかと考えます。

一方で、グラフィックボードの種類によってはCPUGPUの受け持つ負担率が違うという話もあるようです。1080 TiRX 580はLuts処理で80%使用すると言っています。

でもだからといって、「じゃあ本体価格が安いAMD製でいいやん!」とはならない。

  • まず、どんぐりの背比べだから。フルHD(1920*1080)程度であれば結局どれも体感差はそこまで無いと思う。でも、もし4K画質を視野にしているなら最上位クラスのグラボを買うべき。最低でも◯◯60Tiクラスの性能を持つグラボ。

  • もう1つの理由は電気代。同世代・同価格帯でFLOPSが高いのはオーバークロックに頼っていることが多く、電気代までトータルで考えると割高になる。しかも熱もファンの騒音も大きい。Davinci Resolveでアフレコする人には結構厄介。

  • あとはDavinci Resolve以外のソフト(例えばネットゲーム)などをしているなら、ゲームではGeforceのほうが有利なことが多い。

旧世代であっても、VRAMが多いRadeonのほうが、エラー落ちの発生は少ないです。でもランニングコストが悪いこと、APIの違いによってRadeonのほうが遅いこと、他のソフトでの汎用性等を考えるとNVidia製の方がトータルでは有利になることが多いと思います。

一般説ではこうです。

  • 4K60fpsなら最低でもグラボメモリ8 GB必要
  • 8K60fpsなら最低でもグラボメモリ16 GB必要
  • じゃないとMemory Fullのエラーの要因になる

個人的には4K24pでも8 GB以上のほうが無難だと感じますね。

でもこれって、逆に言えばフルHD(1920*1080)程度ならVRAMが8 GBも要らないとも言えるんですよね。いや、そりゃ多いほうが処理もスムーズだしレンダリングも安定するのでいいんですが、現状のグラフィックボードの市場価格を見るに、2倍も3倍もお金を費やしてまで4K用スペックを買う意味があるのか?というところなんですよね。ガチ勢ならともかく、ライトユーザーにとっては。

GPUメモリ2 GBでもDavinci Resolveは動くのか

私のPCで検証してみました。仕様は以下の通り。

  • CPU: Core i7 3820
  • MB: X79
  • RAM: 24 GB PC3-15000 (DDR3-1866) 8 GB*3枚
  • GPU: NVidia GeForce GTX 660 Ti

かなり年季が入ってる。結論から言うと、動くっちゃ動くけど重いし固まりやすいし落ちやすい。

まずタスクマネージャーを見てみると、Davinci Resolveを開いただけで専有GPUメモリ使用量が 1.7 GB/2.0 GB になっています。(メモリが13.6/23.9GBとかになってますけど、10 GBくらいはChromeに使われています。Chromeを閉じても専有GPUメモリ使用量は 1.3 GB/2.0 GB

Davinci Resolveを起動した状態のPCのパフォーマンス

例えば、FHDの動画をメディアプールに取り込み、最適化メディアを生成して、クリップを切り貼りして、BGM、字幕、効果音を付けるだけなら一応問題なく編集作業はできます。ちょっとカクつくこともありますけど、そこまで支障はありません。

ところが、Fusionページ等でノードを1つ追加してあれこれするとあっという間にフリーズ、落ちる。特に、4K画質だと静止画ですらFusionページでエフェクトを掛けると一気に重くなりますね。↓↓↓

Davinci ResolveのFusionページで動画編集中にクラッシュした瞬間

上の画像見たらわかると思うんですけど、負荷をかけた瞬間、専有GPUメモリ使用量がちょっと増加して、天井に当たるかと思ったらクラッシュして落ち込んでいるんです。CPUGPUが頑張る以前の話。

CPUとかGPUが頑張っていないときでもGPUメモリだけがあっぷあっぷ状態で、CPU等の性能以前にビデオメモリの不足が作業時の重さの要因だと考えられます。

色んな設定変更で緩和はできますけど、ほぼ焼け石に水ですね。この状態で1つだけパーツを買い換えるなら間違いなくグラフィックボードです。

メインメモリやグラフィックメモリに関する情報

  • Davinci Resolveに必要なメインメモリ容量
  • Davinci Resolveで使えるVRAMの量

これについては別ページにまとめているのでそちらを参照ください。

グラボは2枚より高性能1枚刺しがオススメ

基本的には1枚刺しがオススメです。基本的には

  • 安いのを2枚刺しより高性能1枚のほうがいい。(2枚刺しをしてもOSはメモリが2倍とは認識しない)

  • なぜなら、無償版Davinci Resolveはグラフィックボードを1枚しか認識しないから。

  • 更に、有償版でもマルチGPUに対応していないエフェクトがあるから。(「時間的ノイズリダクション」と「オプティカルフロー」という一部のエフェクト、外部のオープンFXなど)

  • NVLinkのSLIやCrossfireXなら2枚刺しで容量が2倍の認識になるという情報あり(でも実質的な性能向上効果は1.3~1.5倍ほど)

ただし例外もあります。

種類の違うグラボを組み合わせる

Windows OSで有償版Davinci Resolve StudioとAMD CPUを使っている場合、これは非常に有効的です。

例えば、NVIDIAの最新版ハイエンドグラボをメインに使用しつつ、2枚目としてIntel Arcを併用すると、AMD CPUでは処理できないデコード処理・GUI処理をIntel Arcが担い、編集環境が劇的な改善する場合があります。

詳細は下記リンクを参照ください。

RTXシリーズやQuadroなら2枚刺しでも効果が高いか

GeForceのRTX 20シリーズ(NVLink対応)やRTX 3090やQuadroなら、2枚刺しでメモリをちゃんと2倍認識してくれるという話もあります。「未検証なのでもしかしたらQuadroだけかもしれない」というちょっと不確かな情報。

NVLinkじゃないとマルチGPUは無意味?

Davinci Resolveで2枚刺しが有効になるのはNVLink対応で専用のブリッジ端子を持つモデルのみです。ここ注意。

Davinci Resolveでのグラボ2枚刺しの詳細は以下の動画を見てね。

ただし上でも述べたように、NVLINK無しでも環境設定で高性能側はCUDA、低性能側はGUIに設定することで処理を分散させてレンダリング速度を向上させている人も実際にいます。でもNVLINKじゃないですから、あくまでもメモリ認識は1枚分だけのはずですし、メインの処理には1枚しか機能していないはずです。

他のパーツがボトルネックになるうる

現状の他のパーツが古いと、グラフィックボードだけ高性能なものにしても十分に効果が発揮できません。超高性能なのを買うんだったら「メモリもCPUもマザーボードも全部買い換えるべき」てなっちゃう。

いや、もちろん全部買い換えも1つの手ではあるんです。最近だとAMDのCPUコスパが非常に優秀ですからね。

RTX IOがボトルネックを解消する一助になるかも

ただし!!

ただしですよ、2020年9月に発表されたRTX IOという技術を利用できれば、古いPCでもDavinci Resolveをサクサクと軽く動かせるかもしれません。

RTX IO

Windowsとコラボした技術で、ストレージとGPU間の速度を最大100倍にできるダイレクトストレージAPI。端的に言うと、グラボがPCIe経由で直接HDDSSDのデータを展開・圧縮できる技術。ボトルネックになるCPUSDRAMを介さないことで高速化し、CPU負荷も大幅に低減する。

CPUを介する従来型のデータの流れ
RTX IOによるデータの流れ
規格別の処理速度
規格 処理速度 消費CPUコア数
RTX IO 14 GB/s 0.5
Gen4 SSD Compressed 14 GB/s 24
Gen4 SSD 7 GB/s 2
SATA SSD 0.5 GB/s 0.2
SATA HDD 0.2 GB/s 0.1

ということは、CPUが古くても、良いグラボを積むだけでパソコンを丸ごと買い換えるかのような大きな恩恵を得られるかもしれないということです。

でもこれには2つの懸念があります。

1つ目:CPUがメインとなる処理では恩恵は無いのでは?

例えば最適化メディアの生成やレンダーキャッシュの生成にはCPUが大きく動く。もしこれらの処理をグラフィックボードがしてくれないのなら、効果の期待は薄い。

2つ目:結局ストレージ自体がボトルネックになる

NVMe M.2 SSD以上の性能のストレージじゃないと恩恵が得られないんじゃないかといことです。仮にストレージと直結できたとしてもストレージ自体がボトルネックになりますからね。

なので、この技術が効果を発揮するのはこんな環境ではないでしょうか。

  • ストレージ自体が高速通信できる環境
  • 現状よりも大幅に向上したネットワーク環境

だって、NVIDIAが言っている14 GB/sって100 Gbps(100メガじゃないよ)のネット環境でもフルカバーできる計算ですからね。
もちろん、CPUの負荷が減る分、CPUは他の仕事ができるので、CPUがショボければショボいほど恩恵は大きいのですが、それと同時にストレージの通信規格がショボければショボいほど恩恵は少ないということになります。

ちなみに、このRTX IOという技術は過去のグラフィックボード、例えばPascal世代(GeForce 1000シリーズ等)でも使えるとのこと。ソース記事:西川善司さんの記事

解像度別のおすすめのグラボはこちらで紹介しています。

参考資料