機械学習のためのMetal

WWDC19に戻る

機械学習のためのMetal

Metal Performance Shaders（MPS）には、機械学習およびGPUのパワフルな性能を活用するために不可欠な、データ並列処理プリミティブの厳選されたライブラリが収められています。iOS 13とmacOS Catalinaでは、MPSによってパフォーマンスが向上し、より多くのニューラルネットワークを活用できるようになりました。しかも、これまでより簡単に使用できるようになっています。このセッションでは、MPSのこうした向上点と、スタイル変換のような革新的なテクニックを実装するための実践的な方法について説明します。

リソース
関連ビデオ

Tech Talks
- Ａ14 BionicのMetal性能の向上について
WWDC20
- Metal Performance Shaders GraphでカスタムMLモデルを構築する
WWDC19
(音楽)
(拍手) こんにちは私はジャスティン GPUソフトウェア担当ですようこそ Metal for Machine Learningへ
Metal Performance Shaders フレームワークと機械学習の新機能を紹介します
MPSは GPUで加速化したプリミティブのコレクションで GPU内のMetalの能力を最大化します MPSは画像処理や線形代数レイトレーシングや機械学習用のカーネルを提供します
このカーネルは推論と訓練をサポートし iOS Mac OS tvOS用に最適化されています
MPSはグラフAPIを介してニューラルネットワークの構築法も示します
これはエコシステム内の MPSの役割を表したものです上位層に Core MLとCreate MLがありネットワークの実装が容易になります更に柔軟性と制御性を持たせたい場合は MPSのようなフレームワークが有用です
私たちは今年機械学習に新機能を追加しましたネットワークをよりサポートするカーネルを加え
既存ネットワークの性能も改善しました MPS自体も使いやすくしました
機械学習において推論と訓練がどのように機能するのかお話しますまずは概要からです
推論という過程では入力された情報に基づきこの例のように推論結果を出力しますこのネットワークは畳み込みやニューロン活性化など様々な機能から成りますこれらのレイヤはパラメータに依存しており推論の段階ではパラメータは固定されていますそして訓練過程で値が決定されます
訓練の過程ではネットワークに多数の画像を読み込ませます画像分類を繰り返し行うことでパラメータが更新されます各ネットワークのパラメータ機能が向上し画像分類に最適なパラメータが生成されるのです
こうして推論で用いるパラメータが完成します
では MPSの使い方を見ていきましょう実際には推論と訓練はもっと奥が深いので過去のセッションで詳細をご覧ください
今回推論と訓練のネットワークのサポート対象を広げましたまず暗黙的な作成機能によりネットワークのグラフ作成をシンプルにしました
Separable lossレイヤと乱数生成にカーネルを追加し多くのネットワークを対象にしました更に Predicationという機能を追加し MPSのコミット性能も向上させました
では暗黙的グラフ作成を説明します
推論グラフから訓練グラフを暗黙的に作るものですまずネットワーク用のグラフ作成について復習しましょうこちらは推論ネットワークですその構成は畳み込み層とプーリング層そして全結合層です
グラフ作成のために各層のノードを用意します畳み込み層用の畳み込みノードやプーリング層用のプーリングノードです全結合層には全結合ノードを設定します
推論グラフが定義されたので訓練グラフに拡張します
まず推論グラフの最後に損失ノードを置きます
続いて勾配ノードを追加し推論グラフと逆順に設定します
こちらがコードです初めに損失ノードを設定し
勾配ノードを順番に追加していきます
勾配ノードは容易に作れることが分かりましたが暗黙的グラフ作成ではより簡単になります
損失ノードで勾配画像を初期化すれば推論グラフに対応する訓練グラフが作れます
また損失ノードを設定し
コードを１行作れば訓練グラフの完成です
これは損失ノードを元に作りました SourceGradientに nil引数を用いると損失ノードにより勾配画像が初期化されます別の画像でも可能です
更にノードハンドラもnilとしますハンドラに備わっているブロックでノードを構成するカスタムコードを実行できます
もう１つの便利な機能が Stop gradientプロパティです通常訓練シーケンスを生成すると訓練可能なレイヤが重みを更新しますここでは畳み込み層と全結合層が該当しますが一部のみを更新したい場合もあるでしょう例えば転移学習です多くのレイヤに訓練済みの重みを用いますが一部を訓練したい場合があります全結合層だとしましょう
暗黙的グラフ作成はこのようなネットワーク用のグラフ作成をサポートします
では Stop gradientプロパティを該当する１つ目の層に設定します全結合層で試しましょう
グラフが作成されても続く勾配ノードは作られません
このように暗黙的グラフ作成を用いると容易に訓練グラフを生成できます
次の新しい機能を紹介しましょう Separable lossカーネルです
先ほど MPS CNN損失を用いた損失ノードの使い方を説明しました softmaxレイヤの結果のような最終画像やデータを基に誤差逆伝播法を行うための勾配値を計算しますしかし複数の中間損失値を用いるネットワークもありますそこで前方と勾配の損失カーネルを追加しました前方損失ノードから２つの損失値が出たので双方の結果を加算して最終損失を算出しますそして…
誤差逆伝播法を行うため勾配値を初期化します
その前に初期勾配カーネルを設定しておきますこれにより勾配画像が作られ最終損失の結果によりサイズが決定されます
勾配値が初期化されたので誤差逆伝播法を用います Addition勾配を前方のカーネルと― 各損失カーネルに使います
次に Separable lossを用いるネットワークの中からスタイル変換を紹介しましょう
元の画像とスタイル画像を組み合わせた画像を作るものです
このモデルはMPSで実装できるものです
推論のネットワークは変換ノードを含み畳み込み層や正規化層で構成されていますその重みは訓練されたパラメータを作りますそしてスタイルが取り込まれます訓練過程でパラメータが学習するのです実際に見てみましょう
これはネットワークの概要です
画像をスタイル変換するため推論段階で変換器を用いますこちらはネットワークが現段階で最適だと推測した― スタイル変換後の画像です
目的は２つの画像の合成なので２種類の損失値が必要です
１つ目はスタイル損失ネットワークから算出される値ですこの損失値はネットワークが理想の変換画像を作るのに役立ちます完成した画像が元の画像の要素を含むことも確実にしたい点ですそこでコンテンツ損失ネットワークを使います
ここで用いるのが新しい前方損失カーネルです
まずスタイル損失ネットワークの詳細を説明しますスタイル損失を算出するためスタイルの測定が必要ですそこで画像の中間特徴表現に対してグラム行列を計算します
グラム行列はMPSにおいて前方と勾配のカーネルでサポートされていますではグラム行列と計算方法を見てみましょうグラム行列は特徴ベクトル間の相互相関を表します特徴ベクトルは特徴チャネルの画像を空間的に平坦化したものです
グラム行列を作るためベクトル間の内積を計算しますネットワークに戻りましょうグラム行列の前にもう１点ありますスタイルとスタイル化された画像からの特徴抽出には VGG画像分類ネットワークを使います
グラム行列は特徴ベクトル間の相関を表しますスタイル画像から特徴ベクトルを取り出すと利用したいスタイルのグラウンドトゥルースが得られます理想のスタイル化画像についても同様の処理をしますそしてこれら２つの値でスタイル損失を算出します
続いてコンテンツ損失ネットワークです
先ほどのように VGGで特徴を抽出しスタイル化画像の特徴も含めて損失値を算出します最終的にコンテンツ損失とスタイル損失を合算します次は MPSで値を計算し勾配を初期化する方法です
まず VGGが生成した特徴表現があるとしますグラム行列の計算ノードを追加しスタイル画像とスタイル化画像を計算させます
得られた結果を損失ノードに渡して損失値を算出させますここでのソース画像はスタイル化画像用のグラム行列の計算結果です
参照スタイル画像のグラム行列はラベル引数で使います
これは前方損失カーネルの重要な機能です以前は MPSステートオブジェクトでラベルを渡しましたが今は MPS画像が使えます
元の画像とスタイル化画像の特徴によりコンテンツ損失用の損失ノードを追加できますそれらを合算したのが損失値です
次は誤差逆伝播法を行うため最終損失勾配を初期化します
初期勾配ノードを使いましょう
損失ノードの結果が訓練グラフの生成に使えるのは初期勾配を生成するからですここでは Separable lossカーネルで初期勾配ノードを使って実行しますこのノードを使って訓練グラフを作ります
では実際にネットワークの動作を見てみましょう
スタイル変換ネットワークが GPU上でMPSを使って稼働しました MacBook Pro上で Radeon Pro 560 グラフィックス･カードを使用しました
こちらはスタイル変換訓練のイテレーションの過程ですスタイルが徐々に組み込まれつつも元の要素は保たれています訓練の過程を分かりやすくするためイテレーションのスピードは実際より速くしています
続いて紹介する新しい機能は乱数生成です
MPSに２種類の乱数生成器を加えました Mersenne Twisterの１つである MTGP32と Philoxと呼ばれるカウンタベースの発生器ですいずれもアルゴリズムが GPUの構造に合っていますし良質の統計的性質を持つ乱数列を提供してくれます
これらのカーネルがあればバッファとGPUメモリを使って大きな乱数列を生成できます結果は GPUメモリで利用できるので CPUと情報を同期させる必要がありません乱数生成は機械学習のアプリケーションにおいて重要ですネットワークの重みを訓練用に初期化したり GANのような敵対的生成ネットワークの訓練に有用です GANは特に重要な事例です訓練のイテレーションでは様々なデータが必要です
CPUの数字配列を同期する必要があればイテレーションの度に膨大なコストがかかります
では乱数生成の方法を見ていきましょう
GANは２つのネットワークから成ります生成器ネットワークと識別器ネットワークですこれは生成器が作った手書きの数字の画像です
ネットワークに多数の手書きの数字の画像を与えても画像分類は行いませんランダムなデータセットから訓練用の画像に似た画像を新たに生成するのです
この訓練プロセスを実行するには類似した画像を判断する方法が必要でした２つ目の識別器ネットワークです
名前が示すように訓練画像と生成器が作った似ている画像を識別します画像分類ネットワークとして機能するので入力データが本物かまたは偽物か識別します
このように識別器が数字の画像を読み本物かどうか判断します
生成器と識別器は同時に訓練します生成器はより現実的な画像を作り識別器はその精度を高めるよう訓練しました
これは訓練ネットワークのハイレベルな概要です
識別器訓練ネットワークは２つの損失計算から成りますここで Separable lossノードを使えます１つ目の損失により作られた画像が偽物だと識別できるようになっています２つ目の損失では画像が本物かどうか分かるように訓練しました
損失値を計算したら初期勾配ノードを用いて訓練グラフを初期化します
続いて生成器訓練ネットワークこちらは損失値が１つですこの場合は“本物”というラベルを用いて識別器が本物と見なす画像を生成器が作りますお伝えしたように生成器ネットワークは乱数生成で使うランダムなデータから始めますでは乱数生成について見てみましょう
乱数生成カーネルは MPSMatrixのサブフレームワークに属し Randomクラスを通してアクセスされますつまりMetalバッファで動作することになります
乱数生成をサポートし― 一様分布で浮動小数点値の生成も可能です
ここで作成するのが分布記述子で０から１までの値を一様に分布させます
そして生成器を作り―
適切なデータ型をテストして初期値を与えます
最後に結果を保持する行列を作りその操作をコマンドバッファにエンコードしますネットワーク図で確認しましょう
生成器ネットワークの詳細です畳み込み層 ReLu層双曲線正接ニューロンがあります
入力画像は乱数生成器の出力になります乱数生成器は行列を処理しますがニューラルネットワークカーネルとグラフには画像が必要ですそのため MPSのコピーカーネルでデータを行列から画像にコピーします
まずランダムな値の行列を作ります
ネットワークに入力される画像も作成します
コピーカーネルを初期化してコピーを実行したら―
乱数生成器をエンコードして値を生成しますそれを画像にコピーさせたら次はその画像を使ってネットワークをエンコードします
今のネットワークにや乱数生成カーネルの詳細はオンラインの資料をご覧ください
私たちはMPSを使ってネットワークの動作と効率を向上する機能も追加しました Predicationです
MPSカーネルを条件付きで実行できる機能ですカーネルの実行は GPUメモリの値に基づいており実行時に参照されます
ネットワークを見てみましょう画像キャプショニングですこれは数年前のもので CNNとRNNを使ってキャプションを生成します
CNNは分類ネットワークでここで使うInception v3は画像から特徴を抽出します
次に特徴マップを取り出し LSTMネットワークに送ると特徴からキャプションが作られますこれを繰り返し画像キャプションを作成します
ここで注意すべきは LSTMネットワークを何度もイテレーションする必要があるということですキャプション生成に十分な回数を反復して行いますこのケースでは 20回稼働させました
イテレーションごとに単語を追加し最適なキャプションを生みます
５文字までという制限がある場合はより多く稼働させる必要があります
Predicationを用いると速く実行できます５文字を生成すれば実行終了です次は MSPにおける使い方ですその前に MPSコマンドに述語値を提供する方法を説明するため MPSCommandBufferを紹介します
MTLCommandBufferプロトコルに準拠したクラスですがより柔軟性があります Metalのコマンドバッファを用いる所で使えますし MTLCommandQueueから構築されています
また重要なメリットもあります MPSカーネルを実行させることができますまた MPSの機能をエンコードする際 CommitAndContinueを使って中間コミットを簡単に実行できますまずは MPSカーネルに述語を提供するために MPSCommandBufferを使う方法です
MPS述語オブジェクトには 32ビット整数の述語値を含む Metalバッファがオフセットにありますそこにある値を実行の述語とします０の値はカーネルを実行しないということ０以外の値は実行することを意味しますここではオフセットの値を０に設定してカーネルの実行を回避しました MPSの述語オブジェクト間で Metalバッファを共有し複数のカーネルに送れます述語値はそれぞれ異なるオフセットで参照されます
述語値を使うために MPSCommandBufferにアタッチするとコマンドバッファにエンコードした MPSカーネルが述語値を認識します次は述語を作成しMPSCommandBufferに設定する方法です
まず MPSPredicateオブジェクトを作り―
MPSCommandBufferに述語をアタッチしますそして述語値を変える操作をエンコードします Metalバッファで結果を出すカーネルが必要だからです手元にあるものでも MPSMatrixカーネルでも構いませんまず MPSMatrixオブジェクトで述語をラップしたら述語値を修正するためカーネルをエンコードします
ここでは線形ニューロンカーネルを用いて述語値を減らすシンプルな作業をします
実行前に述語の値を読むため最後に CNNカーネルをエンコードします
MPSCommandBufferで述語を使うとネットワーク内の余分な作業を排除できます回避可能なカーネルがあれば作業負荷も減らせますカーネルが複数ある場合は複数の述語を使いオフセット値を設定して単一のバッファを使うことができます
続いて CommitAndContinueを紹介しましょう
作業時のGPUの利用を容易に向上できる機能です
まずは通常の作業負荷を確認しましょう MPSカーネルを実行する時コマンドバッファにエンコードしてからコミットしますこちらは単一のコマンドバッファで作業をエンコードした後に実行されます実際は CPUのエンコード時間は GPUより短いですがスロットリングなど時間の浪費避けたいところです
このように CPUとGPUの間で待機状態になっています
ダブルバッファリングを使うと解決できます
コマンドバッファを２つ確保しエンコードと実行を別々に行いますそのため無駄な時間を省けますが幾つか制約もありますコマンドバッファが２つ必要なので作業を別々の作業負荷に分けることが必須ですその分メモリ容量も大幅に増えます
CommitAndContinueで作業負荷を小さく分けることで性能を向上できますそこで各コマンドバッファ内の作業を細分化したらダブルバッファリングを用いて実行します
するとCommitAndContinueが細分化された処理を実行コマンドバッファに割り当てたオブジェクトも次のエンコードのために有効なままです
CPUでエンコードしながら GPUで作業を実行できます作業負荷を分割することでメモリを増設せずにすみますし GPU使用率も向上できますコードを確認しましょう
MTLCommandBufferにエンコードする MPSカーネルが４つあります
最後に作業を実行しますお伝えしたように待機状態になってしまいます
ただし MPSCommandBufferと CommitAndContinueを使うと改善できますそこで MPSCommandBufferを生成します２つのカーネルをエンコードし―
CommitAndContinueを呼び出します
エンコードした作業がコミットされ
次の２つのカーネルのエンコードを続行できます最後に残りの作業をコミットします
CommitAndContinueでコード変更はほぼ要りませんグラフを利用する場合は更に簡単です MPSCommandBufferを使ってグラフ内でMPSをエンコードすると CommitAndContinueが使われ定期的に作業が提示されます MTLCommandBufferの代わりに MPSCommandBufferを使えばいいのです
CommitAndContinueとダブルバッファリングを組み合わせると更に機能が向上しますわずかな待機状態さえも除けるのです
複数の選択肢がそろいました単一のコマンドバッファでも作業を実行できますしダブルバッファリングなら作業能力を向上できます
MPSCommandBufferを使えば CommitAndContinueと同じ結果を出せます
CommitAndContinueとダブルバッファリングなら更に効率がアップします
実際にネットワークでどう機能するか見てみます CIFAR-10データセットで実行した ResNet-50の例です使用したのはAMDの Radeon Pro Vega 64のGPUですネットワークが多くのレイヤを持つので CommitAndContinueが有用でしょう
単一バッファを基準にします縦軸は作業能力とメモリ使用量を示しますダブルバッファリングでは― 作業能力の向上とともにメモリ使用量も上昇しましたその間の作業量が２倍になるためです次はCommitAndContinueです作業能力は同程度ですがメモリ使用量は低いままです
CommitAndContinueとダブルバッファリングでは能力は高まりますがメモリ使用量が上がります
CommitAndContinueを使うと能力を高めつつメモリ使用を抑えられます
ではこれらの手法を使ってノイズ除去を試してみましょう
画像からノイズを除去しクリアな画像を生成します
これをレイトレーシングの観点で見ていきます
１つ前のセッションではノイズ除去の画像処理技術を紹介しましたここでは機械学習に基づく方法を話します
３つの段階がありますオフラインの訓練工程を作り訓練ネットワークを実行し推論グラフを展開して新しい画像をフィルタリングします
初めにグラフ作成です構造を見てみましょう
ここで入力する画像は
レイトレーサーで出力したノイズの多いものです
この画像をエンコーダに渡しますエンコーダは小さなサブネットでハイレベルの特徴を抽出しつつ画像を圧縮します
このデータをデコーダに渡すと逆の工程段階を経て画像を再構築します
スキップ接続も用いるとエンコーダからの画像特徴の送信が促されますデコーダに結果が転送されるのですそしてノイズ除去された画像が完成しますではエンコーダを詳しく見てみます
エンコーダ段階では特徴を学習しながら画像を圧縮します構成は畳み込み層とReLu層プーリング層ですこちらがコードです各ノードはネットワークと同順に構成されています
デコーダの構造も同じですまずアップサンプリング層次にスキップ接続を使いエンコーダ結果を加えます
続いて畳み込み層とReLu層があります
また各層にノードを挿入し―
エンコーダとデコーダをまとめます
まずエンコーダノードを接続します
ここでボトルネックというノードを１つ追加しますエンコーダの工程とプーリング層以外は同じです
その後デコーダノードに接続しますエンコーダノードから結果の画像を渡しスキップ接続を成立させます
推論グラフの次は訓練です
まずは損失値を計算しますノイズ除去された画像でネットワークが推測した結果を訓練のイテレーションで使います
クリアなRGB画像を損失値の計算に使います２番目の損失を計算するにはエッジ検出を行います Laplacian of Gaussianフィルタを使いますネットワークにノイズ除去を学習させるためと元の画像のエッジを維持するためです
畳み込みを使い Laplacian of Gaussianを実装します
こうして作られた１つ目のRGB損失と２つ目のLoG損失を合わせて最終損失とします
より詳しく見てみましょう推論グラフの結果とグラウンドトゥルースRGB画像で RBG損失ノードを作ります
Separable lossカーネルを使えますので画像をソースとラベルに渡します
LoG損失の場合も対象のRBG画像にフィルタを適用します
畳み込みノードで LoGフィルタを実装します
その結果を基に LoG損失を計算して
双方の値を合計すると最終損失を算出できます
最終損失が準備できたので訓練グラフに進みます先ほどと同様に初期勾配を計算し訓練グラフを構築します
まず加算用の勾配ノードと損失の勾配ノードがありエンコーダとデコーダへと続きます各レイヤにノードを実装するとコードの量も増えエラーも発生しやすくなりますしかし暗黙的グラフ作成ではすべてをグラフに任せられます
こちらが訓練グラフのコードです
損失結果に基づき勾配ノードを設定して―
暗黙的グラフ作成で残りの勾配ノードを作ります
これで訓練が実行できます
まず理想的な結果が出るような画像を入力しますノイズの多い画像とクリアな画像がありますいずれもレイトレーサーを使って生成しましたノイズの多い画像は短時間で完成しましたがクリアな画像は時間をかけて作りました
クリアな画像に近づくようネットワークを学習させます入力データを増やすため他のレイトレーサーの画像も使います表面法線とアルベドですアルベド画像は反射光量に対する値を含む― ３チャネルの画像です
表面法線も３チャネル画像で各チャネルは表面法線ベクトルの要素を含みます
訓練の前に前処理をしましょう
いずれも３チャネルにデータを含みます
しかし MPSネットワークと MPS CNNカーネルは画像を４チャネルとして扱いますそのため３つを結合させます
１つのMetalテクスチャ配列にまとめる必要があるのです特徴チャネルは４の倍数で要求されるためですそれを可能にするカーネルがあります Metal計算シェーダを用いて結合します
まず画像を４チャネルピクセルのグリッドに分けます
引数は結合した画像や RGB画像アルベド画像通常の画像の要素を持つ結果となります
そこでスレッドにグリッド内のピクセルを読ませます
これらの値を結合させて残りの未使用チャンネルに０を充てます
グリッドの同位置に結果を反映させて完成です値を結合して MPS画像にするシェーダができたのでグラフを見てみましょうその前にエンコードの方法ですこれは MPS画像に結果を含める例ですデータを含む画像を入力し―
結果をグラフに入れるため MPS画像を作りますテクスチャで結合カーネルの結果を保持します
次に引数を適切な位置に固定しますスレッドを実行してネットワークに渡るよう最後に画像を戻します続いて訓練グラフの実行についてです訓練中はグラフを何度も実行します各訓練セット内で複数のバッチを実行し次にエポックごとにバッチを実行します
訓練グラフの１つのイテレーションですバッチ内の各画像以外をカーネルで連結します
グラフはソース画像用とラベル用に画像が要るためこれらを配列にまとめます
MPSCommandBufferを使うのは GPU使用率の改善するからです最後にグラフをエンコードしてコミットさせます
各エポックも詳しく見ましょうここでは訓練データを処理しコンバージェンスを向上します今回は100エポックごとに訓練セットを更新してネットワーク検証も実行しますそして1000エポックごとにオプティマイザの学習率を下げますまずエポックごとに訓練セットを処理します
100エポックごとに訓練セットを更新し検証を行い― 1000エポックごとに学習率を半分にします
訓練が完了したのでノイズ除去を実行します MPSは多くの環境で利用可能なので訓練ネットワークを様々なデバイスで展開できます例えば Macで訓練を実行していて iPadで画像を処理するためネットワークを使いたい場合などです
MPSのシリアライズのサポートを見てみましょうグラフやMPSカーネルはセキュアコーディングに対応していますおかげでネットワークの保存や復元が可能ですソースから重みをつけるネットワークの場合は自分でセキュアコーディングを実装する必要があります
これはsupportsSecureCodingやinit encodeWithCoderメソッドが必要ですデータソースがセキュアコーディングに適合したらグラフをシリアライズして保存できますまずグラフをエンコードするコーダーを作り encodeWithCoderをコールこの時各カーネルがシリアライズされデータソースを持つ場合も同様にシリアライズされますアーカイブ結果にはグラフの復元と初期化に― 必要な情報が含まれます最後にデータをファイルに保存します
次はローディングです
カーネルがMetalデバイスで初期化されるよう MPSKeyedUnarchiverを置きますこれはMetalで初期化されておりデバイスを全カーネルに提供しますデータをロードした後 Unarchiverを作成しますグラフを復元しネットワークが初期化されたら画像のノイズ除去が可能です実際に動かしてみましょう
ノイズ除去を適用したシーンです一番上の領域がノイズの多い画像で中央がノイズ除去の結果です下がグラウンドトゥルースの画像です中央と下の領域は同じようにクリアですレイトレーサーをフル稼働せずに実現できました
MPSを用いるとノイズ除去やスタイル変換が簡単です
今回推論と訓練のサポートを拡張し Separable lossや乱数生成機能を含めましたまた MPSCommandBufferにより PredicationやCommitAndContinueで性能や使用率を改善しました暗黙的グラフ作成で全機能が使いやすくなりました
MPSとMetalについてはオンライン資料もご覧ください MPSとレイトレーシングについては Metal for Ray Tracingをご覧くださいありがとう (拍手)

リソース

関連ビデオ

Tech Talks

WWDC20

WWDC19