Performing Calculations on a GPU
ダウンロードして読んでみたら割と手頃だったのでメモ。
Getting started with Metal-cpp - Metal - Apple Developer
C++用のヘッダが別配布であるらしい。C++17との事だが、iOSとMacでしかMetalは使わないので問題無いかな。 ライセンスはApache 2.0。SDKに含めておいてよ、という気はするけれど、Apache 2.0ならまぁいいか。
このページにはXCodeの設定も書いてある。Foundation, QuartzCore, Metalをリンクに足せと言っている。
サンプルのツイート これはサンプルへのリンクっぽい。
HalideのCMakeList.txtを見ているとこの辺をやっている場所は良く分からないな。Makefileはframework Metalとframekwork Foundationを足しているが…
ただ、TEST_METALというのが定義されて、それがgpu_context.hで
#include <Metal/MTLCommandQueue.h>
#include <Metal/MTLDevice.h>
をincludeするようにはなっている。これは上記のC++のヘッダじゃなくてobjCのヘッダに見える。
さらに調べたら、細かいifなどを取り除くと以下みたいな文が見つかった。
find_library(METAL_LIBRARY Metal)
target_link_libraries(${TARGET} ${VISIBILITY} "${METAL_LIBRARY}")
find_library(FOUNDATION_LIBRARY Foundation)
target_link_libraries(${TARGET} ${VISIBILITY} "${FOUNDATION_LIBRARY}")
HalideGeneratorHelpers.cmakeという中に見つかった。これはCMakeLists.txtからincludeされてるし、これっぽいな。
amazon: 基礎から学ぶ Metal〜MetalによるGPUプログラミング入門
サンプルでも十分な気はしたが、本の方がBOOXで読みやすいのでポチってみた。
CHAPTER 3までは一通り読み、CHAPTER 04は必要そうな所だけ読んだ。CHAPTER 05は読んでない。 感想としてはなかなか良い。
Appleの公式のドキュメントは必要な事がいろいろなドキュメントに散らばっていて、 いろんな所を突き合わせて読む必要があってなかなかかったるい。 でもこの本は最初から順番に読んでいけば入門的な内容を学ぶ事ができる。
題材がHello World的過ぎて、意味のあるプログラムはこの本だけでは書けるようにはならないと思う。 その代わり、意味のあるプログラムの手前までが一通りまとまっているので、 この本だけ読めばOpenGLやOpenCLプログラマだったら必要な事を学べると思う。 GPGPU関連はボイラープレート的なコードが多くて、OpenCLなどとの一番の違いがその辺になるので、 手前の部分がちゃんとまとまっているのは十分に価値がある。
OpenGLやOpenCLプログラマにとっては記述は少し冗長で、 ほとんど一行のコードをもう一回再掲してさらにその関数名と全く同じ事を日本語で一行書くだけ、 みたいなのがちょくちょくある。 ただ読むのがかったるくなるほどでも無いのでこれでいいんじゃないか、と思う。
もうちょっと実際のiPadやiPhone上で使った時の話が多いと良いのになぁ、とは思うが、 このくらいでも十分買う価値はあった。
Graphics & Games - Videos - Apple Developer から見た動画のメモなど。
Tune CPU job scheduling for Apple silicon games - Tech Talks - Videos - Apple Developer
見る価値無し。Metalじゃないし、スレッドを下手につかうとダメですよ、という話で、ほとんどがGCDを使えば避けられるような事。
Metal Compute on MacBook Pro - Tech Talks - Videos - Apple Developer
M1 MaxやM1 Pro上でのアーキテクチャから見たMetalの話。概要ではあるがなかなか良い。 UMAで32GBマシンだと20GBくらいGPUから使えるとかそういう話がある。 あとTextureとBufferでキャッシュが別々だから両方使えば倍だぜ、とか(両方つかうのは自分たちの用途では難しそうだが)。
終盤はWWDC 20 Optimize Metal Performance for Apple Silicon Macs を見る方が良いらしい。 この動画も見たいね。
Halideのコードを読んでこの辺を軽く調べた。
HalideのMetalバックエンド周辺のコード読みメモ - なーんだ、ただの水たまりじゃないか
Metal Shading Language Specificationの2.1にスカラーのサイズがある。
intは32bitでint32_tと同じ。
良くごっちゃになるので。 Gridが全体のサイズ、thread groupは個々のthread groupのこと。
Calculating Threadgroup and Grid Sizes ー Apple Developer Documentation
M1の話だが、なかなか情報量が多いのでメモ。
Scale compute workloads across Apple GPUs - WWDC22 - Videos - Apple Developer