(GPU購入不要)格安GPUクラウド(vast.ai)でのStable Diffusion AUTOMATIC1111 ver1.1環境構築解説

(GPU購入不要)格安GPUクラウド(vast.ai)でのStable Diffusion AUTOMATIC1111 ver1.1環境構築解説

格安GPUクラウドサービス vast.aiでStable Diffusion AUTOMATIC1111 ver1.1を環境構築する方法を解説します。 LocalPCにGPUを用意しなくても、普通のwindows/macos/linuxのLocalPCからクラウドのGPU環境に構築可能です。 ご質問あれば気軽にどうぞ(GW中は家族サービスで昼間PCを開けませんので返信は夜になりそうです)

2023/05/03 ver * 各工程の解説githubページ:https://github.com/spacewalkerjp/stablediffusion_AUTOMATIC1111_WebUI_setup_for_vast.ai/blob/main/README.md



[1*] 今回はvast.aiでも既に用意されているAUTOMATIC1111のイメージではなく、NVIDIA公式のDocker Image `nvidia/cuda:11.8.0-cudnn8-runtime-ubuntu22.04`をベースに環境構築を行います。 この方が、最新のAUTOMATIC1111の状況に追いつきますし、必要最低限の構築を理解しながら進められるので様々なextensionなどハックが進んでいるAUTOMATIC1111を扱うにも良いのでは?と思っています。 今回の解説は私流の1アプローチですのでこれをベースに更にスクリプトやDockerImageを作成して構築を自動化させるなど工夫いただければと思います。

[2*] 動画で解説している私のLocalPC環境: Windows 11 Pro(64bit) + WindowsTerminal + (PowerShell7.3) + OpenSSH(デフォルトインストール済み)

[3*] 動画中で生成している画像のプロンプトなどの情報(Model : BRAv5) Prompt: masterpiece, best quality, 1girl, profile face, stunning face, blue background, blurry, earrings, red brilliant dress Negative prompt: bad anatomy, (bad-artist:0.5), (worst quality, low quality, bad quality:1.8), lowres, (red, yellow, orange:1.3) Info: Steps: 28, Sampler: DPM++ 2S a Karras, CFG scale: 11, Seed: 3170388393, Size: 768×512, Model hash: 4ef8f0c10f, Model: BRAV5beta Special Thanks : @BanKaiPlease (the BRA model for thumbnail)

[4*] 留意:インスタンスを開始し、Dockerのimageをロードしてきて「connect」ボタンが表示されるまではおそらく課金はされていません。キャッシュが効く場合は1分くらいで上がるときもありますが、基本的には5~10分程度(通信速度が遅いホストだと)20分くらいかかることがありますので気長におまちください。[connect]ボタンが押せるようになって(インスタンスが起動して)からが課金開始です。

[5*] ローカルPC(GPU搭載)環境に対して今回のGPUクラウド環境とのメリット・デメリットは
メリット: * GPUを購入しなくて少額で試せる(面白いと思ったら高価なGPUをLocalPCに導入してもよい)
* 大手クラウド(AWS, GCPなど)のGPUクラウドに対しては安い。10ドル課金(プリペイド)しても数時間は遊べる(数時間あれば1000枚生成も可能)
* 非力なLocalPCでも実現できる。スマホ・タブレットでも不可能ではない。環境構築だけLocalPCをつかって、スマホ・タブレットでウェブアクセスみたいなことも可能
* 大パワーのGPUを使いたいとき(学習する際、多量な画像生成をする際)などLocalPCでは実現できないことができる
デメリット:
* それなりにLinux, SSH, Dockerなどの理解が必要(中級者~)
* インスタンスを終了(破棄)のたびに生成される画像が失われるのでLocalPCなどにダウンロードする必要がある(ダウンロードしてから破棄する=破棄しないと課金が続く)
* インスタンス起動時に今回の動画で紹介したものを毎回やらないといけない。構築に15~30分かかるためすぐに試せないともいえる。なのでできるだけ構築を速くできるようにしましょう。

[6*] 他社の格安GPUクラウド : JarvisLabs.ai, RunPod, Lambdaでもほぼ同様の手順で環境構築が可能です。開始の際が各社サービスの癖がありますが。興味があればまた動画で解説します。インスタンスを作るところ以外はほぼ同じ形で構築できます。

<チャプター>
0:00 導入
6:00 工程紹介githubの紹介
6:12 vast.aiによる構築手順
53:38 画像生成のサンプル 
54:18 生成した画像の一括ダウンロード(scp)
56:37 (おまけ)Apache2によるoutputsフォルダ公開
59:33 GPUベンチマーク比較(参考)
1:00:39 まとめ

Fujifilm X-H2 vs X-H2s動画比較。4K60Pで意外な結果に?比較検証と技術的類推。X-T5も同様

Fujifilm X-H2とX-H2sを両方購入し主に動画の比較を行いました。X-H2を使い始め4K60Pの画質に違和感(偽色・解像感)を感じ、X-H2sを導入。2機種をサイドバイサイドで比較し検証しました。またなぜ発生するのかを技術的に類推しました。この現象はX-T5でも同様の現象が発生すると思われます。これはX-Trans CMOS5 HRが高画素の為にデータが多すぎてうまく扱えないということに起因しており原理的にX-H2 & X-T5の4K60Pより、X-T4や今後出てくるX-S20の方が高画質である可能性があります。 *動画中で比較している撮影条件は極力揃えてあります。また偽色に関して影響がでないようにクロマ4:2:2 高いビットレートの条件で撮影しています。 *動画中の解像感比較は、動画ファイルを静止画に出して、更にそれを動画キャプチャーしているため、その過程で劣化をしておりあくまで相対的な傾向の判断としてください。 *動画中にFujiのイメージセンサーをSony製と勝手に仮定していますが、あくまでウェブサイトの情報から類推しているしているだけであり確定情報ではありません。

<動画の内容>
0:00 導入
1:45 違和感1:60P信者問題
5:54 違和感2:偽色・解像感問題
10:11 違和感3:動画の歪み問題
12:33 まとめ1(後半)
19:00 原因類推:X-FESのデータ
21:10 2つの原因とりうるボトルネック
24:19 (本丸)原因類推・分析表
33:11 まとめ2(後半)

<参考リンク>
[1] CEDEC 2019 芯(しん)・遅延対策2020 株式会社バンダイナムコ研究所森口さん:https://cedil.cesa.or.jp/cedil_sessio…

Fujifilm X-T5を予約を考えている人!改めてX-H2はいかがですか?(発表前動画)

2022/11/02のX-Summit Tokyo 2022 NovでX-T5が発表されるという噂がでてきました。スペックの噂もかなり出そろってきており、噂が本当だとするとかなり魅力的なスペックでX-T3/X-T4の良いとこどりのカメラとなりそうで、購入を検討されている人も多いかと思います。他方で、X-T5のセンサーがX-H2と本当に同じものである(X-Trans CMOS5 HR : 40Mpix)だとすると、あらためてX-H2のパワフルさ(静止画・動画)は魅力であり、X-H2ユーザーとしてはX-H2も再考してみてはどうですか?という観点で動画を作りました。 元X-T3/X-T4ユーザーですので、X-T5の撮影スタイルは理想的に見えます。他方でX-H2を1か月以上使ってきていてかなり慣れてきました。X-H2のスタイルに慣れてしまえば、その他各部妥協のないX-H2はかなり魅力的なカメラだと思います。
*多少煽りがあるエンタメ動画ですのでご理解ください。
*あくまで噂サイトをベースとした情報での内容であり、X-Summitでの正式な発表をおまちください。X-T5が発表されるということもあくまで噂です。
*2022/10/30現在の動画であり、未来から見れば情報が古いはずですのでご了承ください。

<チャプター構成>
0:00 導入
1:44 X-T5の予想スペックとX-H2のアドバンテージ
10:17 私のX-H2の撮影スタイル(カスタム設定)を紹介
16:08 X-T5の6K動画について
18:09 まとめ

<製品リンク>
・Fujifilm X-H2ボディ(amazon):https://amzn.to/3eP9sXz
・X-H2公式サイトhttps://fujifilm-x.com/ja-jp/products/cameras/x-h2/
・X-T4公式サイト https://fujifilm-x.com/ja-jp/products/cameras/x-t4/
・XF56mmF1.2 R WR https://fujifilm-x.com/ja-jp/products/lenses/xf56mmf12-r-wr/

Fujifilm X-H2を使って簡易フィルムスキャン撮影(ピクセルシフトマルチショットが有用)。X-H2に限らずどんなカメラでもOK

FujifilmのX-H2などを用いた簡易的なフィルムスキャン撮影および現像方法を紹介します。撮影方法は単純なものなので、どんなカメラでも撮影可能です。X-H2は富士フィルムXでは現時点で高解像度機(40MPix)ですので高解像度なスキャンが可能です。またピクセルシフトマルチショットを用いることで更に解像感がでることがわかりました。撮影の仕方やLighroom Classic & Photoshopでの現像処理(あまりうまくはありませんが)も紹介しますので何らかの参考になれば幸いです。今回は、35mmフィルム(135mm判),中判(ブローニー120 : 6×6)のポジ・ネガフィルムで試しました。

* X-H2を使いましたが、どのような富士フィルム機でも撮影可能ですし、なんならどのメーカーのカメラでも同じように撮影できます。
* 途中で咳が入ってしまい申し訳ありません(カットを忘れました)

<チャプター構成>
0:00 導入
5:50 撮影フロー
8:27 私のレンズ設定(参考)
10:08 ブローニー(120)フィルム撮影の様子
12:24 35mmフィルム撮影の様子
13:40 Fujifilm Pixel Shift Combinerについて
14:32 Lightroom Classic & Photoshopによる現像フロー
36:20 スキャン例とまとめ

<製品リンク>
・Fujifilm X-H2ボディ:https://amzn.to/3eP9sXz
・FUJIFILM エクステンションチューブ MCEX-16 : https://amzn.to/3eUUuPB
・Fujifilm XF90mmF2 R LM WR : https://amzn.to/3F2N08a
・Fujifilm XF18-120mmF4 LM PZ WR : https://amzn.to/3Tph16a
・富士フイルム ライトボックス LEDビューワープロ4×5 : http://mall-jp.fujifilm.com/shop/g/g201618355/

Fuji X-T5が11月発売?X-T5の改めての予想と9月のX-FES2022の解釈

2023年初頭に発売かと予想していたX-T5がまさかの11月に発売という噂。相当驚きましたが、改めてのX-T5の予想(2022/10/19ver)とX-T一桁のプラットフォームの軸。そして9月に六本木で行われたX-FES2022の企画・開発者トークショーの動画を見ての個人的な解釈を紹介します。 X-T5がX-T4スタイルで3軸チルトとなると、特に静止画ユーザーは動きそうですね!(^^) *あくまでX-T5予想は「噂」であり、エンタメ動画ということでよろしくおねがいします。

<チャプター構成>
0:00 導入
1:17 X-T5のスペック予想
25:16 X-H2・X-T一桁プラットフォームの軸
28:03 X-FESトークショーの解釈
50:52 X-H2の操作系の感想(慣れてきた)
55:42 まとめ

<X-FESのトークショーのリンク>
Fujifilm Japan Xフェスin六本木 9/10商品企画・開発担当者トークショー / 富士フイルム https://www.youtube.com/watch?v=nfaNIkq9HvU
Fujifilm Japan Xフェスin六本木 9/11商品企画・開発担当者トークショー /富士フイルム https://www.youtube.com/watch?v=IL03_KxH1FA

Fujifilm X-H2を2週間弱つかったクイックな感想(雑書き)

X-H2を2週間弱使ってのクイックな感想

・PASMスタイルは慣れてきた。静止画撮影時は全く問題なし。
・静止画・動画切り替えは、「C1呼び出しカスタムファンクションボタン」割り当て切り替えでX-T4よりも早く切り替えができる。他方で電源をOffにすると静止画に戻るのは留意
・動画時のコマンドダイヤルクリックできない問題は、まぁ慣れて使えてきている。ISOボタンをノールックで押せるようになれば1手間遅いがなんとかやっている。ISOボタンをおしたら、前後ダイヤルの要素が変わるファームウェアアップに期待(ISO, F, SSが切り替わる仕様)
・動画時にAF-CからMFにズバンと切り替えることができない?(やり方おしえてください)X-T4はできた。動画撮影中に被写体が止まったらMFでピントを固定して撮りたい場面で便利だった。これは何とか実現したい
・静止画はISO1600までしか使わないスタイルなのでX-T4比でも全く問題ない。解像度は明らかに上がった。ISO3200以上は試していないので要検証(個人的にはほぼ使わないけど)。DR400を相変わらずよくつかうのでベース撮影が下がった関係で、DR400はISO500に下がり、解像度もノイズ感もすっきりした印象。スムーススキンエフェクトは被写体が子供で肌がツルツルなのでまだ使っていない
・8K30P動画はとても綺麗。とても価値があると思う。4Kモニターしか持っていないが明らかに綺麗。カメラにそれほど詳しくない家族がみてもパッとわかるほど綺麗という感想。4Kモニター以上持っている方にはとても有用。ただし8K60Pがんばってほしかった。8K動画はIBISがピタッととめるため手持ちでも全然いける。XF90mmF2とかの望遠で非OISレンズでもビシっととまるので8K動画で手持ちは怖くない。Davinci 18による8K編集を簡単にやってみたが非常に重い。ポスプロは大変。
・8K動画を楽しくて結構つかうからか、バッテリーの減りはX-T4比で多い気がする。他方でバッテリー2本あれば1日でなくなったことはない(使う人それぞれなので参考程度)
・たまに縦撮り動画を撮影するがこれはスマホで見るようなので縦撮りになったら4KHQに切り替わる仕様が欲しいが、まず実装されないな(笑)
・amazonで2000円台で買った革ケースはグリップ部はゴワゴワするけど底面保護にはいい感じ。しばらく使ってみる予定
・CFExpress TypeB(動画で紹介したAngelbird 512GB)は、結構メモリーカード自体が発熱する。カードリーダーでPCでコピーするときも結構熱い
・AFはディープラーニングによる顔検出はX-T4よりも鋭い。しかし特定の顔にロックされずそこら中の顔を拾うので、結局「顔検出・瞳AFモード」を切ることがある。これどう回避するんだろう??娘を撮りたいが、背景に入ってきた他人の顔によく引っ張られる。トラッキングAF等で回避できるか研究中
・ディープラーニングよるAFで、人や顔ではないものをよく誤認する。X-T4でもあったが、この誤認が結局問題になる。ディープラーニングを使おうが、使わまいが、誤認を減らさないとAFが飛ぶ問題を防げない。
・ホワイトバランスの傾向がちょっと変わって、あれ?っておもうシーンがある(室内で多いかな)。ホワイトバランスにもディープラーニング使ったということで、アルゴリズムが違うからその影響か。別に悪いというわけではなく、今までと違うWBを出すというシーンがたまにある。
・はじめて付属のストラップを使ってみたが質が悪い。いろいろ糸がほつれる。もともと使っていたのに変更予定。
・AF移動スティックは、ストラップを首にかけて両手でカメラを支えながらつかうので位置はそれほど問題なくなってきた(相変わらず片手だけでの操作は難しいがその場面も少ない)他方で、X-T4と明確に違うのは上下左右に移動すると「クリック」されてしまいAFの枠サイズ変更モードになりながら上下左右移動している。別に良いがX-T4とは挙動が違う
・上面液晶は別に要らないと思う。せめてISO切り替え時は、ISO切り替えっぷりを表示とかしてほしい。ここにカスタム割り当て可能なユニバーサルダイヤルとかつけるのが良かったと思う
・C1~C7スタイルはX-T4よりもより細かいところを独立した形で設定できるが、何を設定したか覚えておく必要がある。X-T4はQメニューで切り替えればC1~C7でなんの設定かが確認できたが、それができないような気がする。個人的にはX-T4の静止画・動画を一番上位レイヤーで切り替え、それぞれにC1~C7をQメニューで切り替えるシステムが優れていると思う
・ディジタルテレコン:数回試したが使っていない。クロップされているだけなのでLrCで切ればいいだけ。あまり必要とは思っていない。動画に関しては8Kをベースとしているので使えない
・XF18-120F4がいい感じ。PZが面白くて昔のハンディーカムで撮ったような素人っぽいズーム動画を連発している(笑)ただ、これはこれで家族動画を残す意味では面白い。f=120mm F4(解放)は結構寄れるのでマクロとかボケた画像をとれる。面白いレンズだと思うが、PZリングを2つ触ってしまうとどちらも動かないのでレンズの握り方が重要(説明が難しいが)
・XF56mmF1.2はとても良い。X-H2とのボディバランスはとても良い。寄れるしキリキリ。ポートレート以外の静物写真を撮るには重宝できる。他方でポートレートだけなら、ウリである50cmの距離は近すぎて横顔しか使えない(正面顔には使えない気がする)という意味で、40Mpixのキリキリが必要ないなら、旧型を変えなくてもよさそう。とはいえ良いレンズですよ。
・Capture One Proテザー撮影は問題なくできました。
・フラッシュ用のホットシューカバーが10日でどこかにいきました。
・HDMI TypeAは便利。根本しっかりしていて安心
・ノスタルジックネガは全然使っていない(これから)
・ProRes使わないならSDカードUHS-IIの高速カードで十分8K30Pはいける(100Mbpsとか全然問題ない)。ただ撮影後にPCにデータを移す時間が早いのでCFExpressは良い面は多い
・上記みたいなのをまた動画作ります。

Fujifilm X-H2 & X-T4 瞳AF食いつき簡易比較(その1)(AF速度・追従性・安定性)

X-T4比で体感でも明確にX-H2のAFは性能向上しています。体感だと説明が難しいので同条件で簡易比較する動画を作ってみました。マネキンと男性の顔写真を回転テーブルにのせて、顔検出、瞳AFをOnにして比較しました。結果としては明確にX-H2の方が食いつきもよく、追従性、安定性も優れていると思います。

撮影条件:
カメラ:X-H2 & X-T4 レンズ:XF35mmF1.4、XF56mmF1.2 R WR (新型)
設定:顔検出ON 瞳AF AUTO | AF-C
シーン1:マネキン(黒目塗り)+XF35mmF1.4
シーン2:男性写真+XF56mmF1.2 R WR(新型)

<チャプター>
0:00 導入と撮影条件
1:25 シーン1(マネキン)での比較
2:49 シーン2(男性写真)での比較
4:08 まとめ

<リンク>
[0] X-H2公式サイトhttps://fujifilm-x.com/ja-jp/products/cameras/x-h2/
[1] X-T4公式サイト https://fujifilm-x.com/ja-jp/products/cameras/x-t4/
[2] XF56mmF1.2 R WR https://fujifilm-x.com/ja-jp/products/lenses/xf56mmf12-r-wr/

Fujifilm X-H2 & X-T4 8K, 4K(HQ), 4K動画解像感簡易比較(その1)

X-H2の多彩な動画設定(8K, 4K(HQ), 4K60P)とX-T4(4K60P)の動画の解像感を簡易的な比較をしてみたいと思います。私自身これからX-H2でいろいろな動画を撮影し、残していく上でどの動画設定でいくかを見定める上でこの各設定での動画の解像感を簡易的に比較してみました。結論としては、8K30Pは圧倒的に解像感があり、4K(HQ), 4Kとは大きく差がありました。また4K(HQ)はオーバーサンプリングということで普通の4Kよりは明確に解像感が良かったです。X-T4との比較も興味深い結果がでました。

撮影条件:
カメラ:X-H2 + X-T4
レンズ:XF56mmF1.2 R WR (新型)
設定:8K30P, 4K(HQ)30P, 4K60P, 4K60P(X-T4)
今後検証してゆくX-H2の疑問:
[1] X-H2の8K30P, 4K(HQ)30P, 4K60Pの画質の差
[2] X-T4の4K60Pとの画質の差
[3] X-H2の4:2:2と4:2:0の画質の差
[4] X-H2の動画Bitrateの違いによる画質の差
[5] 60Pに慣れた目で30Pは我慢できるのか?
[6] IBISの効き

<チャプター>
0:00 導入とX-H2の動画に関する疑問
2:02 ターゲットチャート、シーン、撮影条件、ポスプロ条件
8:00 シーン1での解像感比較
18:39 シーン1での4:2:2, 4:2:0比較
19:28 シーン2での解像感比較
22:28 まとめ

<リンク>
[0] X-H2公式サイトhttps://fujifilm-x.com/ja-jp/products/cameras/x-h2/
[1] X-T4公式サイト https://fujifilm-x.com/ja-jp/products/cameras/x-t4/
[2] XF56mmF1.2 R WR https://fujifilm-x.com/ja-jp/products/lenses/xf56mmf12-r-wr/
[3] ISO 12233 Test Chart Stephen H. Westin: https://www.graphics.cornell.edu/~westin/misc/res-chart.html