3D Gaussian Splatting で作成したファイルをWebブラウザで閲覧してみる

本来は別の記事を書く予定でした

複数枚の写真から高品質な3Dシーンを生成する手法の一つである3D Gaussian Splattingについて、ファイルサイズを少なくする方法があるようなので試してみようとしたのが本気の目的となります
元ネタは以下になります

https://github.com/KeKsBoTer/c3dgs

・・・が、最終的に環境構築が出来ずに実施できませんでした

なので、内容を変更して3D Gaussian Splattingの生成環境のおさらいと、Webブラウザで動作するビューワーを紹介しています

この記事の最後のほうに実施した内容を記載していますので参考にしてください
本エントリでは3D Gaussian Splattingの環境設定、データ作成と、WebGLを利用したビューアの実験まで行っています

Gaussian Splattingについては、過去に一度記事にしていますので参考にしてみてください

今回の環境は以下になります
・Windows11
・GeForceRTX 2080 VRAM 8G
・Memory 24GB
・CPU Core-i7 9700K

環境構築

Anacondaを利用して環境を構築します

まずはオリジナルのGaussian Splattingの環境構築を参考にし、環境をセットアップします
自分は以下の手順で作成しました

今回はF:/Project/MachineLerning/ フォルダに移動し、リポジトリをクローンしました

git clone https://github.com/graphdeco-inria/gaussian-splatting --recursive

gaussian-splattingフォルダが出来るため、このフォルダに移動し、以下のコマンドで環境を作成

SET DISTUTILS_USE_SDK=1 # Windows only
conda env create --file environment.yml
conda activate gaussian_splatting

ここまでの手順で、gaussian_splattingを利用するための環境がとのいました
上記の3番目のコマンドを実行すると、環境が切り替わったことが確認できると思います

トレーニングデータを作成するための環境構築

トレーニングに利用する画像を作成するための環境を構築します
今回は動画を作成し、その動画から数秒置きに静止画を生成することでトレーニングに利用する大量の静止画を作成します

環境構築の方法は以下の記事を参考にしました
https://taziku.co.jp/blog/3d-gaussian-splatting-traning

FFmpegの設定

公式ページからダウンロードします
https://ffmpeg.org/

今回は以下のリンクからWindowsバイナリをダウンロードしました

FFmpegにパスを通す

パスを通します
今回は「F:\Project\MachineLerning\tools\ffmpeg-7.0.1-essentials_build\bin」にツールを展開しました
システム環境変数の編集から上記フォルダへのパス設定を追加します

パス設定後、コマンドプロンプトから以下のコマンドを実行するとバージョン情報が表示されます

ffmpeg -version

COLMAPの設定

画像からカメラの位置を推測するためのツールを設定します
公式ページからダウンロードします
https://demuc.de/colmap/

リンクをたどっていくとGitHubのリリースページにたどり着くので、そこからCUDA対応版をリリースしました

FFmpegと同じく、環境変数にパスを通します

ImageMagicの設定

公式ページからダウンロードします
https://imagemagick.org/index.php

インストーラーが付属しているため、画面の指示に従って作業すれば設定が完了します

トレーニングの準備

GoProを利用してフィギュアの動画を撮影しました
この動画をもとに3Dのシーンを構築してみます

今回は環境設定で準備したgaussian-splattingフォルダ内にtrain_dataフォルダを作成し、その中に撮影した動画を置きました
さらに、inputフォルダも作成しました

コマンドプロンプトを開き、動画を設置したディレクトリに移動後、以下のコマンドを実行します
(動画ファイル名は適宜変更してください)

ffmpeg -i GH010376.MP4 -r 20 input/image_%05d.jpg

今回、動画が1分と短いため、20fpsで書き出し1200枚ほどを学習データとして使用するようにしました
(余談ですがGoProで1080の60fpsで撮影しないとFFmpegでうまく処理できませんでした)

COLMAPを利用した歪み補正データの作成

Anacondaで作成したgaussian_splattingの環境でrクローンしたリポジトリフォルダに移動し、以下のコマンドを実行します
COLMAP.batの設置場所と、先ほどinputフォルダを準備したフォルダ(inputフォルダではない!)をフルパスで指定します

python convert.py --colmap_executable "F:\Project\MachineLerning\tools\COLMAP-3.9.1-windows-cuda\COLMAP.bat" -s F:\Project\MachineLerning\gaussian-splatting\train_data

トレーニングの実施

トレーニングを開始します
同じくリポジトリフォルダのまま、以下のコマンドを実行します

python train.py --resolution 700 -s F:\Project\MachineLerning\gaussian-splatting\train_data

この時のGPU使用状態は以下のようになっていました
試したところ、専用GPUメモリだけで処理しないと学習時間が非常に伸びてしまうため、–resolutionオプションでVRAM内に収まるように調整したほうがよさそうです
(学習中にVRAM使用量が徐々に増えていくため、ある程度余裕を持たせたほうが良い)

終了しました

トレーニングが終了すると、\gaussian-splatting\output\ee9de029-cのようなランダムなフォルダが生成されているはずです

WebGLを利用したビューアーを試してみる

今回はこちらを利用してみました
https://github.com/antimatter15/splat

まずはリポジトリをクローンします

git clone https://github.com/antimatter15/splat.git

クローンしたフォルダ内の「index.html」を開きます
(デフォルトで電車のシーンが表示されます)

今回のビューアは.splat形式のファイルを表示するため、.ply形式から変換する必要があります
が、変換方法は簡単で、ブラウザ上に.plyをドラッグアンドドロップすれば.splatに変換できます

ブラウザにシーンが表示されると同時に、.splatファイルのダウンロードが始まります
ほか、urlパラメータにsplatファイルを指定すれば、そのシーンを表示することもできます

ほか、splatファイルに変換した時点で、かなり容量が削減されました

ここで気になるのは「サイズ容量が減ったことで、品質が劣化していないのか」ということ
今回は公式ページで用意されているプリビルドバイナリを利用しました
https://github.com/graphdeco-inria/gaussian-splatting#pre-built-windows-binaries

それぞれの比較は以下の通り

↓公式のビューア

↓Webビューア

元データが悪いので何ともですが、気持ち公式ビューアのほうが綺麗かな？と感じる程度でした

ちなみに「polycanvas」というサイトでplyファイルが閲覧できました
これなら、plyファイルだけ配布して、上記のページで閲覧を楽しんでもらうこともできますね!

以上

ということで、今回は3D Gaussian Splattingの環境設定とWebビューアの紹介を行いました
映像から3Dシーンを構築できるのはやっぱり楽しいですね！
これを利用すればバイクツーリング先の風景や、バイクを乗り換えるときに思い出を3Dシーンとして残すことも出来そうです
コスプレイヤーさんとかも3D Gaussian Splattingで撮影してみたいですね!

とりあえず、つよつよGPUが欲しくなりました

Compressed 3D Gaussian Splatting for Accelerated Novel View Synthesisを試す・・・はずが、環境構築できず

手順はGirHubのReadMeを参考にします
https://github.com/KeKsBoTer/c3dgs

まずはリポジトリをクローンします

git clone https://github.com/KeKsBoTer/c3dgs.git

F:/Project/MachineLerning/c3dgs となるようにクローンしました

こちらについてはCUDA12系が必要だったため、アップデートを行いました
(マシンにはCUDA11系がインストールされていたため)

ここでちょっとしたトラブル発生
CUDA12系インストールでエラーが発生しました

nVidiaフォーラムによると、NsightComputeについて、すでに同一 or より新しいバージョンがあるとインストールに失敗するとのこと
その場合はカスタムインストールを選択し、NsightComputeのチェックを外すといいらしいです
・・・が、自分の環境ではそれでもだめだったので、最終的にCUDA12.2をインストールしました

あらためてAnacondaで環境を構築します
コマンドプロンプトでリポジトリフォルダに移動した後、以下のコマンドを実行します

この後、以下のコマンドを利用して環境構築を行いましたが、様々なエラーで環境構築に失敗しました

conda env create --file environment.yml

エラーの詳細はメモしていませんが、おおむね以下の内容です
・pytourchのバージョンが異なる(CUDA12を要求されているのに、pytourchは11.6が指定される)
・warning C4067: プリプロセッサデ・・・　みたいなエラーでインストールが中断

心折れたので、また数か月後 or 数年後にチャレンジします
環境構築で手間取るのはだめだわ・・・

PNY Technologies｜ピーエヌワイテクノロジーグラフィックボード GeForce RTX 4090 24GB VERTO LED 3FAN VCG409024TFXPB1 [GeForce RTXシリーズ /24GB]

MSI｜エムエスアイグラフィックボード GeForce RTX 4070 VENTUS 2X E 12G OC [GeForce RTXシリーズ /24GB]

月	火	水	木	金	土	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

本来は別の記事を書く予定でした

環境構築

トレーニングデータを作成するための環境構築

FFmpegの設定

FFmpegにパスを通す

COLMAPの設定

ImageMagicの設定

トレーニングの準備

COLMAPを利用した歪み補正データの作成

トレーニングの実施

WebGLを利用したビューアーを試してみる

以上

Compressed 3D Gaussian Splatting for Accelerated Novel View Synthesisを試す・・・はずが、環境構築できず

おすすめ

Real-ESRGANでStable Diffusionの画像をアップスケーリングする

Intel MacでStable diffusionを動かす

ローカル動画生成ツール「FramePack」をRTX2080で試す

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル