昨今のローカルAIでゲームを作ってみる実験(vibe-localを使ってみました)

Share
昨今のローカルAIでゲームを作ってみる実験(vibe-localを使ってみました)

とりあえず遊びたい人のために、ブラウザで遊べるリンクはこちらです。

では本題です。

ローカルAIは、クラウドタイプと比較すると、かなり性能が劣ります。
実際半年ぐらい前だと、簡単なコードなら問題無く作ってくれましたが、具体的に細かい部分を指摘すると破綻したりして、中々うまく行きませんでした。
正直ほぼ使い物にならない感じで、しばらく静観って感じだったのですが、こんな記事を発見!

クロードコードにクロードコード作ってって言って寝たら,朝起きたらクロードコードが出来てたんだ…

万博でも猛威を振るっていた、「落合陽一」さんが、Claude Code的な機能をローカルAI特化で作られていて、オープンソースで手軽に利用できます。
更に、AI界隈では珍しく、公式の日本語解説まであります。
ハードウェア以外は、全て無料で簡単に構築できるので、追加のお金を心配しなくてもいい、親御さんも安心のvibecoding環境が整います。
じゃあ、実際にどのくらいの事が出来るのか?

試してみました。

今回の環境は、WindowsPCに「vibe-local」をインストールします。
https://github.com/ochyai/vibe-local

インストール方法や、使い方は詳細に公式のREADMEに書かれているので、その通りにインストールから設定します。
公式の推奨LLMは「qwen3」でPCのメモリーに合わせたモデルを使う感じです。

ですが、「qwen3.5」も公開されていますし、ハードウェアの環境も「NVIDIA DGX Spark」がある上に、「Ollama」もインストール済みです。
その辺をカスタマイズして遊んでみます。

最初につまずいたのは、この「vibe-local」はあくまでPC1台で完結する仕組みになっている事です。
別PCの「Ollama」にアクセスさせたいのですが、PCのローカルIPアドレスを設定しましたが、セキュリティーエラーで使わせてくれません。
とりあえず、設定ファイルを書き換えてみます。

C:\Users\ユーザー名\.config\vibe-local\config

の場所に設定ファイルがあるので書き換えます。

# vibe-local config
# Auto-generated: 2026-03-03 11:39:42
# Engine: vibe-coder (direct Ollama, no proxy needed)

MODEL="qwen3.5:35b"
SIDECAR_MODEL="qwen3:8b"
OLLAMA_HOST="「Ollama」PCのローカルIPアドレス"

で、結局設定ファイルを書き換えても、別PCの「Ollama」を動か部分がセキュリティーチェックでエラーになり動かなかったので、セキュリティー部分を改変しています。(セキュリティーチェックをスルーするように変更しただけです)

モデルは「qwen3.5」の35bを使用します。
このぐらいのサイズが、諸々丁度いいように思います。

作るゲームですがテト〇スっぽいアレ的なゲームです。
で、作ったゲームのリンクは以下になります。
https://test.aisgm.me/test_prog/app/tetomarurisu/

このゲームをローカルAIだけで製作されているので、必要最低限で作っていて、軽いエフェクトは入れましたが、基本的にはシンプルに作成しました。
色々欲張ると破綻する可能性があるので、その辺を警戒した感じになっています。これがClaudeなどのクラウドサービスなら、そこまで気にしなくても思った事を指示すれば、作ってくれちゃうのでその辺はまだ差があるように思います。
そうは言っても、ローカルだけでここまでできるので、AIの進化の早さを実感します。

また、コードには一切手を入れていませんが、一応「テト〇スっぽい」の〇の部分を置き換える部分だけ手動で対応しています。
それ以外は全てプロンプトによる生成で製作できたので、ローカルでもこのぐらいは出来るんだというのが分かるサンプルになると良いかと思います。

GITを確認すると、60回コミットしているので、作るのに60回プロンプトを投げている事になります。
今回は何か指示をする時に複数の指示はせずに、一回のプロンプトで一つの指示だけにしているので、プロンプトを投げる回数は増えています。
Claudeだと何個も同時に指示を投げても、自動で整理して順番に処理してくれますが、ローカルの場合は指示が無視されたり、最初の指示だけ実行される事もあったので確実性を考えてそのような対応をしました。

以上の事を踏まえて、有料サービスとは圧倒的な差はあるものの、ちょっとしたアプリや、学習にためにvibecodingになれるために使うぐらいなら十分使える所まで来ているように思いました。

「Claude Code」もローカルAIに対応しているようなので、その内それも使ってみたいですね。

Read more

自動的にカラオケっぽい歌詞を付けるアプリを作ってみた結果

自動的にカラオケっぽい歌詞を付けるアプリを作ってみた結果

sunoで作成した曲に歌詞を付けるのが手間だなぁ~と常々思っていたのですが、これを効率化したいと言う事で、今回は歌を解析して歌詞を指定すればタイミングを合わせて配置してくれるアプリを作ってみました。 せっかく作ったので少し解説と、どんな物が作れるのか、デモの動画と少し解説をしますが、アプリそのものはライセンスの問題で非公開です。 実際にこのツールで作成した動画を3本ほど紹介 スペルトナエル サイコロ勇者と魔王の城 アトミックピクニック 見てもらうと分かりますが、これが思ったより簡単に作れるようになったので、現在のように短期間で作れるようになりました。 歌詞入りで曲を公開する場合に、歌詞を入れる作業に時間がかかる割に、イマイチなできになる事も多いので、クオリティーが安定したのも良かったです。 では、次の動画で実際にツールを使って曲に歌詞を入れていきます。 使用しているAIのライセンス問題で、手軽に公開できないのと、需要がそれ程無さそうなので、こんなアプリで動画作成してますよって紹介になります。 音源さえ用意すれば、カラオケも作れちゃいます。 カラオケの例です。

ある人から、MarkdownのテキストをPDFにしてくれる何かが欲しいと言われたので、Claude Codeで作る事にした

ある人から、MarkdownのテキストをPDFにしてくれる何かが欲しいと言われたので、Claude Codeで作る事にした

実際、AIはMarkdownで解答を返してくる事が多く、普通に使っているだけでも、Markdown形式のテキストが手軽に表示したり、PDFに変換できると便利だと思うので、ブラウザで手軽に使える物を作りました。 作成後WEB上にアップしたのが以下のURLになります。 https://test.aisgm.me/test_prog/app/md2pdf/ VS Codeのプラグイン入れれば、同じ事は出来ますし、他にも同じようなアプリを作っている人がいるので、それを使うのも手なんですが、最近は怪しいサイトも多いですし、広告が大量に出るものも多いです。 更に、プラグインがウィルスに汚染されているケースなんかもニュースになっているので、セキュリティー的に使った事が無いものを人に勧めるのも怖いです。 そんな訳で、手軽に使えてインストール等の面倒な準備が必要無いってなると、WEBアプリでアクセスすれば使えて、ローカルで処理させるのが良さそうです。 配布やインストールの手間も必要無く、使いたい時にネットに繋がって、ブラウザさえあれば動くので一番使い勝手がいいですよね。 ってな訳で、Claude

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットの正体とWebPの「予測マジック」を理解する 次世代画像フォーマットAVIFを触ってみた 割と最近の画像圧縮フォーマットについてです。 「webp」は比較的見るようになったフォーマットですが、従来は画像のサイズが小さいのはJPGで、透明色が使えて画質を維持するのがPNGって感じで、使い分けられていると思います。 しかし、JPGは古いフォーマットで圧縮アルゴリズムも古い上に、透明色が使えないなど改良の余地が多々あるので、「JPEG 2000」というフォーマットも作成されました。 「JPEG 2000」は技術的には従来のJPEGを大幅に上回る優秀なフォーマットにもかかわらず、処理負荷の高さや互換性の問題から一般消費者向けには普及しませんでした。 今となっては、それ程負荷は高くないのですが、開発された当時(2000年代前半)のPCのスペックを考えると厳しかったと思われます。 2001年のPCスペックを調べてみました。 Intel Pentium III 256MBから512MBのRAM 20GBから80GB Windows 98やWindows 2000が主流 この

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5を使ってみましたが、なんか音の厚みが増して日本語の再現度も上がって、歌唱クオリティが一ランク上がったように感じるほどです。 とりあえずバージョンの歴史から V2 (2023年秋):  最大生成時間は1分20秒でした V3 (2024年春):  生成時間が2分に更新されました V3.5 (2024年夏): 曲の構造が改善され、初回生成の最大時間が4分に、延長                       (Extend)は1回につき最大2分まで可能になりました V4 (2024年11月): ボーカル品質が向上し、初回生成の最大時間は4分です。また、「Extend(延長)」「Cover(カバー)」「Persona(ペルソナ)」機能が追加されました V4.5 (2025年5月): 初回生成の最大時間が8分に延長され、プロンプトへの忠実度やスタイルのマッシュアップ機能が向上しました V4.5+ (2025年7月): 「Add Vocals(ボーカル追加)」や「Add Instrumental(インスト追加)」などの制作ツールが更新されました V5 (2025年9月):  オーディ