AI関連

AI関連の内容全般

評判の動画生成AIの「ConmfyUI」で「Wan2.2」省メモリー版を使ってみた

AI関連

評判の動画生成AIの「ConmfyUI」で「Wan2.2」省メモリー版を使ってみた

「ConmfyUI」の標準的テンプレートを使用してみましたが、「RTX5070 Ti 16GB」だととりあえず動きますが、動作のサイズや時間でメモリー不足になってしまします。 また、調節も色々難しくて、動画のサイズで生成中に止まったり、なかなか思うように生成できません。 昨日の記事でも載せましたが、初期状態で何もいじらずに、動画を作成した時の内容です。 0:00 /0:05 1× 5秒だけですが凄いですよね。 水滴の動きまでちゃんと表現できています。 時間を延ばそうと色々と設定を変えたり、プロンプトを変えてみましたが、時間を延ばすとメモリーが足りなくなります。 そんな時、 ComfyUIでWan2.2をLoRAを使って軽量化し、RTX3060で動かす こんな記事が流れてきました。 少ないメモリーで動かす試みです。 これを適用すれば、メモリー不足が緩和されて、動画サイズや時間を伸ばしてもうまく動きそうです。 ネタ元は「reddit」の書き込みだそうで、こちらを参照しつつ試しました。 reddit

購入したミニPC「GMKtec」の「EVO-X1」が来たので動かしてみた!

AI関連

購入したミニPC「GMKtec」の「EVO-X1」が来たので動かしてみた!

ミニPC「GMKtec」の「EVO-X1」については、購入時に書いた前回の記事を参照してください。 ミニPCを購入してしまった・・・処理の重いAI処理を行っていると、それに処理をとられてしまって、動画編集とか他の作業が滞ってしまいます。 そこで、サブ的作業、または動画編集環境のバックアップ的な意味で、高性能なミニPCをバックアップマシンにしようという考えで購入しました。 ライブ配信なんかでも利用できそうですし、汎用性の高さも個人的には決めた要因です。 購入したのは、「GMKtec」というメーカーの「EVO-X1」という機種でCPUに「AMD Ryzen AI 9 HX-370」を搭載していて、強めのCPUを積んでいます。 アマゾンのリンク GMKtec Full Spec 版 EVO-X1 AI ミニPC AMD Ryzen AI 9 HX-370(最大5.1GHz 12コア/24スレッド)搭載 LPDDR5X 8000MHz 64GB 1TB

AIは嘘をつくよね!

AI関連

AIは嘘をつくよね!

昔から、AIの嘘問題はあるわけですが、最近はかなり減ってきたように思います。 特に自動的にWEBページから情報を検索してきたり、複数のページを比較して正しい情報を持ってくる仕組みなどが導入され、実用レベルで使えるようになって、便利になりました。 ただ、その分嘘が巧妙になっていくというか、分かりにくい嘘をついてくれます。 そんな中、こんな分かりやすい嘘な上に、雑な仕事されたので、逆に面白くなってしまいました。 今回のプロンプト RTX50シリーズのそれぞれのコア数やメモリー搭載量などを比較できる表を作ってください 以下はRTX 50シリーズの主要モデルのコア数やメモリー搭載量を比較した表です。情報は複数の信頼できるウェブサイトから取得しました。 モデル CUDAコア数 RTコア数 メモリ容量 メモリタイプ RTX 5090 18,432 144 24GB GDDR7 RTX 5080 12,288 96 16GB GDDR7 RTX 5070 Ti 10,240 80 12GB GDDR7 RTX 5060 6,144

「Gemini CLI」を使ってみる! その4 「Gemini CLI」を使い倒したら!!選ばれたのは「Claude」でした!!

AI関連

「Gemini CLI」を使ってみる! その4 「Gemini CLI」を使い倒したら!!選ばれたのは「Claude」でした!!

タイトルで落ちが・・・・w 経緯 そもそもClaudeを使える環境があるので、Claudeは利用していたのですが、外部のサービスからClaudeを呼び出して使うタイプなので、「Claude Code」を利用することはできませんでした。 とは言え、元々proプランでは使えなかった上に、Windowsから直接使うこともできなかったので、外部サービスから使うのと、特に違いがなかったのですが、「Claude Code」がproプラン解禁!となって、話は変わってきました。 それであれば、proプランに契約して使ってみないなと思っていた矢先に、「Gemini CLI」が公開! こうなってしまうと、一旦無料は使うだけ使ってみたい上に、Windowsで簡単に使えるように設計されていて、 「Claude Code」と違ってGoogleアカウントで使えて、環境さえ整えればすぐ使えるハードルの低さが強いですよね。 そうなると、一旦「Gemini CLI」になっちゃったわけです。 ここからは、「Gemini CLI」をそれなりに使ってみた結果、無料で使えると言い つつも、通常は「

「Gemini CLI」を使ってみる! その2 ゲームをブラッシュアップしていきます!(完成度アップしてるよ☆)

vibecoding

「Gemini CLI」を使ってみる! その2 ゲームをブラッシュアップしていきます!(完成度アップしてるよ☆)

はじめに 最初に念のため書きますが、今回はコードは一切触らず、全て「Gemini CLI」が作成したゲームです。 また、基本的に指示は、曖昧な指示を出すように心がけました。 例 ・もう少し当たり判定を小さくして ・ボスの攻撃バリエーションを増やして ・敵が硬すぎるのでもう少し柔らかくして みたいな指示です 実際にブラッシュアップして遊べる状態にしたのが以下になります。 https://test.aisgm.me/test_prog/js/003/ 遊べるのはPC onlyです 前の状態だと、システム的な部分は色々入っていますが、バランス悪いし分かりにくい状態でした。 途中で絶対クリアできないって場所もあります。 そこで、今回はバランスの調整や、表示する情報など大幅に更新しました。 デバッグするに当たって、自分のパワーアップがどんな状態かを確認できないと不便なので、その辺も結構変わっているかと思います。 あと、今回はクリアの概念もありますので、ウェーブ15をクリアしてください。 ここから下は、具体的な作成過程をはしょりながら見ていきます。 実際は少しづつ変更している

「Gemini CLI」を使ってみる!導入から、ゲームを作り始めるまで(作ったゲームも触れます)

AI関連

「Gemini CLI」を使ってみる!導入から、ゲームを作り始めるまで(作ったゲームも触れます)

最初に未完成のゲームを貼っておきます。次回ブログ記事にてもう少し進行版を貼ります。(まだゲームとしてはいまいちですが、とりあえず動く) 操作方法だけ、PCの場合、WASDとカーソルキーで移動、パワーアップはマウスで選択です。https://test.aisgm.me/test_prog/js/002/ 画像クリックでも遊べます ポイント ・Gemini CLIはマルチモーダル機能 様な入力から新しいアプリケーションを生成など ・大規模コードベースのサポート Geminiの100万トークンという広大なコンテキストウィンドウを最大限に活用し、大規模なコードベースのクエリや編集を効率的に行えます ・運用タスクの自動化 Git操作など、日常的なDevOps関連のタスクをAIが自動化 ・豊富なツール統合 Gemini CLIの大きな強みです。Imagen(画像生成・編集)、Veo(動画作成)、Lyria(音楽生成)といったメディア生成モデルを含む新しい機能をModel Context Protocol (MCP) サーバーを通じて接続できます 「Gemini CLI」が何かとか、料金

vibe codingでQRコードを作成するWEBアプリを作ってみた

AI関連

vibe codingでQRコードを作成するWEBアプリを作ってみた

無料のQRコードを作成するアプリって結構あるんですが、自分用のが欲しかったので、今回作ってみました。 正直このレベルだと、特に難しい事を考えなくても作れちゃいます。 アクセス先はこちらです。 https://test.aisgm.me/test_prog/app/QR_Code/ 更新履歴 2025/06/27 公開 2025/07/05 QRコードの生成に失敗するケースがあったので修正 一応課程を乗せておきます 制作環境ですが「Claude 4 Sonnet」を利用して作成しました。 今回はシンプルなQRコードなので以下の条件を設定しました。 * 文字列を指定したらQRコードへ変換 * 画像の下部にテキストでタイトルを記入できるようにする * QRコードのサイズを選択できるようにする * ダウンロードボタンでQRコードとタイトルを画像としてダウンロードできる * スマホからも利用可能にする これで作成すると、画面構成は現在の完成形ができあがりましたが、QRコードの生成ボタンが押しても反応しないなど、動きませんでした。 QRコード生成のJSのライブラリを

画像生成AIをローカルで動かしてみた(ComfyUI(FLUX.1))

AI関連

画像生成AIをローカルで動かしてみた(ComfyUI(FLUX.1))

今回は「ComfyUI」を使用して、工夫もなくデフォルトのテンプレートを使用して遊んでみます。 インストールから動かす所まで、軽く解説します。 動作環境はNVIDIAのGPUを搭載しているPCでグラフィックRAMの容量によって、画像サイズや使用するデータ(モデル)の種類が限られる感じになります。 CPUモードもあるので、使っている環境に合わせて起動してください 今回は両方試して、処理速度の差も分かります 今回のサンプルを動作させるにはストレージは20Gぐらいはあった方が良いかもって感じです。 いろいろ試したい場合は、必要に応じてギガ単位のモデルをダウンロードするので、ストレージの消費が激しいので注意です。 「ComfyUI」をダウンロードです。 以下のサイトへアクセスして、 https://github.com/comfyanonymous/ComfyUI スクリーンショットのような「Installing」の項目に「Direct link to download」とあるので、これをクリックします。 2G程容量があるので、ダウンロードしてください ダウンロードが終わると、7zi

SUNO AIを使った音楽について

AI関連

SUNO AIを使った音楽について

まず私の作った曲を試しに聞いてみてください。 こんな感じの曲が、少しのコツで、誰でも可能になりました。 これの凄いのが、ホントに人が歌っているみたいに、裏声になる瞬間の感じや、息継ぎなどかなりリアルです。 他にも勝手にイメージソングを作るシリーズで、曲を公開しているので、気になる方は聞いてみてください。 歌詞付きの勝手にイメージソングリスト この曲を作るにはsunoというサービスを使用しています。 SUNO https://suno.com こちらのサイトで、無料でも1日10曲まで作ってもらえるので、気になる方は試してみてください。 1回で2曲生成されるので、実質1日5回試せる感じになります。 そこで、その手順を自分の場合って事で紹介します。 1.イメージソングを作るゲームの概要を作成します。   ゲームの内容が分からないと歌詞を作る事ができないので、そこから作る感じです。 2.AIで歌詞を作成   ゲーム概要をAIに食わせて、歌詞を作ってもらいます。   内容を指定すればいい感じで作ってくれますが、更に方向性や使う言葉を指定、または、使わないように指示を出

AIに自分のゲームプレイ動画を要約させてみた

AI関連

AIに自分のゲームプレイ動画を要約させてみた

AIのサービスは沢山ありますが、私が音声の文字起こしや要約するために普段使っているサービスに、YOUTUBEの動画要約機能があったので、使ってみました。 動画の音声を抽出して要約しているだけのサービスだとは思いますが、思ったよりいい感じに要約されていたので紹介です。 要約した動画はこちらになります。 つみげー #300-1 「Atomic Picnic」操作感が気持ちいいローグライクTPS https://youtu.be/XVJqa0wikb8 プレイしたゲームのストア 「Atomic Picnic」 https://store.steampowered.com/app/1903560/Atomic_Picnic/ AIの出した結果が以下になります。 Summary この動画はSteamで2300円で販売されているTPSゲーム「アトミックピクニック」のプレイ実況である。チュートリアルを通じて基本操作やゲームシステムを紹介し、武器の強化やキャラクターのアップグレード、装備の変更などの成長要素にも触れている。プレイヤーは敵との戦闘を繰り返しながらスキルや能力を解放

AIの種類って多いのでopenAIのchatGPTだけまとめてみた

AI関連

AIの種類って多いのでopenAIのchatGPTだけまとめてみた

色々なLLMがありますが、一番一般的に知られているのがchatGPTだと思います。 最近のAIの代名詞って感じでしょうか? 実際、「o4-mini」と「GPT-4o Mini」って何が違って、結局どっちが新しいの?何が違うの? と、聞かれるとさっぱりです・・・ 他にも、別の会社のAIも Grok DeepSeek Qwen Llama Claude Gemini なんて感じで沢山あります。 他もまとめたい所ですが、まずはchatGPTを調べる事にしました。 そこで、こういう事はAIさんにまとめてもらいました。 簡単にまとめると 幅広い用途・高精度を求めるなら:GPT-4o コスト重視・個人/小規模用途なら:GPT-4o Mini 人間らしさ・自然な対話重視なら:GPT-4.5 開発・業務自動化・長文処理なら:GPT-4.1 専門的な推論や研究開発なら:oシリーズ という感じですが、もう少し詳しく得意な物と不得意な物を表にしてみました 主なモデル一覧と特徴 モデル名リリース主な特徴・

AIで遊んでみよう! バイブコーディング STGを作ろう編

AI関連

AIで遊んでみよう! バイブコーディング STGを作ろう編

今回WEBブラウザで遊べるシューティングゲームをサクッと作ってみました。 実際に遊べるリンク https://test.aisgm.me/test_prog/js/001/ PCでしか動かせません。 操作は  WASD か カーソルキーの上下左右 それでは、制作過程を見ていきましょう! 前提条件 注意  PCで動かす事を前提にしているので、スマホでは動作しません。 操作は  WASD か カーソルキーの上下左右 Claude4 Sonnetを使用しました。 HTMLとCSSとJavaScriptを使用して作ったのでブラウザで動きます。 縦スクロースのシューティングゲームをHTML、JavaScript、CSS、を利用して作成してください。 以下の条件でお願いします。 ・自機は前後左右に動かす事ができ、画面外へ出る事ができません。 ・自機の耐久度は3でレベルアップすると、減っていても3へ回復します。 ・自機は敵の弾に当たると自機の耐久度が減り0になると磁気が破壊されゲームーバーとなります。 ・自機は上方弾を発射する事ができます。発射速度は0.5秒に1発自動で発射さ