最近気になった記事2026年01月14日

最近気になった記事2026年01月14日

GPT-5.2とGemini3の画像作成で大きな違いが出るのはなぜか GPTとGeminiの設計思想の違いを解説しています。 両方の特徴を理解して使い分ければ、欲しい情報や回答を得やすいって事だと思います。 記事では、以下のように GPT-5.2が考えるAIとして設計 と書かれており、考えをまとめたり問題点を洗い出すなど、何かをする前の準備段階で有効に使えそうで、 Gemini3は次のように書かれていて、 Gemini3は、業務で使われる成果物を作ることを強く意識した設計 最終的にまとめる時や、資料となる画像や具体的な書類を作成するのに向いている感じですね。 記事には以下のように書かれており、 GPT-5.2は、思考から表現へ進みます。Gemini3は、成果物から構成を逆算 GPT-5.2は優秀な戦略コンサルタントです。Gemini3は優秀な資料作成担当 アプローチが真逆なのが面白いですね。 だからこそ、使うタイミングや使い方が大事だと分かります。 更に、 日本語の文字化け問題は、すべての言語で同じように起きているわけではありません。 と書かれていて、そ

あけおめ動画を色々なAI動画生成で作ってみた

あけおめ動画を色々なAI動画生成で作ってみた

最近色々と忙しくて更新をサボっていましたが、久々の更新が「あけおめ」ですみません。 生成サービスで違いがあるので、その辺も含めてお楽しみください。 まずプロンプトですが、 全体的に日本のアニメ調にしてください。 日本の正月の挨拶用動画を作成してください。 画面上部に日本語で「あけましておめでとう」と毛筆で書いているように表示してください 画面下部にデフォルメしたリスを表示して正面へ向かって手を振ってください 画面左右に門松を配置してください 画面の左下に「AIS」と表記してください 正月の背景は日本っぽい風景にしてください といったプロンプトで作成していきます。 日本語の文字生成はsoraしか再現できないので、 画面上部に日本語で「あけましておめでとう」と毛筆で書いているように表示してください このプロンプトを削除して、文字以外で生成します。 必要なら後から動画編集ソフトで、文字を入れればいいかなと思います。 それでは、各動画生成AIで作成した動画を見ていきます。 最初はwan2.2で作成 ローカルで作成できるため、制限が無いので、数を作成しています。 一挙に3本

自分のSTEAMリプレイ2025の話

自分のSTEAMリプレイ2025の話

もう、今年もは終わりに近づいてきたので、2025年に遊んだSteamのゲームを振り返ってみたいと思います。 aisのSTEAMリプレイ2025 https://s.team/y25/jhcqwnq?l=japanese 公開に設定しているので、気になる方は見てみてください。 Steamのゲームを遊びたいと思いつつ、いまいち遊べていない感じがしていましたが、遊んでいるゲーム数も減っているので、コードレッドですw 動画の編集が意外と時間かかっているので、ここを少し省略したいなとか、「Super Mining Mechs」の動画編集が地味に時間かかっているのですが、無事最終回を迎えたので、少し楽になるかなと思います。 「Super Mining Mechs」プレイリスト プレイしたゲーム数が15本減っているみたいです。 去年も一昨年と比べて、かなり減っていたので、やばいですw 本数を沢山やればいいってもんじゃ無いですが、ゲームを遊んでいる時間も減っているので、じかんをつくれる男になろうと思いますw ほぼ半減で、実績の減りが凄いですw ゲームによって違うので、一概には言えませんが、や

Latest

比較的最近の気になったニュース11月03日

比較的最近の気になったニュース11月03日

『とんでもスキルで異世界放浪メシ2』シーズン2登場の企業20社が明らかに エバラや不二家など20社が協力 原作だとぼかされていたメーカー製品が、アニメで実際のメーカー名を出して表記しているので、原作ではやりたかったけどできなかったかもしれない事をアニメでできているのはいいですね。 メーカーもいい宣伝になるって判断でしょうかね 特に、海外へアニメは輸出されるので、知名度アップには貢献しそうです。 「DeepSeek-OCR」を試す 画像でテキストをトークン圧縮するDeepSeek-OCRがいろいろすごい AIネタです。 画像でテキストをトークン圧縮する研究をしていたら、OCR(Optical Character Recog nition(光学文字認識))の技術が凄い良くなったって事みたいです。 面白い上に有益ですね。 Web版 Claude Code の概要 Claude Codeは今までのAI支援開発ツールとは何が違うのか Claude Skillsを使ってみた - システムプロンプト的なカスタマイズが面白い Claude Codeのカスタムスラッシュコマンドをマスター

比較的最近の気になったニュース10月23日

比較的最近の気になったニュース10月23日

少し間が空いてしまったので、チェックしたニュースが溜まってしまいました。 Windows上でローカルAIの実行基盤となる「Windows ML」正式版に。CPU/GPU/NPUなどのハードウェアを抽象化した上でさまざまなAIモデルを実行 これが本格的に色々なAIモデルが出てくると、面白いことになりそうですね。 AIのdirectXみたいな事になって、色々な 韓国、政府のオンラインストレージが火災で焼失 8年分の業務資料858TBが消滅か バックアップなく「気が遠くなる」 現地報道 バックアップが大切だだとよく分かります。 それと、リチウムイオン電池は取扱注意ですね。 映像もあるので、こちらを参照してください SteamやPSNなど世界規模でゲームサービス障害が発生、AISURUボットネットが原因か? 結構広く影響があったみたいですね。 なんかSteamが不調だなぐらいに見てましたw 迷宮ダンジョン探索RPG『Paper Dungeon』、日本人気が凄いので日本語対応決定。1000人以上の日本ユーザーが待ちわびる なんかこういうニュースいいですよね。 ユーザー層を気に

最近のAI関連記事10月10日

最近のAI関連記事10月10日

社長が、自腹のRTX2080で国産生成AIをゼロから作ってみた話 https://note.com/rk611/n/n4dfffbbed408 実際に初歩的な事をやってみるは、経験として大きいかなと思いました。 ちょっと、やってみたくなりました。ハードルはちょっと高いですけど・・・ ″仕様駆動開発″というプロンプトを外付けするSpec Kit https://zenn.dev/watany/articles/46f7a8006eb054 kiroが人気になって、それ系の考え方で色々な物が作られていますが、これもその一つですね。 結局ちゃんと仕様書を作った方がいい物ができるのは自明なので、その仕組みをAI開発に持ち込むって事で、これもなるべくしてなった感はありますね。 複数 AI エージェントの MCP サーバーの設定を一元管理する「mmcp」の紹介 https://zenn.dev/kou_pg_0131/articles/mmcp-introduction いろいろやっていると、あると便利かもって感じだったのでメモ 【2025年版】テンセントAI「Hunyuan (混元)

HuMo AIを軽く使ってみた(ローカル動画生成AI)

HuMo AIを軽く使ってみた(ローカル動画生成AI)

「HuMo AI」が「ComfyUI」から簡単に利用できるようになったので、軽く使って見ました。 この生成AIのポイントが何かというと、 テキスト + 画像 テキスト + オーディオ テキスト + 画像 + オーディオ このようにプロンプトに画像やオーディをを合わせた動画を作成できます。 テキスト+画像は、よくあるベース画像にテキストのプロンプトで動きやシーンを指示するものです。 オーディオはリップシンクしてくれるので(最近は当たり前のようにリンプシンクしてくれるので凄いですよね)、テキストの読み上げ音声に合わせて唇が動く動画や、歌に合わせて唇を動かすものから、曲に合わせてダンスする物も作成できる感じです いろいろ試してみましたが、私の環境「RTX5070 Ti」だと、メモリーの都合で最大6秒ぐらいまでしか生成できませんでした。 ですので、安定して生成できる5秒の動画を作成しています。 ただ、3秒までの生成が、動画のクオリティも上がる感じがするので、5秒まで生成できるが3秒までが推奨のなんだと思います。 では、実際にやってみました。 最初はテキストプロンプトと音楽のみです。

「Audio Converter & Splitter」の使い方

「Audio Converter & Splitter」の使い方

ソフトウェア公開サイトソフトウェア公開サイト Audio Converter & Splitter https://test.aisgm.me/test_prog/app/audio-converter/ アプリの公開用サイト 使い方 音ファイルを点線の枠内にドラッグ&ドロップします。 画像では赤い部分です ファイルを選択します。 同時に複数のファイルをアップできるので、分割したりフォーマット変換したいファイルを選択します。 音声分割を行う場合、分割方法(黄緑)の選択をして、分割数(黄色)を指定します。 秒数指定を行いたい場合は、秒数を指定します。 水色部分をクリックすると分割処理が始まります。 今回は14秒単位での分割を行いました。 処理が終わると画像のような表示になり、赤い部分をクリックすると一括でダウンロードできます。 それぞれのファイル毎にダウンロードすると事もできます。 フォーマット変換する場合 WAV、MP3、ogg、それぞれ変換することができます。 赤い部分で変換先のフォーマットを選択します。 青い部分が実行ボタンになるので、設定に

素人が作る実写っぽいミュージックビデオの作り方 その2

素人が作る実写っぽいミュージックビデオの作り方 その2

今回のポイント ・歌の音ファイルの作り方 ・音ファイルを動画生成用に分割する ・リップシンクの動画ファイルの作り方 ・動画編集 前段は前回の記事を参照してください 音楽ファイルの作成 SUNO AIを使用して作成しています。 ベースの歌詞をAIに作成してもらって、手直しします。 どんな歌詞を作るか、概要をまとめてAIに渡します。 具体的なプロンプト 作りたい歌詞の内容や使用したい単語、曲のイメージを説明します。 それに、以下の分をコピペしてくっつけてAIに投げます。 歌詞は以下のタグ中から使用してください [Verse 1] [Verse 2] [Verse 3] [Verse 4] [Chorus] [Powerful‐Chorus] [Bridge] [Outro] [Lead-In] [Pre-Chorus] [Post-Chorus] [Ending] [rap] [hook] [drop] [hook] [Piano-solo] [Violin‐solo] [Drums‐solo] [Bass Drum‐solo] [Electr

素人が作る実写っぽいミュージックビデオの作り方 その1

素人が作る実写っぽいミュージックビデオの作り方 その1

結構長くなりそうなので、何回かに分けて書きます。 続きは以下からどうぞ 素人が作る実写っぽいミュージックビデオの作り方 その2 今回作成したミュージックビデオです。 音楽以外はローカルで作成しました。 クラウドサービスは、結構サービス料金がかかりますが、GPUの購入価格と比較すると、どちらが高くなるかは、使用頻度なんかで変わるかと思います。 一点、ローカルで有利なので、試行錯誤を行いやすい事でしょうか? ローカル環境の紹介と大雑把な制作の流れ、クラウドとの比較なんかをしていきたいと思います。 今回の実際に作成した過程や、ローカル環境での細かい作り方等は次回行いたいと思います。 まず作成環境 動画生成 AMD Ryzen AI 9 HX 370 / Radeon 890M RTX5070TI 動画生成ツールは「ComfyUI」を使用 AIは「WAN2.2」と「humo」を使用しました。 音楽はSUNOを使用しました。 音楽作成はSUNO Ver4.5+が最新だったので、Ver4.5+です。 元々の女性はQwenImageを使用しました。 動画は比較的生成

比較的最近の気になったニュース9月23日

比較的最近の気になったニュース9月23日

「Claude」、チャットからPDFやスプレッドシートの作成が可能に 結構便利そうです。 ただセキュリティーの懸念はあるみたいなので、注意が必要かも。 「Googleドライブ」を使うみたいなので、専用のGoogleアカウントを作るとかですかね。 国内1000件の事例や製品を収録した「生成AI活用事例データベース」を公開─生成AI活用普及協会 事例を知るだけでも、色々と推測できたり思いがけない使われ方を知れたりするので結構有用に思います。 主従を入れ替えたIntelとNVIDIAの歴史的提携発表、その背景にAIデータセンターあり Intel主体の時はNVIDIAを拒み続けてきた訳ですが、NVIDIAが金の力でIntelをねじ伏せる日が来るとは・・・・ 沢山このニュースの記事はありますが、大手新聞記事含めてもこの記事が一番内容がいいです。 歴史的な経緯の解説がちゃんとあって、このニュースがどれだけ大きな意味を持つのかちゃんと書かれています。 表面的な記事を読むくらいなら、この記事を是非読んで欲しいです。 この記事を書かれている方は、この業界を長年取材して大変詳しい方です。

比較的最近の気になったニュース9月17日

比較的最近の気になったニュース9月17日

最近色々忙しい上に、動画のストックが無くて、絶賛ブログの更新が滞ってます・・・・ spec-workflow-mcpを使ってみたら気に入ったので、紹介する 確かにkiroがめっちゃ良かったので、ちゃんと仕様書を作って何か作った方が手戻りが少なかったり、結果早くできあがるなど良い事が多いので、それを実現するための別ツールとか紹介されると使って見たいですね。 また使ったら記事書こうと思います。 手はPS5コン、足はDDRコン。海外配信者が全身を使って『SEKIRO』“あの強敵”を2体同時撃破!超人技すぎる これは凄いというか、馬鹿(褒め言葉)ですねw 記事で動画が埋め込みで見られますが、画面2つとプレイヤーのGloomshadows氏が写っていますが、Gloomshadows氏の手元と足下を見ていると、何をしているか分からないので、画面を見ると片方しか見ているこちらが認識できないですw 見る方が忙しすぎて、なんか分からんけど凄いって結論ですw 中国実写“死にゲーADV”『盛世天下~女帝への道~』初動でSteam同接「1万人以上」のブレイク中。一寸先は死、危険すぎる宮廷サバイ

Googleの「Nano Banana」を使ってみる(「QWEN Image edit」と比較可能なテストしました)

Googleの「Nano Banana」を使ってみる(「QWEN Image edit」と比較可能なテストしました)

前回「QWEN Image edit」で行ったような事を、こちらでもやってみます。 前提条件として「QWEN Image edit」はローカルで動かしているので、制限がほぼ無い事と、試行回数を増やしていい結果が出るまでpromptの調節を繰り返しやすいですが、前回は実験だったので、基本的に最初に出してきた物を使っています 今回はGoogleのサービスで、更に無料プランで使用させてもらっているので、有料にした場合結果が違う事もあるかもしれません。 その辺はご了承ください。(AIサービスは基本的に有料プラン優遇です) それでは実験していきます。 「QWEN Image edit」で使用したお姉さんを使います。 この画像をアップロードして、プロンプトで変更していきます。 まずは、背景を変えていきます。 以下プロンプト 背景を大都市のビルの屋上にして、ホワイトボードを消してください。 空に大きく雲で"AIS blog"と書いてください。 女性には手を加えずに、背景を変更します。 Geminiの返答 はい、承知いたしました。背景を大都市のビルの屋上にして、ホ

比較的最近の気になったニュース9月09日

比較的最近の気になったニュース9月09日

YouTube、無許可でAIによる投稿動画の加工を行っていたと判明。クリエイターの間で波紋 記事読んでみると、加工の方向も「ぼやけやノイズを軽減」「画像を鮮明化」なので、内容に変更を加えるというより、映像をより見やすくするための物なので、敏感に反応しすぎな気はします。 そもそも、ネット上の映像や画像は人間の目の錯覚等を利用して、以下にデータを小さくするかを常に行っていて、音だってMP3なんて、可聴範囲外(人が聞き取れると言われている範囲外)を削ったり、その他色々な技術でデータサイズを小さくしているので、耳のいい人が聞くと分かると言われます。 早い話が、 ネット上にあるデジタルの音や画像ってのは、色々な技術でデータサイズを小さくしています。 その時点で、ものすごくデータは劣化していて、元の情報はかなり失われています。これも改変と言えば改変ですよね。 とは言え、その分データサイズは小さくなっているので、現在のインターネットでは必要不可欠です。データが小さければ小さいほど、ギガの消費は抑えられますし。 そんな中、新しい技術としてAIが出てきていますが、スマホやPC側で動画データを表示する時

Qwen Image editを使ってみた

Qwen Image editを使ってみた

「Qwen Image edit」は、既にある画像をプロンプトで加工する機能です。 基本的に元の画像を維持した状態で、プロンプトで指定した部分だけを変える事ができます。 ちなみに元々の「Qwen Image」には、テキストから画像生成するAIです。 過去の記事で紹介しているので参考にしてください。 では、実際に加工してみます。 「Qwen Image」で作成した画像を用意しました。 この画像を、加工していきます。 まずは、背景を変えていきます。 以下プロンプト 背景を大都市のビルの屋上にして、ホワイトボードを消してください。 空に大きく雲で"AIS blog"と書いてください。 完全に場所を変えてみます。 雲に文字を書いてみます。 以下が結果です 今度は、女性の着せ替えをやってみます。 以下がプロンプトです。 背景を大都市のビルの屋上にして、ホワイトボードを消してください。 空に大きく雲で"AIS blog"と書いてください。 女性の洋服をカジュアルなTシャツとホットパンツに替えてください 背景等のベースは同じで、服だけ変更してみ