ais

比較的最近の気になったニュース10月23日

比較的最近の気になったニュース10月23日

少し間が空いてしまったので、チェックしたニュースが溜まってしまいました。 Windows上でローカルAIの実行基盤となる「Windows ML」正式版に。CPU/GPU/NPUなどのハードウェアを抽象化した上でさまざまなAIモデルを実行 これが本格的に色々なAIモデルが出てくると、面白いことになりそうですね。 AIのdirectXみたいな事になって、色々な 韓国、政府のオンラインストレージが火災で焼失 8年分の業務資料858TBが消滅か バックアップなく「気が遠くなる」 現地報道 バックアップが大切だだとよく分かります。 それと、リチウムイオン電池は取扱注意ですね。 映像もあるので、こちらを参照してください SteamやPSNなど世界規模でゲームサービス障害が発生、AISURUボットネットが原因か? 結構広く影響があったみたいですね。 なんかSteamが不調だなぐらいに見てましたw 迷宮ダンジョン探索RPG『Paper Dungeon』、日本人気が凄いので日本語対応決定。1000人以上の日本ユーザーが待ちわびる なんかこういうニュースいいですよね。 ユーザー層を気に

最近のAI関連記事10月10日

最近のAI関連記事10月10日

社長が、自腹のRTX2080で国産生成AIをゼロから作ってみた話 https://note.com/rk611/n/n4dfffbbed408 実際に初歩的な事をやってみるは、経験として大きいかなと思いました。 ちょっと、やってみたくなりました。ハードルはちょっと高いですけど・・・ ″仕様駆動開発″というプロンプトを外付けするSpec Kit https://zenn.dev/watany/articles/46f7a8006eb054 kiroが人気になって、それ系の考え方で色々な物が作られていますが、これもその一つですね。 結局ちゃんと仕様書を作った方がいい物ができるのは自明なので、その仕組みをAI開発に持ち込むって事で、これもなるべくしてなった感はありますね。 複数 AI エージェントの MCP サーバーの設定を一元管理する「mmcp」の紹介 https://zenn.dev/kou_pg_0131/articles/mmcp-introduction いろいろやっていると、あると便利かもって感じだったのでメモ 【2025年版】テンセントAI「Hunyuan (混元)

HuMo AIを軽く使ってみた(ローカル動画生成AI)

HuMo AIを軽く使ってみた(ローカル動画生成AI)

「HuMo AI」が「ComfyUI」から簡単に利用できるようになったので、軽く使って見ました。 この生成AIのポイントが何かというと、 テキスト + 画像 テキスト + オーディオ テキスト + 画像 + オーディオ このようにプロンプトに画像やオーディをを合わせた動画を作成できます。 テキスト+画像は、よくあるベース画像にテキストのプロンプトで動きやシーンを指示するものです。 オーディオはリップシンクしてくれるので(最近は当たり前のようにリンプシンクしてくれるので凄いですよね)、テキストの読み上げ音声に合わせて唇が動く動画や、歌に合わせて唇を動かすものから、曲に合わせてダンスする物も作成できる感じです いろいろ試してみましたが、私の環境「RTX5070 Ti」だと、メモリーの都合で最大6秒ぐらいまでしか生成できませんでした。 ですので、安定して生成できる5秒の動画を作成しています。 ただ、3秒までの生成が、動画のクオリティも上がる感じがするので、5秒まで生成できるが3秒までが推奨のなんだと思います。 では、実際にやってみました。 最初はテキストプロンプトと音楽のみです。

「Audio Converter & Splitter」の使い方

「Audio Converter & Splitter」の使い方

ソフトウェア公開サイトソフトウェア公開サイト Audio Converter & Splitter https://test.aisgm.me/test_prog/app/audio-converter/ アプリの公開用サイト 使い方 音ファイルを点線の枠内にドラッグ&ドロップします。 画像では赤い部分です ファイルを選択します。 同時に複数のファイルをアップできるので、分割したりフォーマット変換したいファイルを選択します。 音声分割を行う場合、分割方法(黄緑)の選択をして、分割数(黄色)を指定します。 秒数指定を行いたい場合は、秒数を指定します。 水色部分をクリックすると分割処理が始まります。 今回は14秒単位での分割を行いました。 処理が終わると画像のような表示になり、赤い部分をクリックすると一括でダウンロードできます。 それぞれのファイル毎にダウンロードすると事もできます。 フォーマット変換する場合 WAV、MP3、ogg、それぞれ変換することができます。 赤い部分で変換先のフォーマットを選択します。 青い部分が実行ボタンになるので、設定に

素人が作る実写っぽいミュージックビデオの作り方 その2

素人が作る実写っぽいミュージックビデオの作り方 その2

今回のポイント ・歌の音ファイルの作り方 ・音ファイルを動画生成用に分割する ・リップシンクの動画ファイルの作り方 ・動画編集 前段は前回の記事を参照してください 音楽ファイルの作成 SUNO AIを使用して作成しています。 ベースの歌詞をAIに作成してもらって、手直しします。 どんな歌詞を作るか、概要をまとめてAIに渡します。 具体的なプロンプト 作りたい歌詞の内容や使用したい単語、曲のイメージを説明します。 それに、以下の分をコピペしてくっつけてAIに投げます。 歌詞は以下のタグ中から使用してください [Verse 1] [Verse 2] [Verse 3] [Verse 4] [Chorus] [Powerful‐Chorus] [Bridge] [Outro] [Lead-In] [Pre-Chorus] [Post-Chorus] [Ending] [rap] [hook] [drop] [hook] [Piano-solo] [Violin‐solo] [Drums‐solo] [Bass Drum‐solo] [Electr

素人が作る実写っぽいミュージックビデオの作り方 その1

素人が作る実写っぽいミュージックビデオの作り方 その1

結構長くなりそうなので、何回かに分けて書きます。 続きは以下からどうぞ 素人が作る実写っぽいミュージックビデオの作り方 その2 今回作成したミュージックビデオです。 音楽以外はローカルで作成しました。 クラウドサービスは、結構サービス料金がかかりますが、GPUの購入価格と比較すると、どちらが高くなるかは、使用頻度なんかで変わるかと思います。 一点、ローカルで有利なので、試行錯誤を行いやすい事でしょうか? ローカル環境の紹介と大雑把な制作の流れ、クラウドとの比較なんかをしていきたいと思います。 今回の実際に作成した過程や、ローカル環境での細かい作り方等は次回行いたいと思います。 まず作成環境 動画生成 AMD Ryzen AI 9 HX 370 / Radeon 890M RTX5070TI 動画生成ツールは「ComfyUI」を使用 AIは「WAN2.2」と「humo」を使用しました。 音楽はSUNOを使用しました。 音楽作成はSUNO Ver4.5+が最新だったので、Ver4.5+です。 元々の女性はQwenImageを使用しました。 動画は比較的生成

比較的最近の気になったニュース9月23日

比較的最近の気になったニュース9月23日

「Claude」、チャットからPDFやスプレッドシートの作成が可能に 結構便利そうです。 ただセキュリティーの懸念はあるみたいなので、注意が必要かも。 「Googleドライブ」を使うみたいなので、専用のGoogleアカウントを作るとかですかね。 国内1000件の事例や製品を収録した「生成AI活用事例データベース」を公開─生成AI活用普及協会 事例を知るだけでも、色々と推測できたり思いがけない使われ方を知れたりするので結構有用に思います。 主従を入れ替えたIntelとNVIDIAの歴史的提携発表、その背景にAIデータセンターあり Intel主体の時はNVIDIAを拒み続けてきた訳ですが、NVIDIAが金の力でIntelをねじ伏せる日が来るとは・・・・ 沢山このニュースの記事はありますが、大手新聞記事含めてもこの記事が一番内容がいいです。 歴史的な経緯の解説がちゃんとあって、このニュースがどれだけ大きな意味を持つのかちゃんと書かれています。 表面的な記事を読むくらいなら、この記事を是非読んで欲しいです。 この記事を書かれている方は、この業界を長年取材して大変詳しい方です。

比較的最近の気になったニュース9月17日

比較的最近の気になったニュース9月17日

最近色々忙しい上に、動画のストックが無くて、絶賛ブログの更新が滞ってます・・・・ spec-workflow-mcpを使ってみたら気に入ったので、紹介する 確かにkiroがめっちゃ良かったので、ちゃんと仕様書を作って何か作った方が手戻りが少なかったり、結果早くできあがるなど良い事が多いので、それを実現するための別ツールとか紹介されると使って見たいですね。 また使ったら記事書こうと思います。 手はPS5コン、足はDDRコン。海外配信者が全身を使って『SEKIRO』“あの強敵”を2体同時撃破!超人技すぎる これは凄いというか、馬鹿(褒め言葉)ですねw 記事で動画が埋め込みで見られますが、画面2つとプレイヤーのGloomshadows氏が写っていますが、Gloomshadows氏の手元と足下を見ていると、何をしているか分からないので、画面を見ると片方しか見ているこちらが認識できないですw 見る方が忙しすぎて、なんか分からんけど凄いって結論ですw 中国実写“死にゲーADV”『盛世天下~女帝への道~』初動でSteam同接「1万人以上」のブレイク中。一寸先は死、危険すぎる宮廷サバイ

Googleの「Nano Banana」を使ってみる(「QWEN Image edit」と比較可能なテストしました)

Googleの「Nano Banana」を使ってみる(「QWEN Image edit」と比較可能なテストしました)

前回「QWEN Image edit」で行ったような事を、こちらでもやってみます。 前提条件として「QWEN Image edit」はローカルで動かしているので、制限がほぼ無い事と、試行回数を増やしていい結果が出るまでpromptの調節を繰り返しやすいですが、前回は実験だったので、基本的に最初に出してきた物を使っています 今回はGoogleのサービスで、更に無料プランで使用させてもらっているので、有料にした場合結果が違う事もあるかもしれません。 その辺はご了承ください。(AIサービスは基本的に有料プラン優遇です) それでは実験していきます。 「QWEN Image edit」で使用したお姉さんを使います。 この画像をアップロードして、プロンプトで変更していきます。 まずは、背景を変えていきます。 以下プロンプト 背景を大都市のビルの屋上にして、ホワイトボードを消してください。 空に大きく雲で"AIS blog"と書いてください。 女性には手を加えずに、背景を変更します。 Geminiの返答 はい、承知いたしました。背景を大都市のビルの屋上にして、ホ

比較的最近の気になったニュース9月09日

比較的最近の気になったニュース9月09日

YouTube、無許可でAIによる投稿動画の加工を行っていたと判明。クリエイターの間で波紋 記事読んでみると、加工の方向も「ぼやけやノイズを軽減」「画像を鮮明化」なので、内容に変更を加えるというより、映像をより見やすくするための物なので、敏感に反応しすぎな気はします。 そもそも、ネット上の映像や画像は人間の目の錯覚等を利用して、以下にデータを小さくするかを常に行っていて、音だってMP3なんて、可聴範囲外(人が聞き取れると言われている範囲外)を削ったり、その他色々な技術でデータサイズを小さくしているので、耳のいい人が聞くと分かると言われます。 早い話が、 ネット上にあるデジタルの音や画像ってのは、色々な技術でデータサイズを小さくしています。 その時点で、ものすごくデータは劣化していて、元の情報はかなり失われています。これも改変と言えば改変ですよね。 とは言え、その分データサイズは小さくなっているので、現在のインターネットでは必要不可欠です。データが小さければ小さいほど、ギガの消費は抑えられますし。 そんな中、新しい技術としてAIが出てきていますが、スマホやPC側で動画データを表示する時

Qwen Image editを使ってみた

Qwen Image editを使ってみた

「Qwen Image edit」は、既にある画像をプロンプトで加工する機能です。 基本的に元の画像を維持した状態で、プロンプトで指定した部分だけを変える事ができます。 ちなみに元々の「Qwen Image」には、テキストから画像生成するAIです。 過去の記事で紹介しているので参考にしてください。 では、実際に加工してみます。 「Qwen Image」で作成した画像を用意しました。 この画像を、加工していきます。 まずは、背景を変えていきます。 以下プロンプト 背景を大都市のビルの屋上にして、ホワイトボードを消してください。 空に大きく雲で"AIS blog"と書いてください。 完全に場所を変えてみます。 雲に文字を書いてみます。 以下が結果です 今度は、女性の着せ替えをやってみます。 以下がプロンプトです。 背景を大都市のビルの屋上にして、ホワイトボードを消してください。 空に大きく雲で"AIS blog"と書いてください。 女性の洋服をカジュアルなTシャツとホットパンツに替えてください 背景等のベースは同じで、服だけ変更してみ

Windows環境の「Claude Code」で「Serena」を使ってみる(主にエラー対応)

Windows環境の「Claude Code」で「Serena」を使ってみる(主にエラー対応)

使い方や、コマンド例など情報はかなりあるのですが、その通りやっても動かない。 Windowsでと書いてあっても、PowerShellで動かしていなかったり、ちょっと環境が違う。 ちなみに、AIにも聞いてみましたが、いまいちピントを外した解答だったので(一応提示された対応は試してみました)、まあそうだよねって結果でした。 PowerShell限定で更に調べてみると、同じような苦労をしている人が世界に何人かはいて、解決方法も提示してくれています。 Claude Code + Serena for Windows 記事を参照しつつまとめると このコマンドを実行するとエラーになる claude mcp add serena -- uvx --from git+https://github.com/oraios/serena serena-mcp-server --context ide-assistant --project $(pwd) error: unknown option '--from' このコマンドを実行するととりあえず動く claude mcp