ローカルで効果音が作成できるAI「MMAudio」を使ってみた(「Waves Place」と同じ効果音も作ってみました)

ローカルで効果音が作成できるAI「MMAudio」を使ってみた(「Waves Place」と同じ効果音も作ってみました)

MMAudio は、ビデオやテキストや画像の入力が与えられると、動画は同期されたオーディオ、画像はそれに合った音を生成します。

使用方法は

Pinokio
https://pinokio.co/

こちらのアプリからインストールして、「MMAudio」を使います。
インストール方法などは別記事を書きたいと思います。

比較対象として
時計のG-shockでおなじみのCASIO(カシオ)の新サービス!AIで効果音が生成できる「Waves Place」を試してみた

の記事と比較しやすいように、同じようなプロンプトで作成します。

MMAudio は、ビデオやテキストや画像の入力が与えられると、動画は同期されたオーディオ、画像はそれに合った音を生成します。
使い方が非常に簡単な上に、動画に合わせて生成できるのも使い勝手がいいですね。カシオの「Waves Place」はテキストからだけだったので、こちらの方が少し上な感じがします。

実際にできるのは、
・テキストから効果音生成
・画像から効果の音生成
・動画に合わせて効果音生成

前に「Waves Place」用に作成した動画が、丁度あるので、これに音を付け直してもらいます。
既にある動画に音を入れる事ができるのは面白いですね。

最初は鯨の動画の音を変えてみます。

0:00
/0:04

動画は「Waves Place」と同じで、効果音だけ付け直しました。
「MMAudio」は動画を指定するだけで、音を付け替えてくれるので、結構簡単に作成できます。
今回は4秒でしたが、もっと長い音でも大丈夫です。

次は花火大会です

0:00
/0:04

結構リアルでいい感じになってますね。
特に花火を遠くから見ている時の独特な反響とか、送れてから音が届く感じなどが良く表現されているように思います。

次はダイナマイトの爆発です。

0:00
/0:04

爆発音としての強さがあって、「Waves Place」よりも「MMAudio」の方がいい感じですね。
好みもあるとは思いますが、概ね「MMAudio」の方がリアリティーがある音になっているかと思います。

最後に自販機いってみます

0:00
/0:04

動画には合っていますが、動画がおかしいのでなんとも言えませんw
なので、今度はテキストから効果音を作成してみたいと思います。

最初は鯨

0:00
/0:04

歯がちょっと怖い感じになっていますがいい感じです。
次は、花火です。

0:00
/0:04

花火も、ちょっと距離を感じる音がしますが、いい感じです。
次はダイナマイトです。

0:00
/0:03

これも、ダイナマイト本体が結構長く残っていますが、効果音がちゃんと爆発音な感じなので、悪くないです。

次は、自動販売機ですが、これがなかなか前回もうまく行きませんでしたが、今回もうまく行きません。
爆発とか水しぶきなど、分かりやすい音は再現性高いですが、それ以外となると、色々と難しいですね。
自動販売機も動作音と、缶が落ちてくる音など、別々に生成して組み合わせる方が精度高そうです。

本末転倒ですが、家の近くにある自動販売機で購入音を録音した方が早そうですよねw
と言う訳で、数々の失敗自販機の動画をお送りしますw

0:00
/0:04

自販機が稼働している音はしますが、何も動かないw
自販機を撮影しただけになっています。
次は、新型自販機ですw

0:00
/0:04

なんと中身が動いているんですが、意味があるのでしょうか?w
次は、ただいま印刷中!

0:00
/0:04

3Dプリンタでジュースを印刷しているような演出w
そんな自販機なら、凄いですけどねw
次は、ジュースを充填しながら売っています。
後ろの方を注目して見てください。

0:00
/0:04

蕎麦やうどんの自販機みたいに、自販機で調理しているみたいな感じですかね。
謎の飲み物を、充填してますw
次は踊る自販機です

0:00
/0:04

これは、今でも実現できそう!既にあってもおかしくないですね
次は、縮尺・・・???

0:00
/0:04

一見普通の自販機ですが・・・・
人が出てくるとおかしな感じになりますw

と言うわでどうだったでしょうか?
AIで効果音を作って動画を作る所までやってみましたが、AIに得意な物と不得意な物がよく分かりますね
結構簡単だったので、近日中に効果音を作るAIのインストールから使い方の記事も書きたいと思います。

最後おまけで、プロンプト間違えて、鯨の動画作る時に、ダイナマイトのプロンプトを入れて作った結果です・・・

0:00
/0:03

Read more

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットの正体とWebPの「予測マジック」を理解する 次世代画像フォーマットAVIFを触ってみた 割と最近の画像圧縮フォーマットについてです。 「webp」は比較的見るようになったフォーマットですが、従来は画像のサイズが小さいのはJPGで、透明色が使えて画質を維持するのがPNGって感じで、使い分けられていると思います。 しかし、JPGは古いフォーマットで圧縮アルゴリズムも古い上に、透明色が使えないなど改良の余地が多々あるので、「JPEG 2000」というフォーマットも作成されました。 「JPEG 2000」は技術的には従来のJPEGを大幅に上回る優秀なフォーマットにもかかわらず、処理負荷の高さや互換性の問題から一般消費者向けには普及しませんでした。 今となっては、それ程負荷は高くないのですが、開発された当時(2000年代前半)のPCのスペックを考えると厳しかったと思われます。 2001年のPCスペックを調べてみました。 Intel Pentium III 256MBから512MBのRAM 20GBから80GB Windows 98やWindows 2000が主流 この

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5を使ってみましたが、なんか音の厚みが増して日本語の再現度も上がって、歌唱クオリティが一ランク上がったように感じるほどです。 とりあえずバージョンの歴史から V2 (2023年秋):  最大生成時間は1分20秒でした V3 (2024年春):  生成時間が2分に更新されました V3.5 (2024年夏): 曲の構造が改善され、初回生成の最大時間が4分に、延長                       (Extend)は1回につき最大2分まで可能になりました V4 (2024年11月): ボーカル品質が向上し、初回生成の最大時間は4分です。また、「Extend(延長)」「Cover(カバー)」「Persona(ペルソナ)」機能が追加されました V4.5 (2025年5月): 初回生成の最大時間が8分に延長され、プロンプトへの忠実度やスタイルのマッシュアップ機能が向上しました V4.5+ (2025年7月): 「Add Vocals(ボーカル追加)」や「Add Instrumental(インスト追加)」などの制作ツールが更新されました V5 (2025年9月):  オーディ

「NANObanana」があれば、LINEスタンプいらなくね?

「NANObanana」があれば、LINEスタンプいらなくね?

LINEスタンプはすぐに返せて便利なんですが、返したいスタンプを探すのが結構手間になってきています。 スタンプをそれ程沢山持っている訳じゃないんですが、30弱程度あります。 それだけでも、確かこんなのあったなとか、軽い感じのお礼スタンプどれがいいかなとか、選ぶのに時間がかかると、手軽に返せるスタンプの意味がありません。 そこで「NANObanana」です。画像に日本語も入れてもらえるので、スタンプが必要な時に、その場にあったスタンプを作ってしまえばいい!! と言う事で、やってみました。 スタンプのプロンプトは、うまい人がいると思うので、そこを突き詰めたい人はその手の記事を参考にしてください。 今回は、お手軽にその場でスタンプを作って、友人とかに利用するってお話です。 とは言え、イメージ通りの結果は欲しいので、何を注意すればそれっぽく作れるのかは少し実験してみたいと思います。 まずはAIに素直に聞いてみる。AIの事はAIに聞くのが一番です。 次の事に注意しろと教えてもらえます。 キャラクター設定: どのキャラクターを使いたいかを明確に指定します。 セリフや感情表現: どのようなセ

「Claude Code」 関連記事まとめ

「Claude Code」 関連記事まとめ

日々「Claude Code」を使用していますが、新しいツールや「Claude Code」自信もバージョンアップしているため、私自身もアップデートしていかないと、いつの間にか置いて行かれて非効率な使い方をしていたなんて事になりかねません。 と言う訳で、個人的に参考になったり、読んでいて面白かった記事をピックアップしました。 良ければ参考にしてください。 簡単コピペでClaude Codeに144種類のエージェントチームを作成 ── agency-agentsという40Kスター超のAIエージェント集を使いこなす 「Claude Code」は、エージェント次第で生成するコードの質が変わってきます。 まだ使ってはいませんが、使って見ようと思ってます。 効果的なCLAUDE.mdの書き方 「Claude Code」は「CLAUDE.md」の書き方次第でも違いが出るので、この辺も見ておくといいかも内容です。「Claude Code」を使う上での基本ですね。 【2026年版】Claude Codeを最強にするプラグイン・MCP・ツール総まとめ これも結構参考になると思います。 はやり廃りがあ