素人が作る実写っぽいミュージックビデオの作り方 その2

素人が作る実写っぽいミュージックビデオの作り方 その2

今回のポイント

・歌の音ファイルの作り方
・音ファイルを動画生成用に分割する
・リップシンクの動画ファイルの作り方
・動画編集

前段は前回の記事を参照してください

音楽ファイルの作成

SUNO AIを使用して作成しています。

ベースの歌詞をAIに作成してもらって、手直しします。
どんな歌詞を作るか、概要をまとめてAIに渡します。

具体的なプロンプト

作りたい歌詞の内容や使用したい単語、曲のイメージを説明します。
それに、以下の分をコピペしてくっつけてAIに投げます。

歌詞は以下のタグ中から使用してください
[Verse 1]
[Verse 2]
[Verse 3]
[Verse 4]
[Chorus]
[Powerful‐Chorus]
[Bridge]
[Outro]
[Lead-In]
[Pre-Chorus]
[Post-Chorus]
[Ending]
[rap]
[hook]
[drop]
[hook]

[Piano-solo]
[Violin‐solo]
[Drums‐solo]
[Bass Drum‐solo]
[Electric Guitar‐solo]
[Guitar‐solo]
[Shamisen‐solo]
[Shakuhachi‐solo]

と指示すると、いい感じに、SUNOに流し込むだけで利用できる歌詞を作成してくれます。

AIはクラウドのサービスであれば、ほぼ問題無く生成してくれます。
以下のサービスでは問題ありませんでした。

GPT-5
Grok4
Claude 4 Sonnet
Gemini 2.5 Pro

歌詞の手直し

SUNOが歌いにくい単語などがあるので、実際に1曲作成して、それを聞くと苦手な単語や、読み間違える漢字が分かるので、違う言葉に置き換えた漢字を平仮名に変えるなど、変更を加えます。
それから、実際に曲として聞いてみると、歌詞の意味や言葉のチョイスで気になる単語が出てくるので、あれば変更します。

曲調の指定

曲調ですが、いわゆるj-popとかrockとか、曲のスタイルを指定します。
これは作りたい曲調を指定するのが良いのですが、ドット絵のイメージ曲だったら、

chiptune, 8-bit

って感じで指定すると、ピコピコ音の楽曲が生成されます。

スタイルの数は多いので、解説している記事などを参考にするといいと思いますが、よく使うスタイルのプロンプトを管理するツールの、prompt builder を使用しています。
生成AIは、過去に使用したプロンプトを組み合わせて使用する事が多いので、結構便利です。

ある程度歌詞が固まったら、曲調を変更して何種類か曲を生成してもらいます。
10曲とか作っても、最初の曲が一番いいなんて事もあったりしますが、沢山作ると全部聞いて判断するので結構時間かかります。
そして、いい曲ができたらダウンロードします。

次に、ダウンロードしたWAVファイルを分割して生成で利用しやすくします。

音ファイルの分割

その1でも軽く説明しましたが、ファイルを分割した方が生成の効率が良いので、分割するツールを利用します。
Audio Converter & Splitter
https://test.aisgm.me/test_prog/app/audio-converter/
これを利用します。

使い方を近日中に別記事を書きます

「Audio Converter & Splitter」の使い方

このツールはファイル分割とファイルのフォーマット変換を行う事ができるWEBツールで、処理はブラウザ上のローカルで行われるため、ファイルをサーバーにはアップロードしないので、セキュリティー的にも安心です。
その代わり、PCの性能が影響するので、遅いPCで使用すると、処理に時間がかかります。

分割は、分割数と秒数で分割する事ができます。
分割数指定は、指定した分割数で等分に分割します。
秒数指定分割は、して秒数毎に分割していき、最後のファイルは余った時間が入る感じになります。

その1でも書きましたが、今回の音楽は3分18秒 = 198秒となるので、14秒で分割して15ファイル作成します。

作成した15ファイルを全部リップシンクの動画化していきます。
プロンプトもシンプルに、「女性はスタジオで歌を歌っている」で作成していきます。
元イメージは以下になります。

まず、このイメージを作成してから、このイメージを元に広げていきました。
QwenImageEditを使用して、服装や場所を変えていきます。
背景を海や砂漠にして、MVっぽい感じを出していきます。
実際に制作した画像が以下になります。

ここから、動画を作成します。
実際に作成した物はこちら(※注意 音が出ます)

0:00
/0:14
0:00
/0:14
0:00
/0:05
0:00
/0:05

プロンプトは「女性は歌いながらリズムに合わせてダンスをする」など、ここからカメラワークを足したり、歌わずにダンスだけさせるなど、バリエーションを作っていきます。
ここでは、4動画しか紹介していませんが、300動画ほど作成して、そこから良い物を使うといった感じになります。
生成AIの種類やワークフロー(生成する時の設定的なやつ)次第で時間の長さや、生成にかかる時間も違うので、試しながら良い結果が得られる物を探していく感じになります。
特に、リップシンクがうまく行っていないケースや、伴奏に口の動きが持っていかれているケースなど、変な動画も大量にできるので、ガチャ感は強いかもですね。
ちなみに5秒の動画生成にかかる時間が15分程度です。

最後にパーツの動画編集します

最後は、元の曲を動画編集ソフトのタイムラインに置いて、そこに音も入っている動画ファイルなので、音の位置を合わせれば動画データが沢山あっても簡単にきっちり合わせる事ができます。(一番下のラインが曲で、その上に動画をはめ込んでます)
音のない動画もあった思いますが、これは、間奏など歌っていない時に動きが欲しかったので、踊らせたりリズムを取らせる動画を作成して、それを良さそうな場所にはめ込んで全体を埋めていく感じです。

そんな感じで、今回の動画は完成しました。
まだ、未熟な点は多いですが、一旦こんな感じで、できあがったので公開しました。

Read more

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットの正体とWebPの「予測マジック」を理解する 次世代画像フォーマットAVIFを触ってみた 割と最近の画像圧縮フォーマットについてです。 「webp」は比較的見るようになったフォーマットですが、従来は画像のサイズが小さいのはJPGで、透明色が使えて画質を維持するのがPNGって感じで、使い分けられていると思います。 しかし、JPGは古いフォーマットで圧縮アルゴリズムも古い上に、透明色が使えないなど改良の余地が多々あるので、「JPEG 2000」というフォーマットも作成されました。 「JPEG 2000」は技術的には従来のJPEGを大幅に上回る優秀なフォーマットにもかかわらず、処理負荷の高さや互換性の問題から一般消費者向けには普及しませんでした。 今となっては、それ程負荷は高くないのですが、開発された当時(2000年代前半)のPCのスペックを考えると厳しかったと思われます。 2001年のPCスペックを調べてみました。 Intel Pentium III 256MBから512MBのRAM 20GBから80GB Windows 98やWindows 2000が主流 この

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5を使ってみましたが、なんか音の厚みが増して日本語の再現度も上がって、歌唱クオリティが一ランク上がったように感じるほどです。 とりあえずバージョンの歴史から V2 (2023年秋):  最大生成時間は1分20秒でした V3 (2024年春):  生成時間が2分に更新されました V3.5 (2024年夏): 曲の構造が改善され、初回生成の最大時間が4分に、延長                       (Extend)は1回につき最大2分まで可能になりました V4 (2024年11月): ボーカル品質が向上し、初回生成の最大時間は4分です。また、「Extend(延長)」「Cover(カバー)」「Persona(ペルソナ)」機能が追加されました V4.5 (2025年5月): 初回生成の最大時間が8分に延長され、プロンプトへの忠実度やスタイルのマッシュアップ機能が向上しました V4.5+ (2025年7月): 「Add Vocals(ボーカル追加)」や「Add Instrumental(インスト追加)」などの制作ツールが更新されました V5 (2025年9月):  オーディ

「NANObanana」があれば、LINEスタンプいらなくね?

「NANObanana」があれば、LINEスタンプいらなくね?

LINEスタンプはすぐに返せて便利なんですが、返したいスタンプを探すのが結構手間になってきています。 スタンプをそれ程沢山持っている訳じゃないんですが、30弱程度あります。 それだけでも、確かこんなのあったなとか、軽い感じのお礼スタンプどれがいいかなとか、選ぶのに時間がかかると、手軽に返せるスタンプの意味がありません。 そこで「NANObanana」です。画像に日本語も入れてもらえるので、スタンプが必要な時に、その場にあったスタンプを作ってしまえばいい!! と言う事で、やってみました。 スタンプのプロンプトは、うまい人がいると思うので、そこを突き詰めたい人はその手の記事を参考にしてください。 今回は、お手軽にその場でスタンプを作って、友人とかに利用するってお話です。 とは言え、イメージ通りの結果は欲しいので、何を注意すればそれっぽく作れるのかは少し実験してみたいと思います。 まずはAIに素直に聞いてみる。AIの事はAIに聞くのが一番です。 次の事に注意しろと教えてもらえます。 キャラクター設定: どのキャラクターを使いたいかを明確に指定します。 セリフや感情表現: どのようなセ

「Claude Code」 関連記事まとめ

「Claude Code」 関連記事まとめ

日々「Claude Code」を使用していますが、新しいツールや「Claude Code」自信もバージョンアップしているため、私自身もアップデートしていかないと、いつの間にか置いて行かれて非効率な使い方をしていたなんて事になりかねません。 と言う訳で、個人的に参考になったり、読んでいて面白かった記事をピックアップしました。 良ければ参考にしてください。 簡単コピペでClaude Codeに144種類のエージェントチームを作成 ── agency-agentsという40Kスター超のAIエージェント集を使いこなす 「Claude Code」は、エージェント次第で生成するコードの質が変わってきます。 まだ使ってはいませんが、使って見ようと思ってます。 効果的なCLAUDE.mdの書き方 「Claude Code」は「CLAUDE.md」の書き方次第でも違いが出るので、この辺も見ておくといいかも内容です。「Claude Code」を使う上での基本ですね。 【2026年版】Claude Codeを最強にするプラグイン・MCP・ツール総まとめ これも結構参考になると思います。 はやり廃りがあ