素人が作る実写っぽいミュージックビデオの作り方 その2

素人が作る実写っぽいミュージックビデオの作り方 その2

今回のポイント

・歌の音ファイルの作り方
・音ファイルを動画生成用に分割する
・リップシンクの動画ファイルの作り方
・動画編集

前段は前回の記事を参照してください

音楽ファイルの作成

SUNO AIを使用して作成しています。

ベースの歌詞をAIに作成してもらって、手直しします。
どんな歌詞を作るか、概要をまとめてAIに渡します。

具体的なプロンプト

作りたい歌詞の内容や使用したい単語、曲のイメージを説明します。
それに、以下の分をコピペしてくっつけてAIに投げます。

歌詞は以下のタグ中から使用してください
[Verse 1]
[Verse 2]
[Verse 3]
[Verse 4]
[Chorus]
[Powerful‐Chorus]
[Bridge]
[Outro]
[Lead-In]
[Pre-Chorus]
[Post-Chorus]
[Ending]
[rap]
[hook]
[drop]
[hook]

[Piano-solo]
[Violin‐solo]
[Drums‐solo]
[Bass Drum‐solo]
[Electric Guitar‐solo]
[Guitar‐solo]
[Shamisen‐solo]
[Shakuhachi‐solo]

と指示すると、いい感じに、SUNOに流し込むだけで利用できる歌詞を作成してくれます。

AIはクラウドのサービスであれば、ほぼ問題無く生成してくれます。
以下のサービスでは問題ありませんでした。

GPT-5
Grok4
Claude 4 Sonnet
Gemini 2.5 Pro

歌詞の手直し

SUNOが歌いにくい単語などがあるので、実際に1曲作成して、それを聞くと苦手な単語や、読み間違える漢字が分かるので、違う言葉に置き換えた漢字を平仮名に変えるなど、変更を加えます。
それから、実際に曲として聞いてみると、歌詞の意味や言葉のチョイスで気になる単語が出てくるので、あれば変更します。

曲調の指定

曲調ですが、いわゆるj-popとかrockとか、曲のスタイルを指定します。
これは作りたい曲調を指定するのが良いのですが、ドット絵のイメージ曲だったら、

chiptune, 8-bit

って感じで指定すると、ピコピコ音の楽曲が生成されます。

スタイルの数は多いので、解説している記事などを参考にするといいと思いますが、よく使うスタイルのプロンプトを管理するツールの、prompt builder を使用しています。
生成AIは、過去に使用したプロンプトを組み合わせて使用する事が多いので、結構便利です。

ある程度歌詞が固まったら、曲調を変更して何種類か曲を生成してもらいます。
10曲とか作っても、最初の曲が一番いいなんて事もあったりしますが、沢山作ると全部聞いて判断するので結構時間かかります。
そして、いい曲ができたらダウンロードします。

次に、ダウンロードしたWAVファイルを分割して生成で利用しやすくします。

音ファイルの分割

その1でも軽く説明しましたが、ファイルを分割した方が生成の効率が良いので、分割するツールを利用します。
Audio Converter & Splitter
https://test.aisgm.me/test_prog/app/audio-converter/
これを利用します。

使い方を近日中に別記事を書きます

「Audio Converter & Splitter」の使い方

このツールはファイル分割とファイルのフォーマット変換を行う事ができるWEBツールで、処理はブラウザ上のローカルで行われるため、ファイルをサーバーにはアップロードしないので、セキュリティー的にも安心です。
その代わり、PCの性能が影響するので、遅いPCで使用すると、処理に時間がかかります。

分割は、分割数と秒数で分割する事ができます。
分割数指定は、指定した分割数で等分に分割します。
秒数指定分割は、して秒数毎に分割していき、最後のファイルは余った時間が入る感じになります。

その1でも書きましたが、今回の音楽は3分18秒 = 198秒となるので、14秒で分割して15ファイル作成します。

作成した15ファイルを全部リップシンクの動画化していきます。
プロンプトもシンプルに、「女性はスタジオで歌を歌っている」で作成していきます。
元イメージは以下になります。

まず、このイメージを作成してから、このイメージを元に広げていきました。
QwenImageEditを使用して、服装や場所を変えていきます。
背景を海や砂漠にして、MVっぽい感じを出していきます。
実際に制作した画像が以下になります。

ここから、動画を作成します。
実際に作成した物はこちら(※注意 音が出ます)

0:00
/0:14
0:00
/0:14
0:00
/0:05
0:00
/0:05

プロンプトは「女性は歌いながらリズムに合わせてダンスをする」など、ここからカメラワークを足したり、歌わずにダンスだけさせるなど、バリエーションを作っていきます。
ここでは、4動画しか紹介していませんが、300動画ほど作成して、そこから良い物を使うといった感じになります。
生成AIの種類やワークフロー(生成する時の設定的なやつ)次第で時間の長さや、生成にかかる時間も違うので、試しながら良い結果が得られる物を探していく感じになります。
特に、リップシンクがうまく行っていないケースや、伴奏に口の動きが持っていかれているケースなど、変な動画も大量にできるので、ガチャ感は強いかもですね。
ちなみに5秒の動画生成にかかる時間が15分程度です。

最後にパーツの動画編集します

最後は、元の曲を動画編集ソフトのタイムラインに置いて、そこに音も入っている動画ファイルなので、音の位置を合わせれば動画データが沢山あっても簡単にきっちり合わせる事ができます。(一番下のラインが曲で、その上に動画をはめ込んでます)
音のない動画もあった思いますが、これは、間奏など歌っていない時に動きが欲しかったので、踊らせたりリズムを取らせる動画を作成して、それを良さそうな場所にはめ込んで全体を埋めていく感じです。

そんな感じで、今回の動画は完成しました。
まだ、未熟な点は多いですが、一旦こんな感じで、できあがったので公開しました。

Read more

比較的最近の気になったニュース2026年1月21日

比較的最近の気になったニュース2026年1月21日

まるで成長していない。「USB4」になっても呼び名が混乱している件。Gen 2とか相変わらず分かりにくいまま 本当にUSB企画は分かりにくいというか、使う人の事を考えていないですよね。 USB3の時に規格がぶれまくって、整理するかと思いきや、 USB4になって、何も変わらずグダグダって・・・ なぜ『ボーダーブレイク』は国際的成功の好機を逃してしまったのか―結局日本限定でしか遊べなかった、理想的な「海外ゲーマー向け」作品【オリーさんのロボゲーコラム】 お財布ブレイクでも有名なボーダーブレイクは確かに世界的な人気作品になっても良さそうなゲームルールとデザインだと思うのですが、惜しい作品だと思います。 その辺の経緯や問題などをまとめられていて、非常に読み応えがあったので、興味がある方は是非読んでみてください。 “積みゲー”がタワーとして可視化できるツール「ツミナビ」が無料公開中。Steamアカウントと連携すると、所有しているゲームのリスト化やゲーマータイプ診断、傾向の分析などをおこなってくれる 紹介記事では10本ぐらいのアカウントで試しているようなので、ゲームの所持数が影響

最近気になった記事2026年01月14日

最近気になった記事2026年01月14日

GPT-5.2とGemini3の画像作成で大きな違いが出るのはなぜか GPTとGeminiの設計思想の違いを解説しています。 両方の特徴を理解して使い分ければ、欲しい情報や回答を得やすいって事だと思います。 記事では、以下のように GPT-5.2が考えるAIとして設計 と書かれており、考えをまとめたり問題点を洗い出すなど、何かをする前の準備段階で有効に使えそうで、 Gemini3は次のように書かれていて、 Gemini3は、業務で使われる成果物を作ることを強く意識した設計 最終的にまとめる時や、資料となる画像や具体的な書類を作成するのに向いている感じですね。 記事には以下のように書かれており、 GPT-5.2は、思考から表現へ進みます。Gemini3は、成果物から構成を逆算 GPT-5.2は優秀な戦略コンサルタントです。Gemini3は優秀な資料作成担当 アプローチが真逆なのが面白いですね。 だからこそ、使うタイミングや使い方が大事だと分かります。 更に、 日本語の文字化け問題は、すべての言語で同じように起きているわけではありません。 と書かれていて、そ

あけおめ動画を色々なAI動画生成で作ってみた

あけおめ動画を色々なAI動画生成で作ってみた

最近色々と忙しくて更新をサボっていましたが、久々の更新が「あけおめ」ですみません。 生成サービスで違いがあるので、その辺も含めてお楽しみください。 まずプロンプトですが、 全体的に日本のアニメ調にしてください。 日本の正月の挨拶用動画を作成してください。 画面上部に日本語で「あけましておめでとう」と毛筆で書いているように表示してください 画面下部にデフォルメしたリスを表示して正面へ向かって手を振ってください 画面左右に門松を配置してください 画面の左下に「AIS」と表記してください 正月の背景は日本っぽい風景にしてください といったプロンプトで作成していきます。 日本語の文字生成はsoraしか再現できないので、 画面上部に日本語で「あけましておめでとう」と毛筆で書いているように表示してください このプロンプトを削除して、文字以外で生成します。 必要なら後から動画編集ソフトで、文字を入れればいいかなと思います。 それでは、各動画生成AIで作成した動画を見ていきます。 最初はwan2.2で作成 ローカルで作成できるため、制限が無いので、数を作成しています。 一挙に3本

自分のSTEAMリプレイ2025の話

自分のSTEAMリプレイ2025の話

もう、今年もは終わりに近づいてきたので、2025年に遊んだSteamのゲームを振り返ってみたいと思います。 aisのSTEAMリプレイ2025 https://s.team/y25/jhcqwnq?l=japanese 公開に設定しているので、気になる方は見てみてください。 Steamのゲームを遊びたいと思いつつ、いまいち遊べていない感じがしていましたが、遊んでいるゲーム数も減っているので、コードレッドですw 動画の編集が意外と時間かかっているので、ここを少し省略したいなとか、「Super Mining Mechs」の動画編集が地味に時間かかっているのですが、無事最終回を迎えたので、少し楽になるかなと思います。 「Super Mining Mechs」プレイリスト プレイしたゲーム数が15本減っているみたいです。 去年も一昨年と比べて、かなり減っていたので、やばいですw 本数を沢山やればいいってもんじゃ無いですが、ゲームを遊んでいる時間も減っているので、じかんをつくれる男になろうと思いますw ほぼ半減で、実績の減りが凄いですw ゲームによって違うので、一概には言えませんが、や