自動的にカラオケっぽい歌詞を付けるアプリを作ってみた結果

sunoで作成した曲に歌詞を付けるのが手間だなぁ～と常々思っていたのですが、これを効率化したいと言う事で、今回は歌を解析して歌詞を指定すればタイミングを合わせて配置してくれるアプリを作ってみました。
せっかく作ったので少し解説と、どんな物が作れるのか、デモの動画と少し解説をしますが、アプリそのものはライセンスの問題で非公開です。

実際にこのツールで作成した動画を３本ほど紹介

スペルトナエル

サイコロ勇者と魔王の城

アトミックピクニック

見てもらうと分かりますが、これが思ったより簡単に作れるようになったので、現在のように短期間で作れるようになりました。
歌詞入りで曲を公開する場合に、歌詞を入れる作業に時間がかかる割に、イマイチなできになる事も多いので、クオリティーが安定したのも良かったです。

では、次の動画で実際にツールを使って曲に歌詞を入れていきます。

使用しているＡＩのライセンス問題で、手軽に公開できないのと、需要がそれ程無さそうなので、こんなアプリで動画作成してますよって紹介になります。

音源さえ用意すれば、カラオケも作れちゃいます。
カラオケの例です。
実演で作った曲の歌入りの曲と、カラオケを用意しました。

歌入りの曲です。

カラオケです

カラオケの音源は、sunoで歌部分を分離してくれる機能を使って作成しました。
実際のカラオケだと、歌の音階を薄くバックで鳴らして歌いやすくしてあったりするので、伴奏だけだと結構歌いにくいですよね。

ちなみに支援システムのとりあえず完成は２週間ぐらいですが、使っていて不満とかあったらチマチマと修正しています。

と言う訳で、歌詞入れ支援システムを作ったよって紹介でした。

Read more

オープンソースの２画面ファイラーで、欲しい機能をAIで追加してみた

オープンソースの２画面ファイラーで、欲しい機能をAIで追加してみた

「shellfiler」というオープンソースの２画面ファイラーを愛用していました。シェアウェアの頃から、お金を払わせてもらって使わせてもらっていたのですが、ある時からオープンソースになりました。個人的に欲しい機能で、ネットワーク上のNASや他のPCの共有フォルダに手軽にアクセスする機能です。具体的には「\PC名\共有フォルダ名」みたいなアクセスなんですが、これに対応していません。ネットワークドライブ（ネットワーク上のアクセス先をドライブとしてWindowsに）を使えばアクセスは出来るので、全く使えない訳ではないのですが、共有フォイルだが多いとそれ全部にネットワークドライブを割り当てる訳にもいかず、最近は使わなくなっていました。他のツールも試しましたが、「shellfiler」の使い勝手が結構良くて、個人的には変えたくいない！そこで、せっかくオープンソースなんだから、AIで必要な部分を修正できれば、良さそう！「shellfiler」のGITのURLです。使用するAIは今回Geminiさんで、新しくなった「AntiGravity」でやってみます。作業ファルダを指

ある人から、MarkdownのテキストをPDFにしてくれる何かが欲しいと言われたので、Claude Codeで作る事にした

ある人から、MarkdownのテキストをPDFにしてくれる何かが欲しいと言われたので、Claude Codeで作る事にした

実際、AIはMarkdownで解答を返してくる事が多く、普通に使っているだけでも、Markdown形式のテキストが手軽に表示したり、PDFに変換できると便利だと思うので、ブラウザで手軽に使える物を作りました。作成後WEB上にアップしたのが以下のURLになります。 https://test.aisgm.me/test_prog/app/md2pdf/ VS Codeのプラグイン入れれば、同じ事は出来ますし、他にも同じようなアプリを作っている人がいるので、それを使うのも手なんですが、最近は怪しいサイトも多いですし、広告が大量に出るものも多いです。更に、プラグインがウィルスに汚染されているケースなんかもニュースになっているので、セキュリティー的に使った事が無いものを人に勧めるのも怖いです。そんな訳で、手軽に使えてインストール等の面倒な準備が必要無いってなると、WEBアプリでアクセスすれば使えて、ローカルで処理させるのが良さそうです。配布やインストールの手間も必要無く、使いたい時にネットに繋がって、ブラウザさえあれば動くので一番使い勝手がいいですよね。ってな訳で、Claude

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットの正体とWebPの「予測マジック」を理解する次世代画像フォーマットAVIFを触ってみた割と最近の画像圧縮フォーマットについてです。「webp」は比較的見るようになったフォーマットですが、従来は画像のサイズが小さいのはJPGで、透明色が使えて画質を維持するのがPNGって感じで、使い分けられていると思います。しかし、JPGは古いフォーマットで圧縮アルゴリズムも古い上に、透明色が使えないなど改良の余地が多々あるので、「JPEG 2000」というフォーマットも作成されました。「JPEG 2000」は技術的には従来のJPEGを大幅に上回る優秀なフォーマットにもかかわらず、処理負荷の高さや互換性の問題から一般消費者向けには普及しませんでした。今となっては、それ程負荷は高くないのですが、開発された当時（2000年代前半）のPCのスペックを考えると厳しかったと思われます。 2001年のPCスペックを調べてみました。 Intel Pentium III 256MBから512MBのRAM 20GBから80GB Windows 98やWindows 2000が主流この

suno5.5の実力を過去バージョンと比較（比較曲多めでお送りします）

suno5.5の実力を過去バージョンと比較（比較曲多めでお送りします）

suno5.5を使ってみましたが、なんか音の厚みが増して日本語の再現度も上がって、歌唱クオリティが一ランク上がったように感じるほどです。とりあえずバージョンの歴史から V2 (2023年秋):　　最大生成時間は1分20秒でした V3 (2024年春):　　生成時間が2分に更新されました V3.5 (2024年夏):　曲の構造が改善され、初回生成の最大時間が4分に、延長　　　　　　　　　　　　　　　　　　　　　　（Extend）は1回につき最大2分まで可能になりました V4 (2024年11月):　ボーカル品質が向上し、初回生成の最大時間は4分です。また、「Extend（延長）」「Cover（カバー）」「Persona（ペルソナ）」機能が追加されました V4.5 (2025年5月):　初回生成の最大時間が8分に延長され、プロンプトへの忠実度やスタイルのマッシュアップ機能が向上しました V4.5+ (2025年7月):　「Add Vocals（ボーカル追加）」や「Add Instrumental（インスト追加）」などの制作ツールが更新されました V5 (2025年9月):　　オーディ