時計のG-shockでおなじみのCASIO(カシオ)の新サービス!AIで効果音が生成できる「Waves Place」を試してみた

Share
時計のG-shockでおなじみのCASIO(カシオ)の新サービス!AIで効果音が生成できる「Waves Place」を試してみた

前に気になっていたけど、試していなかったので、今回試してみました。
CASIOのアカウントを作成する必要があります。
ちょっとめんどいですが、無料で試せるのでとりあえず作成して試してみました。

一応プレスリリースです。
AIで効果音が生成できる「Waves Place」とライブ配信専用スケジューラー「Streamer Times」を正式リリース

実際どんな交換が生成できるのか、結構気にはなってます。
効果音系のアプリも実は持っているので、そんなのと比較もしてみたいですが、今回はこのサービスがどんな感じかを試します。

まず、料金プランのリンクです。最新情報はこちらを参照してください。

一応現在時点のプランです。

フリープランでは商用は不可ですね。
「starter」プラン以降で商用利用可能です。

フリーだと月20回までお試しできる感じです。
月千円(「starter」プラン)で800回って事なので、普通は「starter」プランで使い切れない気がします。
使うとすると、基本的に必要な時に有料プランして、終わったらフリーに戻すみたいな使い方になりそうなサービスです。

実際に作成してみましたが、音声だけ公開しても面白くないので、作成した音に映像を生成して音と映像でお送りします。
作成方法を簡単に紹介
音を生成して、そのプロンプトから、メインの画像をqwen imageで画像を生成して、その画像に生成した音を合わせて動画を生成しました。

では最初は、

鯨が水から飛び出して、また水に飛び込む

のプロンプトで音を生成しました。
そこから画像を生成して、その音をと共に動画を生成しました。

まずは画像です。


その動画がこちらになります。

0:00
/0:04

なんか音が残念ですね・・・・
ザバーンって感じを期待していたのですが・・・
次の音に行ってみたいと思います

花火大会で花火が打ち上がって花開く音

のプロンプトで音を作成しました。
これは流石にいい音ができるはずです
画像は、「花火大会で花火が打ち上がる風景」で作成します。
画像がこちら

その画像と、音で作成した動画が以下になります。

0:00
/0:04

これはいい感じです。
ちょっと詰まったような感じがしますが、悪くないです。
次は、

ダイナマイトの爆発音

これも、爆発音なので、ポピュラーな効果音です。
期待できそうです。
画像は「ダイナマイトが大爆発する」で作成しました。

爆発しているのに、ダイナマイトの存在が見えるというシュールな画像が作成されました。
これで進めます

0:00
/0:04

ダイナマイトとはなんなのか?
疑問しか浮かばない結果に・・・・
ただ音が断続的な音なので、1回の大爆発って感じになっていないので、想像とは違う感じがします。

最後は、少し難しいお題で作成します。

自動販売機にお金を投入して、缶飲料が出てくる音

これは何度高そうです!
AIがこの辺の状況を再現できるのかがポイントになります。
画像は「自動販売機が並んでいる風景」で作成

ちなみに動画のプロンプトは「女性がやってきて自動販売機で飲み物を買う」にしました。
動画がこちらです。

0:00
/0:05

どこから取ってるの?
イリュージョン!?
缶開けてないよ?

なんだか恐ろしい事になっています。
音に関しては、よく聞くと缶が落ちてきた音が聞こえて、その後おつりの小銭が落ちる音がするので、忠実に再現しているように思います。

で、わざとできの悪い動画を貼っている疑惑もあると思うので、同時に作成した他の動画も貼りますので、AIのシュールな世界を楽しんでいただけたらと思います。

やっぱりそこから取っちゃう?

0:00
/0:04

そこへ返すの?

0:00
/0:04

同じ所?お金?缶?

0:00
/0:04

とまあ、こんな感じで、中々面白い動画ができましたw
プロンプトを工夫すれば、もう少しまともにはなると思いますが、面白くなっちゃったので、これで公開しました。

Read more

自動的にカラオケっぽい歌詞を付けるアプリを作ってみた結果

自動的にカラオケっぽい歌詞を付けるアプリを作ってみた結果

sunoで作成した曲に歌詞を付けるのが手間だなぁ~と常々思っていたのですが、これを効率化したいと言う事で、今回は歌を解析して歌詞を指定すればタイミングを合わせて配置してくれるアプリを作ってみました。 せっかく作ったので少し解説と、どんな物が作れるのか、デモの動画と少し解説をしますが、アプリそのものはライセンスの問題で非公開です。 実際にこのツールで作成した動画を3本ほど紹介 スペルトナエル サイコロ勇者と魔王の城 アトミックピクニック 見てもらうと分かりますが、これが思ったより簡単に作れるようになったので、現在のように短期間で作れるようになりました。 歌詞入りで曲を公開する場合に、歌詞を入れる作業に時間がかかる割に、イマイチなできになる事も多いので、クオリティーが安定したのも良かったです。 では、次の動画で実際にツールを使って曲に歌詞を入れていきます。 使用しているAIのライセンス問題で、手軽に公開できないのと、需要がそれ程無さそうなので、こんなアプリで動画作成してますよって紹介になります。 音源さえ用意すれば、カラオケも作れちゃいます。 カラオケの例です。

ある人から、MarkdownのテキストをPDFにしてくれる何かが欲しいと言われたので、Claude Codeで作る事にした

ある人から、MarkdownのテキストをPDFにしてくれる何かが欲しいと言われたので、Claude Codeで作る事にした

実際、AIはMarkdownで解答を返してくる事が多く、普通に使っているだけでも、Markdown形式のテキストが手軽に表示したり、PDFに変換できると便利だと思うので、ブラウザで手軽に使える物を作りました。 作成後WEB上にアップしたのが以下のURLになります。 https://test.aisgm.me/test_prog/app/md2pdf/ VS Codeのプラグイン入れれば、同じ事は出来ますし、他にも同じようなアプリを作っている人がいるので、それを使うのも手なんですが、最近は怪しいサイトも多いですし、広告が大量に出るものも多いです。 更に、プラグインがウィルスに汚染されているケースなんかもニュースになっているので、セキュリティー的に使った事が無いものを人に勧めるのも怖いです。 そんな訳で、手軽に使えてインストール等の面倒な準備が必要無いってなると、WEBアプリでアクセスすれば使えて、ローカルで処理させるのが良さそうです。 配布やインストールの手間も必要無く、使いたい時にネットに繋がって、ブラウザさえあれば動くので一番使い勝手がいいですよね。 ってな訳で、Claude

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットの正体とWebPの「予測マジック」を理解する 次世代画像フォーマットAVIFを触ってみた 割と最近の画像圧縮フォーマットについてです。 「webp」は比較的見るようになったフォーマットですが、従来は画像のサイズが小さいのはJPGで、透明色が使えて画質を維持するのがPNGって感じで、使い分けられていると思います。 しかし、JPGは古いフォーマットで圧縮アルゴリズムも古い上に、透明色が使えないなど改良の余地が多々あるので、「JPEG 2000」というフォーマットも作成されました。 「JPEG 2000」は技術的には従来のJPEGを大幅に上回る優秀なフォーマットにもかかわらず、処理負荷の高さや互換性の問題から一般消費者向けには普及しませんでした。 今となっては、それ程負荷は高くないのですが、開発された当時(2000年代前半)のPCのスペックを考えると厳しかったと思われます。 2001年のPCスペックを調べてみました。 Intel Pentium III 256MBから512MBのRAM 20GBから80GB Windows 98やWindows 2000が主流 この

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5を使ってみましたが、なんか音の厚みが増して日本語の再現度も上がって、歌唱クオリティが一ランク上がったように感じるほどです。 とりあえずバージョンの歴史から V2 (2023年秋):  最大生成時間は1分20秒でした V3 (2024年春):  生成時間が2分に更新されました V3.5 (2024年夏): 曲の構造が改善され、初回生成の最大時間が4分に、延長                       (Extend)は1回につき最大2分まで可能になりました V4 (2024年11月): ボーカル品質が向上し、初回生成の最大時間は4分です。また、「Extend(延長)」「Cover(カバー)」「Persona(ペルソナ)」機能が追加されました V4.5 (2025年5月): 初回生成の最大時間が8分に延長され、プロンプトへの忠実度やスタイルのマッシュアップ機能が向上しました V4.5+ (2025年7月): 「Add Vocals(ボーカル追加)」や「Add Instrumental(インスト追加)」などの制作ツールが更新されました V5 (2025年9月):  オーディ