AI関連

AI関連の内容全般

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

AI関連

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5を使ってみましたが、なんか音の厚みが増して日本語の再現度も上がって、歌唱クオリティが一ランク上がったように感じるほどです。 とりあえずバージョンの歴史から V2 (2023年秋):  最大生成時間は1分20秒でした V3 (2024年春):  生成時間が2分に更新されました V3.5 (2024年夏): 曲の構造が改善され、初回生成の最大時間が4分に、延長                       (Extend)は1回につき最大2分まで可能になりました V4 (2024年11月): ボーカル品質が向上し、初回生成の最大時間は4分です。また、「Extend(延長)」「Cover(カバー)」「Persona(ペルソナ)」機能が追加されました V4.5 (2025年5月): 初回生成の最大時間が8分に延長され、プロンプトへの忠実度やスタイルのマッシュアップ機能が向上しました V4.5+ (2025年7月): 「Add Vocals(ボーカル追加)」や「Add Instrumental(インスト追加)」などの制作ツールが更新されました V5 (2025年9月):  オーディ

「NANObanana」があれば、LINEスタンプいらなくね?

AI関連

「NANObanana」があれば、LINEスタンプいらなくね?

LINEスタンプはすぐに返せて便利なんですが、返したいスタンプを探すのが結構手間になってきています。 スタンプをそれ程沢山持っている訳じゃないんですが、30弱程度あります。 それだけでも、確かこんなのあったなとか、軽い感じのお礼スタンプどれがいいかなとか、選ぶのに時間がかかると、手軽に返せるスタンプの意味がありません。 そこで「NANObanana」です。画像に日本語も入れてもらえるので、スタンプが必要な時に、その場にあったスタンプを作ってしまえばいい!! と言う事で、やってみました。 スタンプのプロンプトは、うまい人がいると思うので、そこを突き詰めたい人はその手の記事を参考にしてください。 今回は、お手軽にその場でスタンプを作って、友人とかに利用するってお話です。 とは言え、イメージ通りの結果は欲しいので、何を注意すればそれっぽく作れるのかは少し実験してみたいと思います。 まずはAIに素直に聞いてみる。AIの事はAIに聞くのが一番です。 次の事に注意しろと教えてもらえます。 キャラクター設定: どのキャラクターを使いたいかを明確に指定します。 セリフや感情表現: どのようなセ

比較的最近の気になったAI関連ニュース2026年03月23日

AI関連

比較的最近の気になったAI関連ニュース2026年03月23日

理論上は可能、現実には不可能だった技術 EUVの正体 半導体の露光装置で、一昔前は日本もトップランナーでした。 ニコンなんかが強かったですが、今では「ASML」の独壇場です。 その理由や経緯などがまとめられているので、興味のある方は読んでみてください。 AIの構造や動作を見る読み物です。 AI Coding Agent の内部構造はどうなっているのか、自作して確かめてみた コーディングエージェントがどのように動いているのか、内部的な動作を検証した ローカルLLMで2万文字のドキュメント分析を試した話 - DeepSeek-R1 32Bの実力検証 ローカルLLMの性能もどんどん高くなってきているので、そろそろクラウドとローカルを、処理する内容によって使い分けると効率よくなるケースも出てきそうです。 VIDIA 公式の日本語強化 LLM Nemotron 9B-v2-Japanese を色々なケースで試してみた Nemotron-Nano-9B-v2-Japaneseってなんだ?〜NVIDIAが放つ日本語特化9Bモデルをローカルで完全攻略〜 「Nemotron-Nano-9B-v

昨今のローカルAIでゲームを作ってみる実験(vibe-localを使ってみました)

AI関連

昨今のローカルAIでゲームを作ってみる実験(vibe-localを使ってみました)

とりあえず遊びたい人のために、ブラウザで遊べるリンクはこちらです。 では本題です。 ローカルAIは、クラウドタイプと比較すると、かなり性能が劣ります。 実際半年ぐらい前だと、簡単なコードなら問題無く作ってくれましたが、具体的に細かい部分を指摘すると破綻したりして、中々うまく行きませんでした。 正直ほぼ使い物にならない感じで、しばらく静観って感じだったのですが、こんな記事を発見! クロードコードにクロードコード作ってって言って寝たら,朝起きたらクロードコードが出来てたんだ… 万博でも猛威を振るっていた、「落合陽一」さんが、Claude Code的な機能をローカルAI特化で作られていて、オープンソースで手軽に利用できます。 更に、AI界隈では珍しく、公式の日本語解説まであります。 ハードウェア以外は、全て無料で簡単に構築できるので、追加のお金を心配しなくてもいい、親御さんも安心のvibecoding環境が整います。 じゃあ、実際にどのくらいの事が出来るのか? 試してみました。 今回の環境は、WindowsPCに「vibe-local」をインストールします。 https:/

「ガチョウ(goose)」や「アヒル(duck)」の名前が付いているサービス名を見かけるのでAIに聞いてみた

AI関連

「ガチョウ(goose)」や「アヒル(duck)」の名前が付いているサービス名を見かけるのでAIに聞いてみた

「ガチョウ(goose)」や「アヒル(duck)」の名前を使ったサービスやアプリをちょいちょい見かけるので、なんでかなと思ってAIに聞いてみました。 「GPT-5.2」を使用してます。 事の発端ですが、ガチョウとかアヒルって外人好きだよなって思う事があって、プライバーシー重視の検索サービス「DuckDuckGo」とか、AIエージェントの「goose」とか、VPNサービス「GOOSE VPN」など 他にもありそうなので、軽く検索して、探してみました。 軽く検索した結果(探せばもっとあるはず) サービス概要 名前 検索サービス DuckDuckGo ゲーム エスケープ フロム ダッコフ AIエージェント goose 見守りサービス GOOSE ダウンジャケット CANADA GOOSE 水鳥を自動カウントするサービス Goose 1・2・3 VPNサービス GOOSE VPN

比較的最近の気になったAI関連ニュース2026年02月23日

AI関連

比較的最近の気になったAI関連ニュース2026年02月23日

なぜAIは学習していない画像を生成できるのか?──創造性をめぐる最新研究 AIの画像生成は、単なるコピペとかのレベルを遙かに超えていますが、AIがどう動いているのかは、まだ完全には解明されていません。 AIの動作を現在分かっている事や、説なんかを解説している記事です。 気になる方は読んでみてください。 AIの内部に脳の「報酬系」に酷似したシステムを発見:大規模言語モデルの知能を支える1%のドーパミンニューロンと価値回路の正体 AIの仕組みに関しての研究です。 人間の脳と同じような動きをAIもしている話なので、色々考えさせられます。結構面白いです。 サーバーワークス、Anthropicの生成AIモデル「Claude」をAWS上で正規ライセンス販売 コード生成AIは、コードを一度サーバーに送るので、漏洩などの心配から利用できない企業も多かったですが、この仕組みを使うとAWSで自社専用に借りたサーバーで「Claude」を動かす事が出来るので、使いやすい会社も多くなりそうな仕組みです。 他に比べて使い勝手が良くるので、「Claude」が更に強くなりそうです。 AMDがグリグリ

音楽生成AI「ACE-Step v1.5」が本当に「Suno v4.5」を越えるのか聞き比べできるようにしてみた

AI関連

音楽生成AI「ACE-Step v1.5」が本当に「Suno v4.5」を越えるのか聞き比べできるようにしてみた

こんな記事があったので、実際にsunoでも同じ歌詞の曲を作って比較してみます。 無料で「Suno v4.5」超え? 音楽生成AI「ACE-Step v1.5」公開 個人向けGPUでも動作 「ACE-Step v1.5」は、ComfyUIにテンプレートがあるので、簡単に利用できまます。 軽く曲を作って、「suno v4.5」でも作成してみます。ついでに「suno v5.0」でも作成して、比較してみたいと思います。 まずは、作成する曲についてです。 曲調などのスタイルは Style Prompt: Acoustic Guitar, Folk, Country, Warm, Upbeat, Female vocal このような指定で、ギター中心のカントリーで、ボーカルは女性を指定しました。 続いて歌詞ですが、以下のような歌詞です。 ちなみに「Cast

キシリトールって歯に本当にいいの?エリスリトールとアルロースって何?AIに聞いて調べてみた!

AI関連

キシリトールって歯に本当にいいの?エリスリトールとアルロースって何?AIに聞いて調べてみた!

キシリトールガムなどが出てから、キシリトールは歯に良いって話があるのですが、科学的にどうなのか? 調べると近しい甘味料としてエリスリトールとアルロースが出てきましたが、これってって何? その辺をAIに聞いて調べました。 今回使用したAIです。 Gemini3 PRO gpt-oss:120b(ローカル) GPT5.2 など高性能なAIを取りそろえて、色々聞いた結果をまとめています。 とは言え、結論が欲しい方のために最初に結論を比較できるようにまとめました。 内容をもう少し掘り下げたい人は、その先を読んでもらえればと思います。 しかもNANObananaにわかりやすい画像にまとめてもらったので、こちらを見れば一目瞭然です。 まずは、歯への影響です。 キシリトールなんかは分かっていましたが、エリスリトールがかなり優秀です。 次は、人体への影響です。 歯に良くても体に負担がかかると良くありません。 キシリトールはお腹がゆるくなる問題がありますし。 こうして見てみると、歯にとってはエリスリトールが優秀ですね。 そして、ダイエットならアルロースって感じでしょうか。

あけおめ動画を色々なAI動画生成で作ってみた

AI関連

あけおめ動画を色々なAI動画生成で作ってみた

最近色々と忙しくて更新をサボっていましたが、久々の更新が「あけおめ」ですみません。 生成サービスで違いがあるので、その辺も含めてお楽しみください。 まずプロンプトですが、 全体的に日本のアニメ調にしてください。 日本の正月の挨拶用動画を作成してください。 画面上部に日本語で「あけましておめでとう」と毛筆で書いているように表示してください 画面下部にデフォルメしたリスを表示して正面へ向かって手を振ってください 画面左右に門松を配置してください 画面の左下に「AIS」と表記してください 正月の背景は日本っぽい風景にしてください といったプロンプトで作成していきます。 日本語の文字生成はsoraしか再現できないので、 画面上部に日本語で「あけましておめでとう」と毛筆で書いているように表示してください このプロンプトを削除して、文字以外で生成します。 必要なら後から動画編集ソフトで、文字を入れればいいかなと思います。 それでは、各動画生成AIで作成した動画を見ていきます。 最初はwan2.2で作成 ローカルで作成できるため、制限が無いので、数を作成しています。 一挙に3本

ローカルで効果音が作成できるAI「MMAudio」を使ってみた(「Waves Place」と同じ効果音も作ってみました)

AI関連

ローカルで効果音が作成できるAI「MMAudio」を使ってみた(「Waves Place」と同じ効果音も作ってみました)

MMAudio は、ビデオやテキストや画像の入力が与えられると、動画は同期されたオーディオ、画像はそれに合った音を生成します。 使用方法は Pinokio https://pinokio.co/ こちらのアプリからインストールして、「MMAudio」を使います。 インストール方法などは別記事を書きたいと思います。 比較対象として 時計のG-shockでおなじみのCASIO(カシオ)の新サービス!AIで効果音が生成できる「Waves Place」を試してみた の記事と比較しやすいように、同じようなプロンプトで作成します。 MMAudio は、ビデオやテキストや画像の入力が与えられると、動画は同期されたオーディオ、画像はそれに合った音を生成します。 使い方が非常に簡単な上に、動画に合わせて生成できるのも使い勝手がいいですね。カシオの「Waves Place」はテキストからだけだったので、こちらの方が少し上な感じがします。 実際にできるのは、 ・テキストから効果音生成 ・画像から効果の音生成 ・動画に合わせて効果音生成 前に「Waves Place」用に作成した動画が、丁

久々にオールインワンのコード生成「DeepSite」を使ってみた

AI関連

久々にオールインワンのコード生成「DeepSite」を使ってみた

AIがWEBサイトをコーディングしてくれるサービスです。 DeepSite https://huggingface.co/spaces/enzostvs/deepsite 今回はテトリスっぽいゲームを作ってもらいました 今回の完成品 https://iaisd9-blocky-blitz-bonanza.static.hf.space/index.html では本題です。 アカウント(無料)を作ると、完成品をこのように公開できます。 ちなみに無料のユーザー登録すると、制作物を「DeepSite」で公開できる機能もあるので便利です(今回はその機能を使っています)。 複数のページが相互接続された複雑なウェブサイトを構築できます。 シンプルなランディングページから、動的なルーティングとナビゲーションを備えたフル機能のウェブアプリケーションまで、あらゆるものを構築できます。 と言う事で、WEBページであれば、かなりの物を作成できるサービスなので、当然ブラウザで遊べるゲームも作る事ができるので、テトリス的なゲームを作ってもらいました。 このサービスに限らず、既にWEB

時計のG-shockでおなじみのCASIO(カシオ)の新サービス!AIで効果音が生成できる「Waves Place」を試してみた

AI関連

時計のG-shockでおなじみのCASIO(カシオ)の新サービス!AIで効果音が生成できる「Waves Place」を試してみた

前に気になっていたけど、試していなかったので、今回試してみました。 CASIOのアカウントを作成する必要があります。 ちょっとめんどいですが、無料で試せるのでとりあえず作成して試してみました。 一応プレスリリースです。 AIで効果音が生成できる「Waves Place」とライブ配信専用スケジューラー「Streamer Times」を正式リリース 実際どんな交換が生成できるのか、結構気にはなってます。 効果音系のアプリも実は持っているので、そんなのと比較もしてみたいですが、今回はこのサービスがどんな感じかを試します。 まず、料金プランのリンクです。最新情報はこちらを参照してください。 一応現在時点のプランです。 フリープランでは商用は不可ですね。 「starter」プラン以降で商用利用可能です。 フリーだと月20回までお試しできる感じです。 月千円(「starter」プラン)で800回って事なので、普通は「starter」プランで使い切れない気がします。 使うとすると、基本的に必要な時に有料プランして、終わったらフリーに戻すみたいな使い方になりそうなサービスです。 実際