ais

比較的最近の気になったニュース11月26日

比較的最近の気になったニュース11月26日

ここ最近色々追いつかなくて、更新が滞っております・・・・ 書きかけの記事も何個かあって・・・ぐぬぬ そんな訳で、最近気になったニュースです。 エレコム、よくやった! ひと目で「仕様」がわかるUSB-Cケーブル登場 USBケーブルって凄く種類が多くて、規格を考えた奴土下座しろって言いたくなりますw データーの転送速度と、電気の流量の組み合わせで性能に差があり、100Wの電気が流せるのに、データの転送速度が「USB2.0」相当とか・・・ 「USB3.1 Gen1」は「USB2.0」の約10倍ぐらいの速度なので、差が激しいですよね。それが全く書かれていないし、分からないケーブルも沢山あるので書いてくれるとありがたいですね。 USB Cable Checker3 ちなみにこんな製品も出ていて、USBケーブルの性能をテストできます。 実は持っている上に、クラファンで購入したので、ブログに書こうと思っているので、その内書きます。 AIは著者が中国人であることが明らかになると途端に「反中」モードになることが判明:特にDeepSeekが顕著な傾向 面白い記事ですね。学習元の影響が大きい

ローカルで効果音が作成できるAI「MMAudio」を使ってみた(「Waves Place」と同じ効果音も作ってみました)

ローカルで効果音が作成できるAI「MMAudio」を使ってみた(「Waves Place」と同じ効果音も作ってみました)

MMAudio は、ビデオやテキストや画像の入力が与えられると、動画は同期されたオーディオ、画像はそれに合った音を生成します。 使用方法は Pinokio https://pinokio.co/ こちらのアプリからインストールして、「MMAudio」を使います。 インストール方法などは別記事を書きたいと思います。 比較対象として 時計のG-shockでおなじみのCASIO(カシオ)の新サービス!AIで効果音が生成できる「Waves Place」を試してみた の記事と比較しやすいように、同じようなプロンプトで作成します。 MMAudio は、ビデオやテキストや画像の入力が与えられると、動画は同期されたオーディオ、画像はそれに合った音を生成します。 使い方が非常に簡単な上に、動画に合わせて生成できるのも使い勝手がいいですね。カシオの「Waves Place」はテキストからだけだったので、こちらの方が少し上な感じがします。 実際にできるのは、 ・テキストから効果音生成 ・画像から効果の音生成 ・動画に合わせて効果音生成 前に「Waves Place」用に作成した動画が、丁

久々にオールインワンのコード生成「DeepSite」を使ってみた

久々にオールインワンのコード生成「DeepSite」を使ってみた

AIがWEBサイトをコーディングしてくれるサービスです。 DeepSite https://huggingface.co/spaces/enzostvs/deepsite 今回はテトリスっぽいゲームを作ってもらいました 今回の完成品 https://iaisd9-blocky-blitz-bonanza.static.hf.space/index.html では本題です。 アカウント(無料)を作ると、完成品をこのように公開できます。 ちなみに無料のユーザー登録すると、制作物を「DeepSite」で公開できる機能もあるので便利です(今回はその機能を使っています)。 複数のページが相互接続された複雑なウェブサイトを構築できます。 シンプルなランディングページから、動的なルーティングとナビゲーションを備えたフル機能のウェブアプリケーションまで、あらゆるものを構築できます。 と言う事で、WEBページであれば、かなりの物を作成できるサービスなので、当然ブラウザで遊べるゲームも作る事ができるので、テトリス的なゲームを作ってもらいました。 このサービスに限らず、既にWEB

時計のG-shockでおなじみのCASIO(カシオ)の新サービス!AIで効果音が生成できる「Waves Place」を試してみた

時計のG-shockでおなじみのCASIO(カシオ)の新サービス!AIで効果音が生成できる「Waves Place」を試してみた

前に気になっていたけど、試していなかったので、今回試してみました。 CASIOのアカウントを作成する必要があります。 ちょっとめんどいですが、無料で試せるのでとりあえず作成して試してみました。 一応プレスリリースです。 AIで効果音が生成できる「Waves Place」とライブ配信専用スケジューラー「Streamer Times」を正式リリース 実際どんな交換が生成できるのか、結構気にはなってます。 効果音系のアプリも実は持っているので、そんなのと比較もしてみたいですが、今回はこのサービスがどんな感じかを試します。 まず、料金プランのリンクです。最新情報はこちらを参照してください。 一応現在時点のプランです。 フリープランでは商用は不可ですね。 「starter」プラン以降で商用利用可能です。 フリーだと月20回までお試しできる感じです。 月千円(「starter」プラン)で800回って事なので、普通は「starter」プランで使い切れない気がします。 使うとすると、基本的に必要な時に有料プランして、終わったらフリーに戻すみたいな使い方になりそうなサービスです。 実際

比較的最近の気になったニュース11月03日

比較的最近の気になったニュース11月03日

『とんでもスキルで異世界放浪メシ2』シーズン2登場の企業20社が明らかに エバラや不二家など20社が協力 原作だとぼかされていたメーカー製品が、アニメで実際のメーカー名を出して表記しているので、原作ではやりたかったけどできなかったかもしれない事をアニメでできているのはいいですね。 メーカーもいい宣伝になるって判断でしょうかね 特に、海外へアニメは輸出されるので、知名度アップには貢献しそうです。 「DeepSeek-OCR」を試す 画像でテキストをトークン圧縮するDeepSeek-OCRがいろいろすごい AIネタです。 画像でテキストをトークン圧縮する研究をしていたら、OCR(Optical Character Recog nition(光学文字認識))の技術が凄い良くなったって事みたいです。 面白い上に有益ですね。 Web版 Claude Code の概要 Claude Codeは今までのAI支援開発ツールとは何が違うのか Claude Skillsを使ってみた - システムプロンプト的なカスタマイズが面白い Claude Codeのカスタムスラッシュコマンドをマスター

比較的最近の気になったニュース10月23日

比較的最近の気になったニュース10月23日

少し間が空いてしまったので、チェックしたニュースが溜まってしまいました。 Windows上でローカルAIの実行基盤となる「Windows ML」正式版に。CPU/GPU/NPUなどのハードウェアを抽象化した上でさまざまなAIモデルを実行 これが本格的に色々なAIモデルが出てくると、面白いことになりそうですね。 AIのdirectXみたいな事になって、色々な 韓国、政府のオンラインストレージが火災で焼失 8年分の業務資料858TBが消滅か バックアップなく「気が遠くなる」 現地報道 バックアップが大切だだとよく分かります。 それと、リチウムイオン電池は取扱注意ですね。 映像もあるので、こちらを参照してください SteamやPSNなど世界規模でゲームサービス障害が発生、AISURUボットネットが原因か? 結構広く影響があったみたいですね。 なんかSteamが不調だなぐらいに見てましたw 迷宮ダンジョン探索RPG『Paper Dungeon』、日本人気が凄いので日本語対応決定。1000人以上の日本ユーザーが待ちわびる なんかこういうニュースいいですよね。 ユーザー層を気に

最近のAI関連記事10月10日

最近のAI関連記事10月10日

社長が、自腹のRTX2080で国産生成AIをゼロから作ってみた話 https://note.com/rk611/n/n4dfffbbed408 実際に初歩的な事をやってみるは、経験として大きいかなと思いました。 ちょっと、やってみたくなりました。ハードルはちょっと高いですけど・・・ ″仕様駆動開発″というプロンプトを外付けするSpec Kit https://zenn.dev/watany/articles/46f7a8006eb054 kiroが人気になって、それ系の考え方で色々な物が作られていますが、これもその一つですね。 結局ちゃんと仕様書を作った方がいい物ができるのは自明なので、その仕組みをAI開発に持ち込むって事で、これもなるべくしてなった感はありますね。 複数 AI エージェントの MCP サーバーの設定を一元管理する「mmcp」の紹介 https://zenn.dev/kou_pg_0131/articles/mmcp-introduction いろいろやっていると、あると便利かもって感じだったのでメモ 【2025年版】テンセントAI「Hunyuan (混元)

HuMo AIを軽く使ってみた(ローカル動画生成AI)

HuMo AIを軽く使ってみた(ローカル動画生成AI)

「HuMo AI」が「ComfyUI」から簡単に利用できるようになったので、軽く使って見ました。 この生成AIのポイントが何かというと、 テキスト + 画像 テキスト + オーディオ テキスト + 画像 + オーディオ このようにプロンプトに画像やオーディをを合わせた動画を作成できます。 テキスト+画像は、よくあるベース画像にテキストのプロンプトで動きやシーンを指示するものです。 オーディオはリップシンクしてくれるので(最近は当たり前のようにリンプシンクしてくれるので凄いですよね)、テキストの読み上げ音声に合わせて唇が動く動画や、歌に合わせて唇を動かすものから、曲に合わせてダンスする物も作成できる感じです いろいろ試してみましたが、私の環境「RTX5070 Ti」だと、メモリーの都合で最大6秒ぐらいまでしか生成できませんでした。 ですので、安定して生成できる5秒の動画を作成しています。 ただ、3秒までの生成が、動画のクオリティも上がる感じがするので、5秒まで生成できるが3秒までが推奨のなんだと思います。 では、実際にやってみました。 最初はテキストプロンプトと音楽のみです。

「Audio Converter & Splitter」の使い方

「Audio Converter & Splitter」の使い方

ソフトウェア公開サイトソフトウェア公開サイト Audio Converter & Splitter https://test.aisgm.me/test_prog/app/audio-converter/ アプリの公開用サイト 使い方 音ファイルを点線の枠内にドラッグ&ドロップします。 画像では赤い部分です ファイルを選択します。 同時に複数のファイルをアップできるので、分割したりフォーマット変換したいファイルを選択します。 音声分割を行う場合、分割方法(黄緑)の選択をして、分割数(黄色)を指定します。 秒数指定を行いたい場合は、秒数を指定します。 水色部分をクリックすると分割処理が始まります。 今回は14秒単位での分割を行いました。 処理が終わると画像のような表示になり、赤い部分をクリックすると一括でダウンロードできます。 それぞれのファイル毎にダウンロードすると事もできます。 フォーマット変換する場合 WAV、MP3、ogg、それぞれ変換することができます。 赤い部分で変換先のフォーマットを選択します。 青い部分が実行ボタンになるので、設定に

素人が作る実写っぽいミュージックビデオの作り方 その2

素人が作る実写っぽいミュージックビデオの作り方 その2

今回のポイント ・歌の音ファイルの作り方 ・音ファイルを動画生成用に分割する ・リップシンクの動画ファイルの作り方 ・動画編集 前段は前回の記事を参照してください 音楽ファイルの作成 SUNO AIを使用して作成しています。 ベースの歌詞をAIに作成してもらって、手直しします。 どんな歌詞を作るか、概要をまとめてAIに渡します。 具体的なプロンプト 作りたい歌詞の内容や使用したい単語、曲のイメージを説明します。 それに、以下の分をコピペしてくっつけてAIに投げます。 歌詞は以下のタグ中から使用してください [Verse 1] [Verse 2] [Verse 3] [Verse 4] [Chorus] [Powerful‐Chorus] [Bridge] [Outro] [Lead-In] [Pre-Chorus] [Post-Chorus] [Ending] [rap] [hook] [drop] [hook] [Piano-solo] [Violin‐solo] [Drums‐solo] [Bass Drum‐solo] [Electr

素人が作る実写っぽいミュージックビデオの作り方 その1

素人が作る実写っぽいミュージックビデオの作り方 その1

結構長くなりそうなので、何回かに分けて書きます。 続きは以下からどうぞ 素人が作る実写っぽいミュージックビデオの作り方 その2 今回作成したミュージックビデオです。 音楽以外はローカルで作成しました。 クラウドサービスは、結構サービス料金がかかりますが、GPUの購入価格と比較すると、どちらが高くなるかは、使用頻度なんかで変わるかと思います。 一点、ローカルで有利なので、試行錯誤を行いやすい事でしょうか? ローカル環境の紹介と大雑把な制作の流れ、クラウドとの比較なんかをしていきたいと思います。 今回の実際に作成した過程や、ローカル環境での細かい作り方等は次回行いたいと思います。 まず作成環境 動画生成 AMD Ryzen AI 9 HX 370 / Radeon 890M RTX5070TI 動画生成ツールは「ComfyUI」を使用 AIは「WAN2.2」と「humo」を使用しました。 音楽はSUNOを使用しました。 音楽作成はSUNO Ver4.5+が最新だったので、Ver4.5+です。 元々の女性はQwenImageを使用しました。 動画は比較的生成

比較的最近の気になったニュース9月23日

比較的最近の気になったニュース9月23日

「Claude」、チャットからPDFやスプレッドシートの作成が可能に 結構便利そうです。 ただセキュリティーの懸念はあるみたいなので、注意が必要かも。 「Googleドライブ」を使うみたいなので、専用のGoogleアカウントを作るとかですかね。 国内1000件の事例や製品を収録した「生成AI活用事例データベース」を公開─生成AI活用普及協会 事例を知るだけでも、色々と推測できたり思いがけない使われ方を知れたりするので結構有用に思います。 主従を入れ替えたIntelとNVIDIAの歴史的提携発表、その背景にAIデータセンターあり Intel主体の時はNVIDIAを拒み続けてきた訳ですが、NVIDIAが金の力でIntelをねじ伏せる日が来るとは・・・・ 沢山このニュースの記事はありますが、大手新聞記事含めてもこの記事が一番内容がいいです。 歴史的な経緯の解説がちゃんとあって、このニュースがどれだけ大きな意味を持つのかちゃんと書かれています。 表面的な記事を読むくらいなら、この記事を是非読んで欲しいです。 この記事を書かれている方は、この業界を長年取材して大変詳しい方です。