比較的最近の気になったニュース10月23日

Share
比較的最近の気になったニュース10月23日

少し間が空いてしまったので、チェックしたニュースが溜まってしまいました。

Windows上でローカルAIの実行基盤となる「Windows ML」正式版に。CPU/GPU/NPUなどのハードウェアを抽象化した上でさまざまなAIモデルを実行


これが本格的に色々なAIモデルが出てくると、面白いことになりそうですね。
AIのdirectXみたいな事になって、色々な

韓国、政府のオンラインストレージが火災で焼失 8年分の業務資料858TBが消滅か バックアップなく「気が遠くなる」 現地報道

バックアップが大切だだとよく分かります。
それと、リチウムイオン電池は取扱注意ですね。

映像もあるので、こちらを参照してください

SteamやPSNなど世界規模でゲームサービス障害が発生、AISURUボットネットが原因か?

結構広く影響があったみたいですね。
なんかSteamが不調だなぐらいに見てましたw

迷宮ダンジョン探索RPG『Paper Dungeon』、日本人気が凄いので日本語対応決定。1000人以上の日本ユーザーが待ちわびる

なんかこういうニュースいいですよね。
ユーザー層を気にしているゲームも増えてきたので、みんなで買えばローカライズの可能性があると思うと、買って待とうって気にもなります。
AI翻訳の精度も上がって来たので、AI翻訳でもいいから翻訳して欲しいですよね。

【コピペOK】技術的負債を作らないためのルールを設定しよう(Claude Code, Codex, Cursor対応)

これはいいですね。まだ使っていないですが、試してみようと思いました。
コード生成を行っている方は、参考になりそうです。

都道府県魅力度ランキング最下位さいたまごパン

さいたまネタなので。埼玉って昔から自虐が好きなので・・・。

Huawei、LLMの精度を保持したまま最大70%メモリ削減できる新手法を発表──コンシューマーGPUでの高精度生成AI実行も視野に

「コードはGitHub上で公開されており、研究者や開発者が自由に評価・応用できる環境が整っている。」と書かれているので、この仕組みで最適化されたLLMが出てくると、面白くなりそうですね。
特に、色々なデバイスに組み込まれると、面白い製品が出てきそうですし、PCで手軽に実行できるそこそこ頭がいいAIが出てきても面白そうなので、期待です。
公開しているのが凄いですよね

VisaやMastercard利用停止中の「DLsite」が新たな決済手段「みんなの銀行決済」提供開始

クレジットカードにいじめられて、銀行決済でサービス継続って感じのようですね。
しかし、クレジットカードの問題は一企業が法律を越えて、表現の自由を蔑ろする行為なので、ちょっと危ないですよね。
公平な電子マネーが必要なのかもしれません。

AIアシスト機能で“誰でもゲーム開発可能”を謳うオープンソースプラットフォーム「EdenSpark」発表。人気ゲーム『War Thunder』開発元が打ち出す

誰でもアイディアさえあればゲームが作れる世界は近いかもしれませんね。
「クローズドベータテストは今年11月に開始され、正式リリースは2026年を予定」との事なので、ちょっと使って見たいですが、料金体系などはどうなるのですかね。

Intel NPUってタダの飾り?使われてるの?AI機能/ソフトをいろいろ試してみた

どんなソフトがNPUに対応しているのか含めて、参考になるかと思います。

電気通信大学、京王線の車内広告に「QR添えていない。読み取らないで」

この手の罠って興味をそそられます。
何の説明も無いボタンが設置されてても、押してみたくなるとかそんな心理と一緒ですよね。
でも、QRコードは普通にやばいので注意です。

バイトダンスが中国で最も人気のAIチャットボットを生み出した理由

中国の動向って分からないことが多いのですが、AIに関してはかなり進んでいるのは理解していました。
しかし、こんな事になっているとは・・・
動きが速すぎて、追えないです。

日本初の「水素アシスト自転車」、国交省の型式認定を取得

日本は水素をかなり推し進めていたと思いますが、結果中国企業が日本初な訳で、色々考えさせられる物はあります。
自動車はトヨタやホンダが、採算はともかく実働していますが、自転車は手薄な感じがしますし・・・・。

0:00
/0:01

特に意味は無い

Read more

自動的にカラオケっぽい歌詞を付けるアプリを作ってみた結果

自動的にカラオケっぽい歌詞を付けるアプリを作ってみた結果

sunoで作成した曲に歌詞を付けるのが手間だなぁ~と常々思っていたのですが、これを効率化したいと言う事で、今回は歌を解析して歌詞を指定すればタイミングを合わせて配置してくれるアプリを作ってみました。 せっかく作ったので少し解説と、どんな物が作れるのか、デモの動画と少し解説をしますが、アプリそのものはライセンスの問題で非公開です。 実際にこのツールで作成した動画を3本ほど紹介 スペルトナエル サイコロ勇者と魔王の城 アトミックピクニック 見てもらうと分かりますが、これが思ったより簡単に作れるようになったので、現在のように短期間で作れるようになりました。 歌詞入りで曲を公開する場合に、歌詞を入れる作業に時間がかかる割に、イマイチなできになる事も多いので、クオリティーが安定したのも良かったです。 では、次の動画で実際にツールを使って曲に歌詞を入れていきます。 使用しているAIのライセンス問題で、手軽に公開できないのと、需要がそれ程無さそうなので、こんなアプリで動画作成してますよって紹介になります。 音源さえ用意すれば、カラオケも作れちゃいます。 カラオケの例です。

ある人から、MarkdownのテキストをPDFにしてくれる何かが欲しいと言われたので、Claude Codeで作る事にした

ある人から、MarkdownのテキストをPDFにしてくれる何かが欲しいと言われたので、Claude Codeで作る事にした

実際、AIはMarkdownで解答を返してくる事が多く、普通に使っているだけでも、Markdown形式のテキストが手軽に表示したり、PDFに変換できると便利だと思うので、ブラウザで手軽に使える物を作りました。 作成後WEB上にアップしたのが以下のURLになります。 https://test.aisgm.me/test_prog/app/md2pdf/ VS Codeのプラグイン入れれば、同じ事は出来ますし、他にも同じようなアプリを作っている人がいるので、それを使うのも手なんですが、最近は怪しいサイトも多いですし、広告が大量に出るものも多いです。 更に、プラグインがウィルスに汚染されているケースなんかもニュースになっているので、セキュリティー的に使った事が無いものを人に勧めるのも怖いです。 そんな訳で、手軽に使えてインストール等の面倒な準備が必要無いってなると、WEBアプリでアクセスすれば使えて、ローカルで処理させるのが良さそうです。 配布やインストールの手間も必要無く、使いたい時にネットに繋がって、ブラウザさえあれば動くので一番使い勝手がいいですよね。 ってな訳で、Claude

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットの正体とWebPの「予測マジック」を理解する 次世代画像フォーマットAVIFを触ってみた 割と最近の画像圧縮フォーマットについてです。 「webp」は比較的見るようになったフォーマットですが、従来は画像のサイズが小さいのはJPGで、透明色が使えて画質を維持するのがPNGって感じで、使い分けられていると思います。 しかし、JPGは古いフォーマットで圧縮アルゴリズムも古い上に、透明色が使えないなど改良の余地が多々あるので、「JPEG 2000」というフォーマットも作成されました。 「JPEG 2000」は技術的には従来のJPEGを大幅に上回る優秀なフォーマットにもかかわらず、処理負荷の高さや互換性の問題から一般消費者向けには普及しませんでした。 今となっては、それ程負荷は高くないのですが、開発された当時(2000年代前半)のPCのスペックを考えると厳しかったと思われます。 2001年のPCスペックを調べてみました。 Intel Pentium III 256MBから512MBのRAM 20GBから80GB Windows 98やWindows 2000が主流 この

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5を使ってみましたが、なんか音の厚みが増して日本語の再現度も上がって、歌唱クオリティが一ランク上がったように感じるほどです。 とりあえずバージョンの歴史から V2 (2023年秋):  最大生成時間は1分20秒でした V3 (2024年春):  生成時間が2分に更新されました V3.5 (2024年夏): 曲の構造が改善され、初回生成の最大時間が4分に、延長                       (Extend)は1回につき最大2分まで可能になりました V4 (2024年11月): ボーカル品質が向上し、初回生成の最大時間は4分です。また、「Extend(延長)」「Cover(カバー)」「Persona(ペルソナ)」機能が追加されました V4.5 (2025年5月): 初回生成の最大時間が8分に延長され、プロンプトへの忠実度やスタイルのマッシュアップ機能が向上しました V4.5+ (2025年7月): 「Add Vocals(ボーカル追加)」や「Add Instrumental(インスト追加)」などの制作ツールが更新されました V5 (2025年9月):  オーディ