比較的最近の気になったニュース8月01日

Share
比較的最近の気になったニュース8月01日

ASUSがNVIDIA GB300搭載デスクトップを発表、20PFLOPSの性能をデスクトップPCサイズに凝縮 | XenoSpectrum

20ペタフロップスと784GBメモリ・・・・

これがどのくらい凄いのかを調べました

過去のスーパーコンピューターランキングトップを年代毎にまとめた物です。

2012-13 Titan(Cray) オークリッジ国立研究所 17.59P

2014年は33ペタフロップスまで進んでしますので、丁度2013年ぐらいの、世界最高性能スパコンと同等ぐらいです。
それが普通のデスクトップパソコンとして動くってのが凄いですよね。

ちなみに普通のデスクトップPCの性能が0.5ペタフロップスぐらいといわれていますので、それだけ強力な計算能力があるって事っすね・・・
その分電源も価格も全てがモンスターなので、なんと言ったらいいか・・・

プロ作家たちが語る「AI×小説執筆」の現在地 AIが「書く」「読む」を変える【from Impress】

プロの作家がAIをどのように使用しているかとか、対談も面白いので興味があれば是非。

記事より引用
「「あらすじをAIに読ませて評価させる」ことをしています。「主人公が成長しているか」「ストーリーに意外などんでん返しがあるか」などの評価軸をAIに与えて小説を読ませると、それぞれの評価とともに、どういう伸びしろがあるか、どう改善すべきかのアドバイスを生成できます。」

こんな話興味が引かれますよね。特に「gemini CLI」は、入力量も多いので、かなりの量を読み込ませて評価もできそうです。

「これ、本当に人が住めるの?」水回り、寝室、採光も…約6畳の一軒家の「驚きの間取り」

この写真を見て、同じ宇事を思った人もいるかもしれませんが、「Apex Legends」の「オリンパス」「オータムエステート」にある建物みたいだなと・・・。
まあ、それだけなんですけど・・・

輸出規制対象のGeForce RTX 5090がなぜか中国に大量に。ブロワーファンクーラーへと魔改造されてAI向けに転用される

中国だなぁ~と思うよね
世界に流通している以上、何とでもなるよなぁと思ったり、こんな事ができてしまうのが強みでもあるよなぁとか・・・。
結局AIに関しては(特にLLMに関しては)、アメリカと中国の2強状態を考えると・・・良いか悪いは置いといて、こうやって乗り越えたのかと・・・

「ジャポニカ学習帳」発売55年で大幅リニューアル 表紙の写真→イラストへ - ITmedia ビジネスオンライン

写真じゃなくなってしまう事になんか残念に思うことと、それをどうこう言う事自体が老害的な事なのかなとか、色々考えちゃいますね。
しかもイラストにする事が解決なのかもよくわからないし・・・
そもそもノートがあまり必要なくなったって事なのかもしれません。

自分のグラボでAIを動かせるかVRAM容量を基準にサクッと計算できるウェブアプリ

計算できるけど、ほとんど動かないのがわかるだけって感じではありますw
モデルがもう少し増えると、普通のユーザーには嬉しいかもですね。

NVIDIAが中国製AIの出力を元に追加学習した高性能AIモデル「Llama Nemotron Super 49B v1.5」をリリース、比較的小規模ながら高い性能を発揮

こうやって、NVIDIAが少ないメモリーで動く高性能モデルを作成してくれると、NVIDIAのGPUが売れるって事ですよね。
この手の取り組みを同時にやるので、NVIDIAは強いですよね

ComfyUIでWan2.2をLoRAを使って軽量化し、RTX3060で動かす

これを実際に試してみました。
いい感じで作れますね。作ったサンプルを上げときます。

0:00
/0:05

しかし、ムービーの時間に応してメモリーを消費するので、メモリーを増やしたいですね。

これに関しても書いているので、後日いろいろ試した結果を出します

ユーザーにコマンドを実行させるマルウェア感染手法「ClickFix」の派生版、ファイル選択画面を悪用した「FileFix」

なんか、人をだますテクニックって、いろいろ考えますよね。
よく分からない操作を指示される時は注意が必要って事ですよね。

Read more

自動的にカラオケっぽい歌詞を付けるアプリを作ってみた結果

自動的にカラオケっぽい歌詞を付けるアプリを作ってみた結果

sunoで作成した曲に歌詞を付けるのが手間だなぁ~と常々思っていたのですが、これを効率化したいと言う事で、今回は歌を解析して歌詞を指定すればタイミングを合わせて配置してくれるアプリを作ってみました。 せっかく作ったので少し解説と、どんな物が作れるのか、デモの動画と少し解説をしますが、アプリそのものはライセンスの問題で非公開です。 実際にこのツールで作成した動画を3本ほど紹介 スペルトナエル サイコロ勇者と魔王の城 アトミックピクニック 見てもらうと分かりますが、これが思ったより簡単に作れるようになったので、現在のように短期間で作れるようになりました。 歌詞入りで曲を公開する場合に、歌詞を入れる作業に時間がかかる割に、イマイチなできになる事も多いので、クオリティーが安定したのも良かったです。 では、次の動画で実際にツールを使って曲に歌詞を入れていきます。 使用しているAIのライセンス問題で、手軽に公開できないのと、需要がそれ程無さそうなので、こんなアプリで動画作成してますよって紹介になります。 音源さえ用意すれば、カラオケも作れちゃいます。 カラオケの例です。

ある人から、MarkdownのテキストをPDFにしてくれる何かが欲しいと言われたので、Claude Codeで作る事にした

ある人から、MarkdownのテキストをPDFにしてくれる何かが欲しいと言われたので、Claude Codeで作る事にした

実際、AIはMarkdownで解答を返してくる事が多く、普通に使っているだけでも、Markdown形式のテキストが手軽に表示したり、PDFに変換できると便利だと思うので、ブラウザで手軽に使える物を作りました。 作成後WEB上にアップしたのが以下のURLになります。 https://test.aisgm.me/test_prog/app/md2pdf/ VS Codeのプラグイン入れれば、同じ事は出来ますし、他にも同じようなアプリを作っている人がいるので、それを使うのも手なんですが、最近は怪しいサイトも多いですし、広告が大量に出るものも多いです。 更に、プラグインがウィルスに汚染されているケースなんかもニュースになっているので、セキュリティー的に使った事が無いものを人に勧めるのも怖いです。 そんな訳で、手軽に使えてインストール等の面倒な準備が必要無いってなると、WEBアプリでアクセスすれば使えて、ローカルで処理させるのが良さそうです。 配布やインストールの手間も必要無く、使いたい時にネットに繋がって、ブラウザさえあれば動くので一番使い勝手がいいですよね。 ってな訳で、Claude

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットの正体とWebPの「予測マジック」を理解する 次世代画像フォーマットAVIFを触ってみた 割と最近の画像圧縮フォーマットについてです。 「webp」は比較的見るようになったフォーマットですが、従来は画像のサイズが小さいのはJPGで、透明色が使えて画質を維持するのがPNGって感じで、使い分けられていると思います。 しかし、JPGは古いフォーマットで圧縮アルゴリズムも古い上に、透明色が使えないなど改良の余地が多々あるので、「JPEG 2000」というフォーマットも作成されました。 「JPEG 2000」は技術的には従来のJPEGを大幅に上回る優秀なフォーマットにもかかわらず、処理負荷の高さや互換性の問題から一般消費者向けには普及しませんでした。 今となっては、それ程負荷は高くないのですが、開発された当時(2000年代前半)のPCのスペックを考えると厳しかったと思われます。 2001年のPCスペックを調べてみました。 Intel Pentium III 256MBから512MBのRAM 20GBから80GB Windows 98やWindows 2000が主流 この

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5を使ってみましたが、なんか音の厚みが増して日本語の再現度も上がって、歌唱クオリティが一ランク上がったように感じるほどです。 とりあえずバージョンの歴史から V2 (2023年秋):  最大生成時間は1分20秒でした V3 (2024年春):  生成時間が2分に更新されました V3.5 (2024年夏): 曲の構造が改善され、初回生成の最大時間が4分に、延長                       (Extend)は1回につき最大2分まで可能になりました V4 (2024年11月): ボーカル品質が向上し、初回生成の最大時間は4分です。また、「Extend(延長)」「Cover(カバー)」「Persona(ペルソナ)」機能が追加されました V4.5 (2025年5月): 初回生成の最大時間が8分に延長され、プロンプトへの忠実度やスタイルのマッシュアップ機能が向上しました V4.5+ (2025年7月): 「Add Vocals(ボーカル追加)」や「Add Instrumental(インスト追加)」などの制作ツールが更新されました V5 (2025年9月):  オーディ