比較的最近の気になったニュース8月23日

Share

「何もしない」が脳に効く科学的な根拠

分かった。今日は何もしない!!

鉱石採掘メカアクション『Mining Merchant』発表。精錬や販売までこなす宝飾店経営、人気採掘ゲーム『Mining Mechs』のスピンオフ


「Super Mining Mechs」の動画を公開していますが、「Mining Merchant」というシリーズの新作が発表されました。
かなり違う方向への進化が進んでいます。
クラフトや店舗の経営シミュレーション・・・こうなると「デイヴ・ザ・ダイバー」に似た感じのシステムになりますね。
https://store.steampowered.com/app/1868140/_/
システムが初期の「Mining Mechs」から徐々にパワーアップしています。なんか成長を見ているようで面白いです。

DeepSeek V3.1、衝撃の6850億パラメータで登場:Claude 4 Opusと同等以上の性能を約70分の1のコストで実現

頻繁にAI関連のニュースがありますが、またでかいのが来ました。
少し前にWAN2.2とかopenAIのgpt-ossなど、それ程間を開けずに公開されて、追いかけるだけで精一杯です。
そんな中、「DeepSeek V3.1」が公開されたのですが、

派手な発表会も、大々的なプレスリリースもなかった。DeepSeekは、開発者コミュニティの心臓部であるHugging Faceに、淡々とモデルファイルをアップロードしただけだ。

中国って発表とか派手にやりそうなイメージでしたが、そうじゃない所が不気味というか、このあと実はまだあるとか、これだけで終わらない可能性すら勘ぐっていしまいます。
更に他の公開されたLLMと比べてもかなり性能も良くなっているようなので、使えるようにしたサービスが出てきたら使って見たいですね。

実際に公開されているサイトを少し覗いてみます。
スクリーンショット

全部で163このファイルがあり、大雑把な計算だとトータル700GBぐらいになります。
凄いでかさですね~
この大きさだと、ローカルで動かす事は厳しいので、色々な企業がクラウドでサービスしてくれるのを待ちたいと思います。

初音ミクがボイスと楽曲で応援してくれる「音声タイマー」とナース姿がキュートな「デジタル温度計」をタニタが限定販売!


相変わらずコラボ商品出ますね。
メモ程度で。

意味なく綺麗な風景

Googleのスマートホーム機器、ついに「Gemini」を搭載--Nest Hubなど対象


元々クラウドで処理する事が多かったイメージなので、裏側の処理を変えれば搭載できるかなと思ったので、もっと早く搭載すると思いました。
何か分からない問題があるのかもしれません。
アマゾンのアレクサも進化しないですし。
所で「ジェミニ」って呼んでましたが、「ジェミナイ」って言ってる人もいて、どっちなんでしょう・・・・?

AnkerのUSB充電器でDOOMをプレイすることに成功


あらゆる電子機器でDOOMを動かすチャレンジですねw
相変わらず変な物で動かしていますが、動くって事は1993年頃、普通に使われていたPCのスペックぐらいの性能があるって事ですよね・・・・
当時のデスクトップPCが充電器に入っていると思うと、技術の進歩も含めて凄いですねw
充電器のスペックも凄い
16MBのSDRAM いわゆるメモリー
8GBのRAM   ストレージですね。
充電器のスペック凄くない?って、思っちゃいましたw

って事で、AIに当時のPC平均スペックを聞いてみました。

1993年当時の平均的なPCスペック
Intel 486 (i486) シリーズが主流。
クロック速度: 20MHz ~ 66MHz(486DX2/66がハイエンド)。
メモリー 4MB ~ 8MBが一般的。
ハードディスク容量: 80MB ~ 200MBが平均的。

今のPCと比較します。で、比較のために単位を合わせます。(本来メモリーなどは「1024」単位で計算しますが便宜上分かりやすさ重視で1000にしています)
クロックは「0.02~0.066Ghz」
メモリー 0.004GB ~ 0.008GBが一般的。
ハードディスク容量: 0.080GB ~ 0.200GBが平均的。

ちなみに私のPCは
Core i9-12900K (3.19 GHz)
64.0 GB
Cドライブの容量は2000GB

昔のPCに単位に合わせると
3190Mh VS 20Mh
640000MB VS 4MB - 8MB

どっちに合わせても、違いすぎてピンとこないですねw
という訳で今回は以上

qwen-imageを使ってみた

Read more

自動的にカラオケっぽい歌詞を付けるアプリを作ってみた結果

自動的にカラオケっぽい歌詞を付けるアプリを作ってみた結果

sunoで作成した曲に歌詞を付けるのが手間だなぁ~と常々思っていたのですが、これを効率化したいと言う事で、今回は歌を解析して歌詞を指定すればタイミングを合わせて配置してくれるアプリを作ってみました。 せっかく作ったので少し解説と、どんな物が作れるのか、デモの動画と少し解説をしますが、アプリそのものはライセンスの問題で非公開です。 実際にこのツールで作成した動画を3本ほど紹介 スペルトナエル サイコロ勇者と魔王の城 アトミックピクニック 見てもらうと分かりますが、これが思ったより簡単に作れるようになったので、現在のように短期間で作れるようになりました。 歌詞入りで曲を公開する場合に、歌詞を入れる作業に時間がかかる割に、イマイチなできになる事も多いので、クオリティーが安定したのも良かったです。 では、次の動画で実際にツールを使って曲に歌詞を入れていきます。 使用しているAIのライセンス問題で、手軽に公開できないのと、需要がそれ程無さそうなので、こんなアプリで動画作成してますよって紹介になります。 音源さえ用意すれば、カラオケも作れちゃいます。 カラオケの例です。

ある人から、MarkdownのテキストをPDFにしてくれる何かが欲しいと言われたので、Claude Codeで作る事にした

ある人から、MarkdownのテキストをPDFにしてくれる何かが欲しいと言われたので、Claude Codeで作る事にした

実際、AIはMarkdownで解答を返してくる事が多く、普通に使っているだけでも、Markdown形式のテキストが手軽に表示したり、PDFに変換できると便利だと思うので、ブラウザで手軽に使える物を作りました。 作成後WEB上にアップしたのが以下のURLになります。 https://test.aisgm.me/test_prog/app/md2pdf/ VS Codeのプラグイン入れれば、同じ事は出来ますし、他にも同じようなアプリを作っている人がいるので、それを使うのも手なんですが、最近は怪しいサイトも多いですし、広告が大量に出るものも多いです。 更に、プラグインがウィルスに汚染されているケースなんかもニュースになっているので、セキュリティー的に使った事が無いものを人に勧めるのも怖いです。 そんな訳で、手軽に使えてインストール等の面倒な準備が必要無いってなると、WEBアプリでアクセスすれば使えて、ローカルで処理させるのが良さそうです。 配布やインストールの手間も必要無く、使いたい時にネットに繋がって、ブラウザさえあれば動くので一番使い勝手がいいですよね。 ってな訳で、Claude

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットの正体とWebPの「予測マジック」を理解する 次世代画像フォーマットAVIFを触ってみた 割と最近の画像圧縮フォーマットについてです。 「webp」は比較的見るようになったフォーマットですが、従来は画像のサイズが小さいのはJPGで、透明色が使えて画質を維持するのがPNGって感じで、使い分けられていると思います。 しかし、JPGは古いフォーマットで圧縮アルゴリズムも古い上に、透明色が使えないなど改良の余地が多々あるので、「JPEG 2000」というフォーマットも作成されました。 「JPEG 2000」は技術的には従来のJPEGを大幅に上回る優秀なフォーマットにもかかわらず、処理負荷の高さや互換性の問題から一般消費者向けには普及しませんでした。 今となっては、それ程負荷は高くないのですが、開発された当時(2000年代前半)のPCのスペックを考えると厳しかったと思われます。 2001年のPCスペックを調べてみました。 Intel Pentium III 256MBから512MBのRAM 20GBから80GB Windows 98やWindows 2000が主流 この

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5を使ってみましたが、なんか音の厚みが増して日本語の再現度も上がって、歌唱クオリティが一ランク上がったように感じるほどです。 とりあえずバージョンの歴史から V2 (2023年秋):  最大生成時間は1分20秒でした V3 (2024年春):  生成時間が2分に更新されました V3.5 (2024年夏): 曲の構造が改善され、初回生成の最大時間が4分に、延長                       (Extend)は1回につき最大2分まで可能になりました V4 (2024年11月): ボーカル品質が向上し、初回生成の最大時間は4分です。また、「Extend(延長)」「Cover(カバー)」「Persona(ペルソナ)」機能が追加されました V4.5 (2025年5月): 初回生成の最大時間が8分に延長され、プロンプトへの忠実度やスタイルのマッシュアップ機能が向上しました V4.5+ (2025年7月): 「Add Vocals(ボーカル追加)」や「Add Instrumental(インスト追加)」などの制作ツールが更新されました V5 (2025年9月):  オーディ