最近気になった記事2026年01月14日

最近気になった記事2026年01月14日

GPT-5.2とGemini3の画像作成で大きな違いが出るのはなぜか

GPTとGeminiの設計思想の違いを解説しています。
両方の特徴を理解して使い分ければ、欲しい情報や回答を得やすいって事だと思います。
記事では、以下のように

GPT-5.2が考えるAIとして設計

と書かれており、考えをまとめたり問題点を洗い出すなど、何かをする前の準備段階で有効に使えそうで、
Gemini3は次のように書かれていて、

Gemini3は、業務で使われる成果物を作ることを強く意識した設計

最終的にまとめる時や、資料となる画像や具体的な書類を作成するのに向いている感じですね。

記事には以下のように書かれており、

GPT-5.2は、思考から表現へ進みます。Gemini3は、成果物から構成を逆算
GPT-5.2は優秀な戦略コンサルタントです。Gemini3は優秀な資料作成担当

アプローチが真逆なのが面白いですね。
だからこそ、使うタイミングや使い方が大事だと分かります。

更に、

日本語の文字化け問題は、すべての言語で同じように起きているわけではありません。

と書かれていて、それはそうだよなと思います。
日本語は漢字そのものに意味があったりするので、AIにとって特に扱いにくいです。
逆に日本の画像生成AIが最初にこれを突破して正確に文字を画像に書き込むAIを開発できれば、世界に追いつくチャンスもあるかと思いましたが、Google強いですね・・・。

と言う訳で、絵に日本語を書くと言う文脈で次の記事が面白かったです。

Qwen-Imageに日本語を書かせる

画像生成は既に既存の物でもかなりできが良いので、必要なのは如何にうまく日本語を書き込むかって事なので、それをやってみようって記事です。

これの面白い所は、GeminiのNano Banana Proは日本語をかなりうまく扱えて、文字入りポスターみたいな物や、文字入りの図などもうまく作成してくれます。
タイトルの画像もNano Banana Proで作成してもらっています。
その手法を真似て、Qwen-Imageに適用してみるって発想が素晴らしく、綺麗に実装しています。
実際に試してみたい内容ですね。

マイクロソフト、オープンソースの3Dモデル生成AI「TRELLIS.2」リリース! 40億パラメータ、Image-to-3D、MITライセンス

3Dモデルを生成するサービスで、ライセンスがMITなのがポイントですが、依存関係にあるNVIDIA製ライブラリが非商用のライセンス形態なので、結果商用に使えないという所が残念です。
でも、今後に期待したい技術ではあります。

AIに「ありがとう」と言うだけで数千万円の損失が…!? OpenAI代表サム・アルトマンも危惧するChatGPTの“恐るべき電気代”の真相

それはそうですよね。
原理的に、「ありがとう」ってプロンプトを真面目に処理するのでそうなりますよね。
「ありがとう」を処理する専用のAIをフィルタリングして、処理専用AIとか出てきたりするかもしれませんね。
ただこの記事で、電力量や水の使用量の話が出ていますが、

GPT-3の学習に「真水70万リットル」

と書かれていますが、具体的な数値がある内容は、結構根拠が曖昧なので、実態がよく分からないです。
特に「真水70万リットル」の基準が分からなくて、水って突然蒸発することは無くて、冷却に使用したら水は排水として捨てるので、水が温まることが温暖化とかってアプローチなら分かるけど、その辺が雑だと記事自体の信憑性に疑問が出てきますよね。
記事としては,AIがエネルギーや水等の資源を大量に消費しているって所を強調したいのだと思いますが、その辺はごもっともで、AIが電力を馬鹿食いするのは有名な話なので、今後AIの開発競争は性能以外にコスト競争と同時に、低消費電力競争になるのかなと思います。

なぜ誰も手を付けなかったのか? ― Vibeコーディングが解いた15年の沈黙

Vibeコーディングは使えないとか、プロジェクトを破壊する、とか色々ちまたでは言われていますが、使い方次第ってのはなんにでもある典型的な話です。
特にこの記事は、そこそこ利用者がいて有用なツールにもかかわらず、15年以上メンテされていなくて、メンテする人もいないし、金をかけてメンテする程のでは無くて、コストとリターンが見合わないプロジェクトを、筆者の方がAIの力を借りて「15年放置されたOSSを蘇らせる」話が結構面白いので興味がある方は是非読んでみてください。

最後はセキュリティー関連のニュースです。

偽の「ブルースクリーン」でユーザーをだます新たなマルウェアに注意

あの手この手の典型です。他にも色々な手口が書いてるので、知っておくといいかもしれません。

Read more

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットの正体とWebPの「予測マジック」を理解する 次世代画像フォーマットAVIFを触ってみた 割と最近の画像圧縮フォーマットについてです。 「webp」は比較的見るようになったフォーマットですが、従来は画像のサイズが小さいのはJPGで、透明色が使えて画質を維持するのがPNGって感じで、使い分けられていると思います。 しかし、JPGは古いフォーマットで圧縮アルゴリズムも古い上に、透明色が使えないなど改良の余地が多々あるので、「JPEG 2000」というフォーマットも作成されました。 「JPEG 2000」は技術的には従来のJPEGを大幅に上回る優秀なフォーマットにもかかわらず、処理負荷の高さや互換性の問題から一般消費者向けには普及しませんでした。 今となっては、それ程負荷は高くないのですが、開発された当時(2000年代前半)のPCのスペックを考えると厳しかったと思われます。 2001年のPCスペックを調べてみました。 Intel Pentium III 256MBから512MBのRAM 20GBから80GB Windows 98やWindows 2000が主流 この

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5を使ってみましたが、なんか音の厚みが増して日本語の再現度も上がって、歌唱クオリティが一ランク上がったように感じるほどです。 とりあえずバージョンの歴史から V2 (2023年秋):  最大生成時間は1分20秒でした V3 (2024年春):  生成時間が2分に更新されました V3.5 (2024年夏): 曲の構造が改善され、初回生成の最大時間が4分に、延長                       (Extend)は1回につき最大2分まで可能になりました V4 (2024年11月): ボーカル品質が向上し、初回生成の最大時間は4分です。また、「Extend(延長)」「Cover(カバー)」「Persona(ペルソナ)」機能が追加されました V4.5 (2025年5月): 初回生成の最大時間が8分に延長され、プロンプトへの忠実度やスタイルのマッシュアップ機能が向上しました V4.5+ (2025年7月): 「Add Vocals(ボーカル追加)」や「Add Instrumental(インスト追加)」などの制作ツールが更新されました V5 (2025年9月):  オーディ

「NANObanana」があれば、LINEスタンプいらなくね?

「NANObanana」があれば、LINEスタンプいらなくね?

LINEスタンプはすぐに返せて便利なんですが、返したいスタンプを探すのが結構手間になってきています。 スタンプをそれ程沢山持っている訳じゃないんですが、30弱程度あります。 それだけでも、確かこんなのあったなとか、軽い感じのお礼スタンプどれがいいかなとか、選ぶのに時間がかかると、手軽に返せるスタンプの意味がありません。 そこで「NANObanana」です。画像に日本語も入れてもらえるので、スタンプが必要な時に、その場にあったスタンプを作ってしまえばいい!! と言う事で、やってみました。 スタンプのプロンプトは、うまい人がいると思うので、そこを突き詰めたい人はその手の記事を参考にしてください。 今回は、お手軽にその場でスタンプを作って、友人とかに利用するってお話です。 とは言え、イメージ通りの結果は欲しいので、何を注意すればそれっぽく作れるのかは少し実験してみたいと思います。 まずはAIに素直に聞いてみる。AIの事はAIに聞くのが一番です。 次の事に注意しろと教えてもらえます。 キャラクター設定: どのキャラクターを使いたいかを明確に指定します。 セリフや感情表現: どのようなセ

「Claude Code」 関連記事まとめ

「Claude Code」 関連記事まとめ

日々「Claude Code」を使用していますが、新しいツールや「Claude Code」自信もバージョンアップしているため、私自身もアップデートしていかないと、いつの間にか置いて行かれて非効率な使い方をしていたなんて事になりかねません。 と言う訳で、個人的に参考になったり、読んでいて面白かった記事をピックアップしました。 良ければ参考にしてください。 簡単コピペでClaude Codeに144種類のエージェントチームを作成 ── agency-agentsという40Kスター超のAIエージェント集を使いこなす 「Claude Code」は、エージェント次第で生成するコードの質が変わってきます。 まだ使ってはいませんが、使って見ようと思ってます。 効果的なCLAUDE.mdの書き方 「Claude Code」は「CLAUDE.md」の書き方次第でも違いが出るので、この辺も見ておくといいかも内容です。「Claude Code」を使う上での基本ですね。 【2026年版】Claude Codeを最強にするプラグイン・MCP・ツール総まとめ これも結構参考になると思います。 はやり廃りがあ