比較的最近の気になったAI関連ニュース2026年03月23日

Share
比較的最近の気になったAI関連ニュース2026年03月23日

理論上は可能、現実には不可能だった技術 EUVの正体
半導体の露光装置で、一昔前は日本もトップランナーでした。
ニコンなんかが強かったですが、今では「ASML」の独壇場です。
その理由や経緯などがまとめられているので、興味のある方は読んでみてください。

AIの構造や動作を見る読み物です。

AI Coding Agent の内部構造はどうなっているのか、自作して確かめてみた
コーディングエージェントがどのように動いているのか、内部的な動作を検証した

ローカルLLMで2万文字のドキュメント分析を試した話 - DeepSeek-R1 32Bの実力検証
ローカルLLMの性能もどんどん高くなってきているので、そろそろクラウドとローカルを、処理する内容によって使い分けると効率よくなるケースも出てきそうです。

VIDIA 公式の日本語強化 LLM Nemotron 9B-v2-Japanese を色々なケースで試してみた
Nemotron-Nano-9B-v2-Japaneseってなんだ?〜NVIDIAが放つ日本語特化9Bモデルをローカルで完全攻略〜
「Nemotron-Nano-9B-v2-Japanese」に関しての記事3つですが、結構話題になっているので、とりあえず私も使えるようにしてみました。
もう少し使い込んでみないと、よく分からないですが、気になりますよね。

ローカルLLMでコード生成している記事

人間なら半日の作業が2時間に。ローカルLLM「Qwen3 Coder Next」で爆速開発

aider × Qwen3-Coder-Next × OllamaとClaude Codeの比較

私も「Qwen3.5」のローカルLLMでゲームを作ったので、詳しくはこちらを参照してください。
ローカルのコード生成もかなり良くなってきているので、定期的にいろいろ試してみたいともいます。

「Qwen3.5 Smallモデル」を試す

Qwen3.5 Smallシリーズ完全ガイド — 0.8Bから9Bまで、ローカルLLMの新時代が来た
Qwen3.5でコード生成も試しましたが、ローカルで動かすモデルも結構実用的になりつつありますね。
成長が著しくて、楽しみでもありつつ恐ろしくもありますね。

「OpenClaw」まとめ

「OpenClaw」アプリがあります。
いわゆるオープンソースのAIエージェントで、PC操作もできてしまう強力なエージェントなんですが、その分セキュリティーの問題や必要なファイルを削除してしまう事故など問題もあって、絶賛発展途上です。
ただ既に実用的な段階ではあるので、最近の関連記事をまとめました。

OpenClawが2度も名前を変えざるを得なかった壮絶な理由
まず最初に、「OpenClaw」が今の名前になるまでのお話です。知っておくと愛着がわくかもしれません。

OpenClawの何が特別なのか?
「OpenClaw」についての解説です。
よくわからんって人は読んでみるのも良いかもしれません。

OpenClawライクなソフトをまとめてみた
「OpenClaw」は、同じようなソフトが結構出ています。
それぞれ特徴があるので、「OpenClaw」以外を使ってみたい場合参考になるかもです。
特徴なども記載されているので、用途に合った

Claude Code(開発)× OpenClaw(運用)の責務分離 ── CLAUDE.md 肥大化問題とベストプラクティス
開発に利用した場合です。

【徹底分析】OpenClawは結局どう使われている? 100事例から見えた活用パターン
実際に使っている事例のまとめなので面白いです。
ちょっと記事で気になった例を抜き出します

#5 航空券価格トラッカー — Google Flightsを定期検索し、目標価格以下になったらアラート通知
#12 YouTube動画要約 — 指定チャンネルの新動画を文字起こし・キーインサイト抽出し毎日配信
#34 会議→アクションアイテム — 会議録を要約し、決定事項・担当者・期限を特定しタスク管理ツールに作成

「#5 航空券価格トラッカー」なんて、他の物にも使えますよね。入荷次第お知らせ通知とか、電気製品でも特定の価格以下になったらとか、色々使えそうです。
「#12 YouTube動画要約」なんかも、チャンネルによっては使えますし、特に文字起こしして検索可能にするのも便利そうです。
「#34 会議→アクションアイテム」なんて、仕事とかならめちゃくちゃ便利ですよね。
いままでも、自分でツールを使えば可能な内容ですが、自立的に動いてくれると、忘れたとか失敗したが少なくなりそうで、これからはこの手の機能が便利になりそうです。

その他AI関連

AIエージェントからfreeeのAPIを操作可能なMCPサーバー「freee-mcp」オープンソースとして公開
freeeのサービスも全てAIで処理するという選択肢も出てくる中、「freee」を使った方が色々と楽ですよって機能を追加している感じですね。
この手の対応が早いのは好ましいですよね。

Claude Code / Codexの弱点を解決するOSS「GSD」の設計が良かった
「GSD」を使ってみたんですが、結構いい感じでした。
これを使って作った物もその内公開できるかもです。

Read more

自動的にカラオケっぽい歌詞を付けるアプリを作ってみた結果

自動的にカラオケっぽい歌詞を付けるアプリを作ってみた結果

sunoで作成した曲に歌詞を付けるのが手間だなぁ~と常々思っていたのですが、これを効率化したいと言う事で、今回は歌を解析して歌詞を指定すればタイミングを合わせて配置してくれるアプリを作ってみました。 せっかく作ったので少し解説と、どんな物が作れるのか、デモの動画と少し解説をしますが、アプリそのものはライセンスの問題で非公開です。 実際にこのツールで作成した動画を3本ほど紹介 スペルトナエル サイコロ勇者と魔王の城 アトミックピクニック 見てもらうと分かりますが、これが思ったより簡単に作れるようになったので、現在のように短期間で作れるようになりました。 歌詞入りで曲を公開する場合に、歌詞を入れる作業に時間がかかる割に、イマイチなできになる事も多いので、クオリティーが安定したのも良かったです。 では、次の動画で実際にツールを使って曲に歌詞を入れていきます。 使用しているAIのライセンス問題で、手軽に公開できないのと、需要がそれ程無さそうなので、こんなアプリで動画作成してますよって紹介になります。 音源さえ用意すれば、カラオケも作れちゃいます。 カラオケの例です。

ある人から、MarkdownのテキストをPDFにしてくれる何かが欲しいと言われたので、Claude Codeで作る事にした

ある人から、MarkdownのテキストをPDFにしてくれる何かが欲しいと言われたので、Claude Codeで作る事にした

実際、AIはMarkdownで解答を返してくる事が多く、普通に使っているだけでも、Markdown形式のテキストが手軽に表示したり、PDFに変換できると便利だと思うので、ブラウザで手軽に使える物を作りました。 作成後WEB上にアップしたのが以下のURLになります。 https://test.aisgm.me/test_prog/app/md2pdf/ VS Codeのプラグイン入れれば、同じ事は出来ますし、他にも同じようなアプリを作っている人がいるので、それを使うのも手なんですが、最近は怪しいサイトも多いですし、広告が大量に出るものも多いです。 更に、プラグインがウィルスに汚染されているケースなんかもニュースになっているので、セキュリティー的に使った事が無いものを人に勧めるのも怖いです。 そんな訳で、手軽に使えてインストール等の面倒な準備が必要無いってなると、WEBアプリでアクセスすれば使えて、ローカルで処理させるのが良さそうです。 配布やインストールの手間も必要無く、使いたい時にネットに繋がって、ブラウザさえあれば動くので一番使い勝手がいいですよね。 ってな訳で、Claude

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットの正体とWebPの「予測マジック」を理解する 次世代画像フォーマットAVIFを触ってみた 割と最近の画像圧縮フォーマットについてです。 「webp」は比較的見るようになったフォーマットですが、従来は画像のサイズが小さいのはJPGで、透明色が使えて画質を維持するのがPNGって感じで、使い分けられていると思います。 しかし、JPGは古いフォーマットで圧縮アルゴリズムも古い上に、透明色が使えないなど改良の余地が多々あるので、「JPEG 2000」というフォーマットも作成されました。 「JPEG 2000」は技術的には従来のJPEGを大幅に上回る優秀なフォーマットにもかかわらず、処理負荷の高さや互換性の問題から一般消費者向けには普及しませんでした。 今となっては、それ程負荷は高くないのですが、開発された当時(2000年代前半)のPCのスペックを考えると厳しかったと思われます。 2001年のPCスペックを調べてみました。 Intel Pentium III 256MBから512MBのRAM 20GBから80GB Windows 98やWindows 2000が主流 この

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5を使ってみましたが、なんか音の厚みが増して日本語の再現度も上がって、歌唱クオリティが一ランク上がったように感じるほどです。 とりあえずバージョンの歴史から V2 (2023年秋):  最大生成時間は1分20秒でした V3 (2024年春):  生成時間が2分に更新されました V3.5 (2024年夏): 曲の構造が改善され、初回生成の最大時間が4分に、延長                       (Extend)は1回につき最大2分まで可能になりました V4 (2024年11月): ボーカル品質が向上し、初回生成の最大時間は4分です。また、「Extend(延長)」「Cover(カバー)」「Persona(ペルソナ)」機能が追加されました V4.5 (2025年5月): 初回生成の最大時間が8分に延長され、プロンプトへの忠実度やスタイルのマッシュアップ機能が向上しました V4.5+ (2025年7月): 「Add Vocals(ボーカル追加)」や「Add Instrumental(インスト追加)」などの制作ツールが更新されました V5 (2025年9月):  オーディ