AI関連

AIの種類って多いのでopenAIのchatGPTだけまとめてみた

ais

13 Jun 2025 — 4 min read

色々なLLMがありますが、一番一般的に知られているのがchatGPTだと思います。
最近のAIの代名詞って感じでしょうか？
実際、「o4-mini」と「GPT-4o Mini」って何が違って、結局どっちが新しいの？何が違うの？
と、聞かれるとさっぱりです・・・
他にも、別の会社のAIも
Grok
DeepSeek
Qwen
Llama
Claude
Gemini
なんて感じで沢山あります。
他もまとめたい所ですが、まずはchatGPTを調べる事にしました。

そこで、こういう事はAIさんにまとめてもらいました。

簡単にまとめると

幅広い用途・高精度を求めるなら：GPT-4o
コスト重視・個人/小規模用途なら：GPT-4o Mini
人間らしさ・自然な対話重視なら：GPT-4.5
開発・業務自動化・長文処理なら：GPT-4.1
専門的な推論や研究開発なら：oシリーズ

という感じですが、もう少し詳しく得意な物と不得意な物を表にしてみました

主なモデル一覧と特徴

モデル名	リリース	主な特徴・用途	向いている用途	不向きな用途・注意点
GPT-4.5	2025年2月	感情知能・自然な対話・応答速度向上。ハルシネーション抑制。創造性・直感力も強化。	カスタマーサポート、創造的な文章作成、自然な対話	高度な指示精度や専門的コーディングでは4.1に劣る
GPT-4o	2024年5月	テキスト・画像・音声のマルチモーダル処理。リアルタイム応答。高精度な会話・情報整理。	画像・音声を含む会話、レポート作成、全般的な業務	超長文や専門的コーディングは4.1が優位
GPT-4o Mini	2024年7月	GPT-4oの軽量・高速・低コスト版。精度はやや劣るが、ほぼ同等の機能。個人・小規模向け。	無料利用、リアルタイム応答、モバイル・軽量端末	高度な専門性や最大精度が必要な業務
GPT-4.1	2025年4月	1Mトークンの超長文対応。指示追従・コーディング性能が大幅向上。業務・プログラミング特化。	プログラミング、業務指示、構造化文書、長文分析	日常会話や感情表現は4.5/4oが優位
GPT-4.1 Mini	2025年4月	4.1の軽量・高速版。コスト重視・API向け。精度はやや低いが、指示追従や長文処理は十分。	コスト重視の開発、軽量な業務自動化	最高精度・複雑なコーディング
GPT-4.1 Nano	2025年4月	4.1シリーズ最小・最速モデル。リアルタイム性重視。精度は低い。	超低コスト・即時応答が必要なタスク	高度な推論・専門性
o1シリーズ	2024年12月	高度な推論・複雑な問題解決。STEM分野や経営戦略など専門性重視。	研究・分析・戦略立案、複雑な意思決定	日常会話や汎用的な用途
o3-mini	2025年1月	o1系の高速・柔軟モデル。思考の深さを3段階調整可能。数学・コーディング・科学分野に強い。	学術研究、ビジネス現場、数学・科学分野	感情表現や自然な対話
o4-mini	2025年4月	o3の後継。高度な推論・画像とテキストの同等処理。視覚情報の理解に強い。	画像分析・高度な推論タスク	汎用的な会話や感情表現

ざっくりモデル別の向き・不向きまとめ

GPT-4o：万能型。マルチモーダル（テキスト・画像・音声）対応で、日常会話から業務・レポート作成まで幅広く活躍。リアルタイム性と高精度を両立。
向き: 報告書作成、情報整理、画像・音声を含む会話、最新情報収集
不向き: 超長文や複雑なコーディング（4.1が上）

GPT-4o Mini：4oの軽量版。無料・低コスト・高速で、個人利用や小規模ビジネス、モバイル端末などに最適。
向き: 無料利用、リアルタイムチャット、大量タスク処理
不向き: 最高精度や専門性が必要な業務

GPT-4.5：感情知能・自然な対話・応答速度が強化。人間らしい会話や共感が必要な場面に強い。
向き: カスタマーサポート、創造的な文章、対話重視のアプリ
不向き: 精密な業務指示やコーディング

GPT-4.1：超長文・コーディング・業務タスク特化。指示追従力と安定性が高い。
向き: プログラミング、業務自動化、構造化文書、長文分析
不向き: 感情表現や自然な会話

oシリーズ（o1/o3/o4）：高度な推論や専門性重視。学術・研究・分析向け。
向き: 研究開発、戦略立案、数学・科学分野
不向き: 汎用的な会話や感情的なやりとり

自分の用の調査ですが、参考になれば。

以上

昨今のローカルAIでゲームを作ってみる実験（vibe-localを使ってみました）

とりあえず遊びたい人のために、ブラウザで遊べるリンクはこちらです。では本題です。ローカルAIは、クラウドタイプと比較すると、かなり性能が劣ります。実際半年ぐらい前だと、簡単なコードなら問題無く作ってくれましたが、具体的に細かい部分を指摘すると破綻したりして、中々うまく行きませんでした。正直ほぼ使い物にならない感じで、しばらく静観って感じだったのですが、こんな記事を発見！クロードコードにクロードコード作ってって言って寝たら，朝起きたらクロードコードが出来てたんだ… 万博でも猛威を振るっていた、「落合陽一」さんが、Claude Code的な機能をローカルAI特化で作られていて、オープンソースで手軽に利用できます。更に、AI界隈では珍しく、公式の日本語解説まであります。ハードウェア以外は、全て無料で簡単に構築できるので、追加のお金を心配しなくてもいい、親御さんも安心のvibecoding環境が整います。じゃあ、実際にどのくらいの事が出来るのか？試してみました。今回の環境は、WindowsPCに「vibe-local」をインストールします。 https:/

「ガチョウ（goose）」や「アヒル（duck）」の名前が付いているサービス名を見かけるのでAIに聞いてみた

「ガチョウ（goose）」や「アヒル（duck）」の名前を使ったサービスやアプリをちょいちょい見かけるので、なんでかなと思ってAIに聞いてみました。「GPT-5.2」を使用してます。事の発端ですが、ガチョウとかアヒルって外人好きだよなって思う事があって、プライバーシー重視の検索サービス「DuckDuckGo」とか、AIエージェントの「goose」とか、VPNサービス「GOOSE VPN」など他にもありそうなので、軽く検索して、探してみました。軽く検索した結果（探せばもっとあるはず）サービス概要名前検索サービス DuckDuckGo ゲームエスケープフロムダッコフ AIエージェント goose 見守りサービス GOOSE ダウンジャケット CANADA GOOSE 水鳥を自動カウントするサービス Goose 1・2・3 VPNサービス GOOSE VPN

比較的最近の気になったAI関連ニュース２０２６年０２月２３日

なぜAIは学習していない画像を生成できるのか？──創造性をめぐる最新研究 AIの画像生成は、単なるコピペとかのレベルを遙かに超えていますが、AIがどう動いているのかは、まだ完全には解明されていません。 AIの動作を現在分かっている事や、説なんかを解説している記事です。気になる方は読んでみてください。 AIの内部に脳の「報酬系」に酷似したシステムを発見：大規模言語モデルの知能を支える1%のドーパミンニューロンと価値回路の正体 AIの仕組みに関しての研究です。人間の脳と同じような動きをAIもしている話なので、色々考えさせられます。結構面白いです。サーバーワークス、Anthropicの生成AIモデル「Claude」をAWS上で正規ライセンス販売コード生成AIは、コードを一度サーバーに送るので、漏洩などの心配から利用できない企業も多かったですが、この仕組みを使うとAWSで自社専用に借りたサーバーで「Claude」を動かす事が出来るので、使いやすい会社も多くなりそうな仕組みです。他に比べて使い勝手が良くるので、「Claude」が更に強くなりそうです。 AMDがグリグリ

音楽生成AI「ACE-Step v1.5」が本当に「Suno v4.5」を越えるのか聞き比べできるようにしてみた

こんな記事があったので、実際にsunoでも同じ歌詞の曲を作って比較してみます。無料で「Suno v4.5」超え？　音楽生成AI「ACE-Step v1.5」公開　個人向けGPUでも動作「ACE-Step v1.5」は、ComfyUIにテンプレートがあるので、簡単に利用できまます。軽く曲を作って、「suno v4.5」でも作成してみます。ついでに「suno v5.0」でも作成して、比較してみたいと思います。まずは、作成する曲についてです。曲調などのスタイルは Style Prompt: Acoustic Guitar, Folk, Country, Warm, Upbeat, Female vocal このような指定で、ギター中心のカントリーで、ボーカルは女性を指定しました。続いて歌詞ですが、以下のような歌詞です。ちなみに「Cast