AIの種類って多いのでopenAIのchatGPTだけまとめてみた

AIの種類って多いのでopenAIのchatGPTだけまとめてみた

色々なLLMがありますが、一番一般的に知られているのがchatGPTだと思います。
最近のAIの代名詞って感じでしょうか?
実際、「o4-mini」と「GPT-4o Mini」って何が違って、結局どっちが新しいの?何が違うの?
と、聞かれるとさっぱりです・・・
他にも、別の会社のAIも
Grok
DeepSeek
Qwen
Llama
Claude
Gemini
なんて感じで沢山あります。
他もまとめたい所ですが、まずはchatGPTを調べる事にしました。

そこで、こういう事はAIさんにまとめてもらいました。

簡単にまとめると

幅広い用途・高精度を求めるなら:GPT-4o
コスト重視・個人/小規模用途なら:GPT-4o Mini
人間らしさ・自然な対話重視なら:GPT-4.5
開発・業務自動化・長文処理なら:GPT-4.1
専門的な推論や研究開発なら:oシリーズ

という感じですが、もう少し詳しく得意な物と不得意な物を表にしてみました

主なモデル一覧と特徴

モデル名リリース主な特徴・用途向いている用途不向きな用途・注意点
GPT-4.52025年2月感情知能・自然な対話・応答速度向上。ハルシネーション抑制。創造性・直感力も強化。カスタマーサポート、創造的な文章作成、自然な対話高度な指示精度や専門的コーディングでは4.1に劣る
GPT-4o2024年5月テキスト・画像・音声のマルチモーダル処理。リアルタイム応答。高精度な会話・情報整理。画像・音声を含む会話、レポート作成、全般的な業務超長文や専門的コーディングは4.1が優位
GPT-4o Mini2024年7月GPT-4oの軽量・高速・低コスト版。精度はやや劣るが、ほぼ同等の機能。個人・小規模向け。無料利用、リアルタイム応答、モバイル・軽量端末高度な専門性や最大精度が必要な業務
GPT-4.12025年4月1Mトークンの超長文対応。指示追従・コーディング性能が大幅向上。業務・プログラミング特化。プログラミング、業務指示、構造化文書、長文分析日常会話や感情表現は4.5/4oが優位
GPT-4.1 Mini2025年4月4.1の軽量・高速版。コスト重視・API向け。精度はやや低いが、指示追従や長文処理は十分。コスト重視の開発、軽量な業務自動化最高精度・複雑なコーディング
GPT-4.1 Nano2025年4月4.1シリーズ最小・最速モデル。リアルタイム性重視。精度は低い。超低コスト・即時応答が必要なタスク高度な推論・専門性
o1シリーズ2024年12月高度な推論・複雑な問題解決。STEM分野や経営戦略など専門性重視。研究・分析・戦略立案、複雑な意思決定日常会話や汎用的な用途
o3-mini2025年1月o1系の高速・柔軟モデル。思考の深さを3段階調整可能。数学・コーディング・科学分野に強い。学術研究、ビジネス現場、数学・科学分野感情表現や自然な対話
o4-mini2025年4月o3の後継。高度な推論・画像とテキストの同等処理。視覚情報の理解に強い。画像分析・高度な推論タスク汎用的な会話や感情表現

ざっくりモデル別の向き・不向きまとめ

GPT-4o:万能型。マルチモーダル(テキスト・画像・音声)対応で、日常会話から業務・レポート作成まで幅広く活躍。リアルタイム性と高精度を両立。
向き: 報告書作成、情報整理、画像・音声を含む会話、最新情報収集
不向き: 超長文や複雑なコーディング(4.1が上)

GPT-4o Mini:4oの軽量版。無料・低コスト・高速で、個人利用や小規模ビジネス、モバイル端末などに最適。
向き: 無料利用、リアルタイムチャット、大量タスク処理
不向き: 最高精度や専門性が必要な業務

GPT-4.5:感情知能・自然な対話・応答速度が強化。人間らしい会話や共感が必要な場面に強い。
向き: カスタマーサポート、創造的な文章、対話重視のアプリ
不向き: 精密な業務指示やコーディング

GPT-4.1:超長文・コーディング・業務タスク特化。指示追従力と安定性が高い。
向き: プログラミング、業務自動化、構造化文書、長文分析
不向き: 感情表現や自然な会話

oシリーズ(o1/o3/o4):高度な推論や専門性重視。学術・研究・分析向け。
向き: 研究開発、戦略立案、数学・科学分野
不向き: 汎用的な会話や感情的なやりとり

自分の用の調査ですが、参考になれば。

以上

Read more

評判の動画生成AIの「ConmfyUI」で「Wan2.2」省メモリー版を使ってみた

評判の動画生成AIの「ConmfyUI」で「Wan2.2」省メモリー版を使ってみた

「ConmfyUI」の標準的テンプレートを使用してみましたが、「RTX5070 Ti 16GB」だととりあえず動きますが、動作のサイズや時間でメモリー不足になってしまします。 また、調節も色々難しくて、動画のサイズで生成中に止まったり、なかなか思うように生成できません。 昨日の記事でも載せましたが、初期状態で何もいじらずに、動画を作成した時の内容です。 0:00 /0:05 1× 5秒だけですが凄いですよね。 水滴の動きまでちゃんと表現できています。 時間を延ばそうと色々と設定を変えたり、プロンプトを変えてみましたが、時間を延ばすとメモリーが足りなくなります。 そんな時、 ComfyUIでWan2.2をLoRAを使って軽量化し、RTX3060で動かす こんな記事が流れてきました。 少ないメモリーで動かす試みです。 これを適用すれば、メモリー不足が緩和されて、動画サイズや時間を伸ばしてもうまく動きそうです。 ネタ元は「reddit」の書き込みだそうで、こちらを参照しつつ試しました。 reddit

比較的最近の気になったニュース8月01日

ASUSがNVIDIA GB300搭載デスクトップを発表、20PFLOPSの性能をデスクトップPCサイズに凝縮 | XenoSpectrum 20ペタフロップスと784GBメモリ・・・・ これがどのくらい凄いのかを調べました 過去のスーパーコンピューターランキングトップを年代毎にまとめた物です。 2012-13 Titan(Cray) オークリッジ国立研究所 17.59P 2014年は33ペタフロップスまで進んでしますので、丁度2013年ぐらいの、世界最高性能スパコンと同等ぐらいです。 それが普通のデスクトップパソコンとして動くってのが凄いですよね。 ちなみに普通のデスクトップPCの性能が0.5ペタフロップスぐらいといわれていますので、それだけ強力な計算能力があるって事っすね・・・ その分電源も価格も全てがモンスターなので、なんと言ったらいいか・・・ プロ野球レジェンド物語 1 (エンペラーズコミックス) 新品価格 ¥11から (2025/8/1 10:21時点) プロ作家たちが語る「AI×小説執筆」の現在地 AIが「書く」「読む」を変える【f

「最強の武術家」80年代のアクション映画にインスパイアされたヴァンサバライクアクションゲームの感想など

「最強の武術家」80年代のアクション映画にインスパイアされたヴァンサバライクアクションゲームの感想など

つみげー #299「最強の武術家」80年代のアクション映画にインスパイアされたヴァンサバライクアクションゲームの感想など 最強の武術家 https://store.steampowered.com/app/3027930/_/ 再生リスト 新たな技を覚えて主人公が成長していく感じも、修行して成長する80年代の香港映画っぽさがあって、楽しくプレイできます。 ドット絵のアニメーションも多くて、芸が細かいところも見ていて面白いですし、机の上にあるお皿を投げたり、冷蔵庫の扉を開けて敵を倒したりする動きがジャッキーチェンを彷彿とさせます。 そんな動きの数々が見ているだけでも大変面白く、徐々にアクションが解放されるし、自分でコンボを作成できるので、解放されたアクションを見るためにプレイを繰り返してしまいます。 ヴァンサバと違って、格闘アクションゲームって感じなので、遠距離攻撃がほとんど無くて近距離攻撃で敵を倒す戦いが、一般的なヴァンサバライクなゲームとプレイ感覚が少し違う所も面白いです。 特に、逃げていると、机の下をかっこよくくぐるアクションなんかもあり、そこは敵が

「prompt builder」の作り方

「prompt builder」の作り方

今回は作る過程について、紹介します。 アマゾンのAIコーディングツール「kiro」を使用します。 これにどんな物を作りたいかを入れて、「要件定義書」と「設計書」を作ってもらいます。 Claudeだけでもできますが、「kiro」を使うとこの辺かちょっと簡単になります。 「kiro」に以下を投げて、「要件定義書」と「設計書」を作成してもらいます。 画像生成用のプロンプトを組み合わせでいろいろ作成できるようにするためのアプリを作成したいと考えています。 他にも必要祖いう名機能や、足りていない仕様などアドバイスをしてください 想定の使い方  場所、人物、行動、オブジェクト、文字、プロンプト集の中から組み合わせて、画像生成に使用するプロンプトを構築してプロンプトを作成します。  カテゴリーは、自分で設定できた方が使い勝手がいいと思うので、カテゴリーは自分で設定して増やせるようにして、その中から自由に選択してプロンプトを作成 必要な機能 ・分類別にプロンプトを管理できる ・プロンプトを日本語と英語両方を保持できる ・必要な時にプロンプトを組み合わせてクリップボードに入れられる ・プロンプト