Googleの「Nano Banana」を使ってみる(「QWEN Image edit」と比較可能なテストしました)

Googleの「Nano Banana」を使ってみる(「QWEN Image edit」と比較可能なテストしました)

前回「QWEN Image edit」で行ったような事を、こちらでもやってみます。


前提条件として「QWEN Image edit」はローカルで動かしているので、制限がほぼ無い事と、試行回数を増やしていい結果が出るまでpromptの調節を繰り返しやすいですが、前回は実験だったので、基本的に最初に出してきた物を使っています

今回はGoogleのサービスで、更に無料プランで使用させてもらっているので、有料にした場合結果が違う事もあるかもしれません。
その辺はご了承ください。(AIサービスは基本的に有料プラン優遇です)

それでは実験していきます。
「QWEN Image edit」で使用したお姉さんを使います。

この画像をアップロードして、プロンプトで変更していきます。

まずは、背景を変えていきます。

以下プロンプト

背景を大都市のビルの屋上にして、ホワイトボードを消してください。
空に大きく雲で"AIS blog"と書いてください。

女性には手を加えずに、背景を変更します。

Geminiの返答

はい、承知いたしました。背景を大都市のビルの屋上にして、ホワイトボードを消し、空に雲で「AIS blog」と書いた画像はこちらです。

以下が結果です

完全に場所を変えて、こちらは意味をもう少しくみ取って、雲で文字を書いてくれました。
こちらの方が正確というか、思っていたイメージに近いです。

今度は、女性の着せ替えをやってみます。

以下がプロンプトです。

女性の洋服をカジュアルなTシャツとホットパンツに替えてください

Geminiの場合変更した画像を更に変更する指示になります。

Geminiの返答

承知いたしました。女性の洋服をカジュアルなTシャツとホットパンツに替えます。

背景等のベースは同じで、服だけ変更してみます。

以下が結果です

「QWEN Image edit」と違って、ブーツ以外は全部着せ替えています。
服装に関しては曖昧な指示だと余計に違いが出る部分かもしれません。

次は服をチャイナドレスにしてみます。

以下がプロンプトです。

女性の洋服をチャイナドレスに替えてください

Geminiの返答

承知いたしました。女性の洋服をチャイナドレスに替えます。

以下が結果です

いい感じのチャイナドレスになっています。
「QWEN Image edit」よりも知っているチャイナドレスって感じでイメージ通りです。

次は服を「QWEN Image edit」の時と同じように色と模様を変えます。

以下がプロンプトです。

女性の洋服を黒いチャイナドレスに替えて、チャイナドレスに金の竜の絵を入れてください

Geminiの返答

承知いたしました。女性の洋服を黒いチャイナドレスに替え、金の竜の絵を入れます。

以下が結果です

「QWEN Image edit」と比較すると、ドラゴン感は減っていますが、服の模様としての完成度は高いですね。
現実にありそうなクオリティーです。

次は場所をスカイツリーに変えてみます。

以下がプロンプトです。

背景をスカイツリーの展望室から大都市のビルが見えて、空に大きく雲で"AIS blog"と書いてください。
女性の洋服をゴスロリに替えてください

Geminiの返答

承知いたしました。背景をスカイツリーの展望室から大都市のビルが見える景色に変更し、空に大きく雲で「AIS blog」と書きます。また、女性の洋服をゴスロリに替えます。

以下が結果です

いまいち、スカイツリーから見える風景が再現されていない感じです。
服はまあまあで、頭はそのままですね。

服を着物に替えてみます

以下がプロンプトです。

女性の洋服を着物に替えてください

Geminiの返答

承知いたしました。女性の洋服を着物に変更します。

以下が結果です

着物はいい感じです。
「QWEN Image edit」は、簡易的というか、お土産の着物みたいですよね。
それに対してGeminiはちゃんとした振り袖になっている感じです。
靴も、ちゃんと履き物になっていて、「QWEN Image edit」はブーツのままですが、この辺はちゃんと指示すればいいかもしれません。
次は宇宙ステーションです。

宇宙ステーションから地球を見ている風景にします。

以下がプロンプトです。

背景を宇宙ステージョン内にして、宇宙ステーションから地球が見える窓の横に女性は立っている。
地球に大きく"AIS blog"と書いてください。
女性の洋服を宇宙服に替えてください

Geminiの返答

承知いたしました。背景を宇宙ステーション内に変更し、女性の洋服を宇宙服に、地球に「AIS blog」と書いた画像はこちらです。

以下が結果です

宇宙ステーションからの眺めっぽ所はいい感じですが、宇宙服はがっつり着込んじゃってますw
顔は再現されているか顔部分を拡大

なんか別人っぽいですね。西洋人ぽく見えます。
残念感が凄いですw

ヘルメットを取って顔を出してもらいます。

以下がプロンプトです。

ヘルメットは外して女性が見えるようにしてください。

Geminiの返答

承知いたしました。ヘルメットを外し、女性が見えるように変更します。

以下が結果です

わ~~~

なんかホラーになってるw
前回の画像に女性の情報が無いからかもしれません。
元の画像からやり直そうと思います。

最初の画像からの変更に戻したいので、指示したいと思います。

次のピラミッドに進めます

最初の画像から変更を加えてください
背景をピラミッドの前にして、ホワイトボードを消してください。
ピラミッドの中腹に大きく"AIS blog"と書いてください。
女性の洋服をミニスカートに替えてください

Geminiの返答

I can create images about lots of things but not that. Can I try a different one for you?

どうやらこのような指定はダメなようです。

新規に画像をアップロードして仕切り直します。

仕切り直すので宇宙服リベンジします

以下がプロンプトです。

背景を宇宙ステージョン内にして、宇宙ステーションから地球が見える窓の横に女性は立っている。
地球に大きく"AIS blog"と書いてください。
女性の洋服を宇宙服に替えてください

Geminiの返答

承知いたしました。背景を宇宙ステーション内に変更し、宇宙ステーションから地球が見える窓の横に女性が立ち、地球に大きく「AIS blog」と書きます。女性の洋服は宇宙服に替えます。

以下が結果です

相変わらず、ヘルメットをかぶっていますが、今度は大丈夫そうです。
一応拡大してみます

大丈夫そうですね。
しかし、ヘルメットを取ってみたいので、初期画像から作成してみます。

ヘルメットを外した宇宙服姿を指示します

以下がプロンプトです。

背景を宇宙ステージョン内にして、宇宙ステーションから地球が見える窓の横に女性は立っている。
地球に大きく"AIS blog"と書いてください。
女性の洋服を宇宙服に替えてください。ヘルメットは外した状態で女性の顔は見えている状態にしてください。

Geminiの返答

承知いたしました。背景を宇宙ステーション内に変更し、宇宙ステーションから地球が見える窓の横に女性が立ち、地球に大きく「AIS blog」と書きます。女性の洋服は宇宙服に替え、ヘルメットは外した状態で女性の顔が見えている状態にします。

意図は理解してもらえているようです。

以下が結果です

意地でもヘルメットは取ってくれないですね。
顔は指示通り見えていますし、髪の毛はヘルメット貫通して出てますw

背景を大きく変えてエジプトにします。

今回も初期の画像を指定してやり直しています。

以下がプロンプトです。

背景をピラミッドの前にして、ホワイトボードを消してください。
ピラミッドの中腹に大きく"AIS blog"と書いてください。
女性の洋服をミニスカートに替えてください

Geminiの返答

承知いたしました。背景をピラミッドの前に変更し、ホワイトボードを消します。ピラミッドの中腹に大きく「AIS blog」と書き、女性の洋服をミニスカートに替えます。

以下が結果です

ミニスカートと指定しましたが、スカートですら無い感じです。
Tシャツ&ホットパンツの時と同じ感じになりました。

また、服装だけ変更していきます。

以下がプロンプトです。

背景をエジプトのピラミッドにして、ホワイトボードを消してください。
ピラミッドの中腹に大きく" AIS blog"と書いてください。
女性の洋服をセイラー服に替えてください

Geminiの返答

承知いたしました。背景をエジプトのピラミッドにし、ホワイトボードを消します。ピラミッドの中腹に大きく「AIS blog」と書き、女性の洋服をセーラー服に替えます。

以下が結果です

ポニーテールに変わっちゃっていますが、靴も変更されていて、概ねいい感じですね。

今度は全般的に変えていきます

以下がプロンプトです。

コンサートホールで舞台にはグランドピアノがあります。
女性はそのピアノを弾いています。
女性の洋服は、美しい赤いドレスを着ています。

Geminiの返答

承知いたしました。コンサートホールで舞台にグランドピアノがあり、女性がそのピアノを弾いています。女性の洋服は美しい赤いドレスです。

以下が結果です

これだけ大幅に変更してもいい感じにしてくれますね。
「QWEN Image edit」と比較しても、かなり強力です。
ちなみにこの性能で、無料でも1日100まで使用できるので、誰にでも便利なツールではないでしょうか?
「QWEN Image edit」は、ローカル生成なので、環境があれば、時間と電気料金が許す限り、生成しまくれる所が優位な所ですかね。

最後に宇宙服リベンジ

宇宙服で色々問題があったので、もう一度挑戦します。
以下がプロンプトです。

背景を宇宙ステージョン内にして、宇宙ステーションから地球が見える窓の横に女性は立っている。
地球に大きく"AIS blog"と書いてください。
女性の洋服を宇宙服に替えてください。ヘルメットは外して女性の顔は見えている状態にしてください。

Geminiの返答

承知いたしました。背景を宇宙ステーション内に変更し、宇宙ステーションから地球が見える窓の横に女性が立ち、地球に大きく「AIS blog」と書きます。女性の洋服は宇宙服に替え、ヘルメットは外した状態で女性の顔が見えている状態にします。

以下が結果です

いい感じになりました。
うまくいかなくても、プロンプトを調節したり、同じプロンプトで何度も出し直す事で、こんな感じで思った通りの物ができたりするので、AIは結局数撃つのが重要かなと思ったりします。

「QWEN Image edit」の記事と比較すると面白いと思います

ではでは

Read more

比較的最近の気になったニュース11月26日

比較的最近の気になったニュース11月26日

ここ最近色々追いつかなくて、更新が滞っております・・・・ 書きかけの記事も何個かあって・・・ぐぬぬ そんな訳で、最近気になったニュースです。 エレコム、よくやった! ひと目で「仕様」がわかるUSB-Cケーブル登場 USBケーブルって凄く種類が多くて、規格を考えた奴土下座しろって言いたくなりますw データーの転送速度と、電気の流量の組み合わせで性能に差があり、100Wの電気が流せるのに、データの転送速度が「USB2.0」相当とか・・・ 「USB3.1 Gen1」は「USB2.0」の約10倍ぐらいの速度なので、差が激しいですよね。それが全く書かれていないし、分からないケーブルも沢山あるので書いてくれるとありがたいですね。 USB Cable Checker3 ちなみにこんな製品も出ていて、USBケーブルの性能をテストできます。 実は持っている上に、クラファンで購入したので、ブログに書こうと思っているので、その内書きます。 AIは著者が中国人であることが明らかになると途端に「反中」モードになることが判明:特にDeepSeekが顕著な傾向 面白い記事ですね。学習元の影響が大きい

ローカルで効果音が作成できるAI「MMAudio」を使ってみた(「Waves Place」と同じ効果音も作ってみました)

ローカルで効果音が作成できるAI「MMAudio」を使ってみた(「Waves Place」と同じ効果音も作ってみました)

MMAudio は、ビデオやテキストや画像の入力が与えられると、動画は同期されたオーディオ、画像はそれに合った音を生成します。 使用方法は Pinokio https://pinokio.co/ こちらのアプリからインストールして、「MMAudio」を使います。 インストール方法などは別記事を書きたいと思います。 比較対象として 時計のG-shockでおなじみのCASIO(カシオ)の新サービス!AIで効果音が生成できる「Waves Place」を試してみた の記事と比較しやすいように、同じようなプロンプトで作成します。 MMAudio は、ビデオやテキストや画像の入力が与えられると、動画は同期されたオーディオ、画像はそれに合った音を生成します。 使い方が非常に簡単な上に、動画に合わせて生成できるのも使い勝手がいいですね。カシオの「Waves Place」はテキストからだけだったので、こちらの方が少し上な感じがします。 実際にできるのは、 ・テキストから効果音生成 ・画像から効果の音生成 ・動画に合わせて効果音生成 前に「Waves Place」用に作成した動画が、丁

久々にオールインワンのコード生成「DeepSite」を使ってみた

久々にオールインワンのコード生成「DeepSite」を使ってみた

AIがWEBサイトをコーディングしてくれるサービスです。 DeepSite https://huggingface.co/spaces/enzostvs/deepsite 今回はテトリスっぽいゲームを作ってもらいました 今回の完成品 https://iaisd9-blocky-blitz-bonanza.static.hf.space/index.html では本題です。 アカウント(無料)を作ると、完成品をこのように公開できます。 ちなみに無料のユーザー登録すると、制作物を「DeepSite」で公開できる機能もあるので便利です(今回はその機能を使っています)。 複数のページが相互接続された複雑なウェブサイトを構築できます。 シンプルなランディングページから、動的なルーティングとナビゲーションを備えたフル機能のウェブアプリケーションまで、あらゆるものを構築できます。 と言う事で、WEBページであれば、かなりの物を作成できるサービスなので、当然ブラウザで遊べるゲームも作る事ができるので、テトリス的なゲームを作ってもらいました。 このサービスに限らず、既にWEB

時計のG-shockでおなじみのCASIO(カシオ)の新サービス!AIで効果音が生成できる「Waves Place」を試してみた

時計のG-shockでおなじみのCASIO(カシオ)の新サービス!AIで効果音が生成できる「Waves Place」を試してみた

前に気になっていたけど、試していなかったので、今回試してみました。 CASIOのアカウントを作成する必要があります。 ちょっとめんどいですが、無料で試せるのでとりあえず作成して試してみました。 一応プレスリリースです。 AIで効果音が生成できる「Waves Place」とライブ配信専用スケジューラー「Streamer Times」を正式リリース 実際どんな交換が生成できるのか、結構気にはなってます。 効果音系のアプリも実は持っているので、そんなのと比較もしてみたいですが、今回はこのサービスがどんな感じかを試します。 まず、料金プランのリンクです。最新情報はこちらを参照してください。 一応現在時点のプランです。 フリープランでは商用は不可ですね。 「starter」プラン以降で商用利用可能です。 フリーだと月20回までお試しできる感じです。 月千円(「starter」プラン)で800回って事なので、普通は「starter」プランで使い切れない気がします。 使うとすると、基本的に必要な時に有料プランして、終わったらフリーに戻すみたいな使い方になりそうなサービスです。 実際