Qwen Image editを使ってみた

Qwen Image editを使ってみた

「Qwen Image edit」は、既にある画像をプロンプトで加工する機能です。
基本的に元の画像を維持した状態で、プロンプトで指定した部分だけを変える事ができます。

ちなみに元々の「Qwen Image」には、テキストから画像生成するAIです。

過去の記事で紹介しているので参考にしてください。

では、実際に加工してみます。
「Qwen Image」で作成した画像を用意しました。

この画像を、加工していきます。

まずは、背景を変えていきます。

以下プロンプト

背景を大都市のビルの屋上にして、ホワイトボードを消してください。
空に大きく雲で"AIS blog"と書いてください。

完全に場所を変えてみます。
雲に文字を書いてみます。

以下が結果です

今度は、女性の着せ替えをやってみます。

以下がプロンプトです。

背景を大都市のビルの屋上にして、ホワイトボードを消してください。
空に大きく雲で"AIS blog"と書いてください。
女性の洋服をカジュアルなTシャツとホットパンツに替えてください

背景等のベースは同じで、服だけ変更してみます。

以下が結果です

比較的、想像通りですね。

もっと靴も合った感じにしたいとか、あればその辺はプロンプトに含めれば、かなり自由に変更できます。

この辺から、少しずつ要素を入れていきます。

更に服を変えます。

以下がプロンプトです。

背景を大都市のビルの屋上にして、ホワイトボードを消してください。
空に大きく雲で"AIS blog"と書いてください。
女性の洋服をチャイナドレスに替えてください

以下が結果です

何か思ったチャイナドレスと違います

この辺は、もう少し細かい描写で指定しないとうまくいかないかもですね。
ここでは、色を変えて、更に模様を入れてみます。

以下がプロンプトです

背景を大都市のビルの屋上にして、ホワイトボードを消してください。
空に大きく雲で"AIS blog"と書いてください。
女性の洋服を黒いチャイナドレスに替えて、チャイナドレスに金の竜の絵を入れてください

以下が結果です

チャイナドレスはいまいちですが、竜は綺麗に再現されています。

風景を更に変えて、更に服も変えてみます。

以下がプロンプトです

スカイツリーの展望室から大都市のビルが見えて、ホワイトボードを消してください。
空に大きく雲で"AIS blog"と書いてください。
女性の洋服をゴスロリに替えてください

以下が結果です

いい感じでスカイツリー感出てますね。東京タワーも見えるし。

雲で書くイメージでしたが、雲に書いた感じになってます。
もう少し細かく描写が必要っぽいですね。飛行機雲とか・・・
今回は、洋服を着物に替えてみます

以下がプロンプトです

スカイツリーの展望室から大都市のビルが見えて、ホワイトボードを消してください。
空に大きく雲で"AIS blog"と書いてください。
女性の洋服を着物に替えてください

以下が結果です

結構ちゃんと着物になってますね

色指定はしていないので、赤にしてくれていますが、これも指定すれば自由になると思います。
次は少し変えるだけだと、面白くないので宇宙にしてみます。

以下がプロンプトです

背景を宇宙ステージョン内にして、ホワイトボードを消してください。
宇宙ステーションから地球が見える窓の横に女性は立っている。地球に大きく"AIS blog"と書いてください。
女性の洋服を宇宙服に替えてください

以下が結果です

指定通りに地球が見える窓の横にいますね

結構いい感じになったのではないかと思います。

また更に違う場所にしてみたいと思います。

以下がプロンプトです

背景をピラミッドの前にして、ホワイトボードを消してください。
ピラミッドの中腹に大きく"AIS blog"と書いてください。
女性の洋服をミニスカートに替えてください

以下が結果です

なんかよく分からんミニチュアのピラミッドになりました

スタジオのセットみたいな感じです。
これじゃない感があるので、プロンプトを修正します。

以下がプロンプトです

背景をエジプトのクフ王のピラミッドにして、ホワイトボードを消してください。
ピラミッドの中腹に大きく"AIS blog"と書いてください。
女性の洋服をミニスカートに替えてください

ぐらい的な地名と、クフ王という具体名を入れてみました。

以下が結果です

なぜかツタンカーメンのプラミッドの上に出てきましたw

あと「AIS」が書けなくなってます。原因はよく分かりません。何度か試しましたが直りませんでした。

とりあえず、よく分かりませんが「クフ王」というキーワードが悪そうなので、消してみます。

以下がプロンプトです

背景をエジプトのピラミッドにして、ホワイトボードを消してください。
ピラミッドの中腹に大きく" AIS blog"と書いてください。
女性の洋服をセイラー服に替えてください

以下が結果です

ピラミッドは想定通りですが「AIS」はダメですね

セーラー服もそれっぽくなってますが、元に引っ張られて、スカートがゴシック調ですw

今度は最後に、場所もですが、違う事をさせてみたいと思います。

以下がプロンプトです

コンサートホールで舞台にはグランドピアノがあります。
女性はそのピアノを弾いています。
女性の洋服は、美しい赤いドレスを着ています。

以下が結果です

結構ちゃんとピアノを弾いている感じになっています。
コンサートホールもそれっぽいですし、自分の写真とか使えば、色々偽装できちゃいそうですね。

そんな訳で、色々な使い方ができそうです。
特に文字がちゃんと出せれば、ポスターみたいな物を軽く作れそうです。

あとは、写真加工も消したい物や、色変えたいが簡単にできるので、昔は写真加工=フォトショップだったのが、今ではAIでできますね。

ローカルで、使うにはある程度ハイスペックなゲーミングPCが必要ですが、クラウで上のサービスもあるので、それを使ってみるのもいいかもです。

しかし、このAIがApachelicenseで公開されているので、商用利用も自由にできてしまいます。
すごいですねw(最後の締めw)

Read more

比較的最近の気になったニュース11月26日

比較的最近の気になったニュース11月26日

ここ最近色々追いつかなくて、更新が滞っております・・・・ 書きかけの記事も何個かあって・・・ぐぬぬ そんな訳で、最近気になったニュースです。 エレコム、よくやった! ひと目で「仕様」がわかるUSB-Cケーブル登場 USBケーブルって凄く種類が多くて、規格を考えた奴土下座しろって言いたくなりますw データーの転送速度と、電気の流量の組み合わせで性能に差があり、100Wの電気が流せるのに、データの転送速度が「USB2.0」相当とか・・・ 「USB3.1 Gen1」は「USB2.0」の約10倍ぐらいの速度なので、差が激しいですよね。それが全く書かれていないし、分からないケーブルも沢山あるので書いてくれるとありがたいですね。 USB Cable Checker3 ちなみにこんな製品も出ていて、USBケーブルの性能をテストできます。 実は持っている上に、クラファンで購入したので、ブログに書こうと思っているので、その内書きます。 AIは著者が中国人であることが明らかになると途端に「反中」モードになることが判明:特にDeepSeekが顕著な傾向 面白い記事ですね。学習元の影響が大きい

ローカルで効果音が作成できるAI「MMAudio」を使ってみた(「Waves Place」と同じ効果音も作ってみました)

ローカルで効果音が作成できるAI「MMAudio」を使ってみた(「Waves Place」と同じ効果音も作ってみました)

MMAudio は、ビデオやテキストや画像の入力が与えられると、動画は同期されたオーディオ、画像はそれに合った音を生成します。 使用方法は Pinokio https://pinokio.co/ こちらのアプリからインストールして、「MMAudio」を使います。 インストール方法などは別記事を書きたいと思います。 比較対象として 時計のG-shockでおなじみのCASIO(カシオ)の新サービス!AIで効果音が生成できる「Waves Place」を試してみた の記事と比較しやすいように、同じようなプロンプトで作成します。 MMAudio は、ビデオやテキストや画像の入力が与えられると、動画は同期されたオーディオ、画像はそれに合った音を生成します。 使い方が非常に簡単な上に、動画に合わせて生成できるのも使い勝手がいいですね。カシオの「Waves Place」はテキストからだけだったので、こちらの方が少し上な感じがします。 実際にできるのは、 ・テキストから効果音生成 ・画像から効果の音生成 ・動画に合わせて効果音生成 前に「Waves Place」用に作成した動画が、丁

久々にオールインワンのコード生成「DeepSite」を使ってみた

久々にオールインワンのコード生成「DeepSite」を使ってみた

AIがWEBサイトをコーディングしてくれるサービスです。 DeepSite https://huggingface.co/spaces/enzostvs/deepsite 今回はテトリスっぽいゲームを作ってもらいました 今回の完成品 https://iaisd9-blocky-blitz-bonanza.static.hf.space/index.html では本題です。 アカウント(無料)を作ると、完成品をこのように公開できます。 ちなみに無料のユーザー登録すると、制作物を「DeepSite」で公開できる機能もあるので便利です(今回はその機能を使っています)。 複数のページが相互接続された複雑なウェブサイトを構築できます。 シンプルなランディングページから、動的なルーティングとナビゲーションを備えたフル機能のウェブアプリケーションまで、あらゆるものを構築できます。 と言う事で、WEBページであれば、かなりの物を作成できるサービスなので、当然ブラウザで遊べるゲームも作る事ができるので、テトリス的なゲームを作ってもらいました。 このサービスに限らず、既にWEB

時計のG-shockでおなじみのCASIO(カシオ)の新サービス!AIで効果音が生成できる「Waves Place」を試してみた

時計のG-shockでおなじみのCASIO(カシオ)の新サービス!AIで効果音が生成できる「Waves Place」を試してみた

前に気になっていたけど、試していなかったので、今回試してみました。 CASIOのアカウントを作成する必要があります。 ちょっとめんどいですが、無料で試せるのでとりあえず作成して試してみました。 一応プレスリリースです。 AIで効果音が生成できる「Waves Place」とライブ配信専用スケジューラー「Streamer Times」を正式リリース 実際どんな交換が生成できるのか、結構気にはなってます。 効果音系のアプリも実は持っているので、そんなのと比較もしてみたいですが、今回はこのサービスがどんな感じかを試します。 まず、料金プランのリンクです。最新情報はこちらを参照してください。 一応現在時点のプランです。 フリープランでは商用は不可ですね。 「starter」プラン以降で商用利用可能です。 フリーだと月20回までお試しできる感じです。 月千円(「starter」プラン)で800回って事なので、普通は「starter」プランで使い切れない気がします。 使うとすると、基本的に必要な時に有料プランして、終わったらフリーに戻すみたいな使い方になりそうなサービスです。 実際