文字に強い多言語AI画像生成「Qwen Image」を使ってみる

文字に強い多言語AI画像生成「Qwen Image」を使ってみる

サポート言語:日本語があるようなので、日本語の能力を試してみます。
多言語テキストレンダリング能力:英語、中国語、韓国語、日本語など複数の言語を含む画像を正確に生成でき、テキストは明確で読みやすく、画像スタイルと調和します
そもそも中国初の生成AIなので、漢字には強うそうです。

初期設定のプロンプトで、看板の文字を日本語を入れて出力すると、こんな感じ

この記事のタイトルも「Qwen Image」で作成しました。

プロンプトも

Illustration in cartoon style.
Beautiful Asian woman in gothic maid's outfit, wearing black high-heeled boots.
Long, flowing black hair with twin-tails. Make-up is thin and natural.
The woman is in the middle of a wheat field and the words "Qwen Image" appear in the wheat field.
The camera is pulled back so that the text is in the middle of the camera. The woman appears small and waves her hand.
The words "AIS blog" are written in small letters at the bottom.

で作成しています。正直思ったようには出ていません。
この辺は私の表現力が無いので、もう少試行錯誤が必要です。

今度は、日本語がどんな感じか検証していきます。

とりあえず平仮名の「つみげー」を書いてみます。

プロンプトは

Beautiful Asian woman in gothic maid's outfit, black high-heeled boots.
She has long, flowing black hair with twin-tails. Her make-up is thin and natural and she is smiling.
There is a large whiteboard next to the woman with the word "つみげー" written in a beautiful design all over the whiteboard.
The word "AIS" is written in small letters at the bottom of the whiteboard.

日本語も問題無く、比較的思った感じになっていると思います。

ホワイトボードに書かれている感じがなんかいい感じです。
平仮名も問題無く、それっぽくなっています。
文字を凝りたければ、色々文字の装飾を指示する感じで行けると思います。

今度はもう少し難しい日本語を書かせてみます。

平仮名と漢字を混ぜた4文字熟語で、「一日一善」と「猫に小判」を書かせてみます。

プロンプトは

Beautiful Asian woman in gothic maid's outfit, black high-heeled boots.
Long, flowing black hair in twin-tails. Make-up is thin and natural.
There is a large whiteboard next to the woman with the words "一日一善 猫に小判" written all over the whiteboard in a beautiful design with a red border around the words.

ホワイトボードに書かせるのが、比較的思い通りになりやすいのと、同じプロンプトを使い回して、文字だけ変えますw
そうすると、こんな感じになります。

なんか、小判の「判」の字がうまくいきません。
何度かやってみましたが、ダメでした。特定の文字が苦手なのか、プロンプトの工夫でなんとかなるのかは、も少し実験してみないと分からないですが、日本語も行けそうな感じです。

そんな訳で、今度は難しい漢字、「薔薇」を書かせてみます。
プロンプトは、ホワイトボードの文字を「薔薇」書き換えただけの同じ物です。

薔薇は漢字なので、難しくてもいい感じです。
しかも、薔薇のデザインまでしてあります。このデザインは指示していなくて(表示文字以外のプロンプトは同じ)、このようになりました。
この辺は凄いですね~

やっぱり、日本語っぽい難しさで今度はやってみます。
文字は以下の2種類
「トンネルを抜けると豚がいた!トンネルだけにね!」
「ブハハハ!!人がゴミのようだ!」
平仮名片仮名漢字を感嘆符を織り交ぜてみました。
その結果がこちらです。複数回実行したので、画像をまとめました。

なんか色々と惜しいですね。
「トンテル」とか「トンチ-ル」になっていたり、豚が勝手に猪になっています。
内部的に文字を処理している部分で「豚=猪」ってなっているのかもしれません。
ちょっと、AIの動きが見えて面白いですね。
もう片方は、「ブハハハ!!」の最後の片仮名の「ハ」が「は」に変換されていたり、「ゴミの」が「ゴミシ」になっていたり、なかなか難しいですね。
意味が認識できてしまうと、変換されてしまうのかもしれませんが、よく分からないが結論でしょうかw

最後に今までは、英語のプロンプトでやっていましたが、日本語を認識できているなら、日本語のプロンプトを入れてみたらどうなるかやってみました。

プロンプトは

ゴシックなメイド服を着た美しいアジア人女性、黒のハイヒールブーツを履いている。
流れるような黒のロングヘアーでツインテール。メイクは薄くナチュラル。
女性の横に大きなホワイトボードがあり、ホワイトボードに"(^_^)v"とホワイトボード一杯に書かれ、文字の周りに赤く縁取りされて綺麗なデザインで書いてある

今回は顔文字をやってみました。

なんか、めっちゃ意味なくて関係無い文字列が出てきました。
たまたまではなく、4回やって4回共です。
謎ですが少し面白いですね。

0:00
/0:05

Read more

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットの正体とWebPの「予測マジック」を理解する 次世代画像フォーマットAVIFを触ってみた 割と最近の画像圧縮フォーマットについてです。 「webp」は比較的見るようになったフォーマットですが、従来は画像のサイズが小さいのはJPGで、透明色が使えて画質を維持するのがPNGって感じで、使い分けられていると思います。 しかし、JPGは古いフォーマットで圧縮アルゴリズムも古い上に、透明色が使えないなど改良の余地が多々あるので、「JPEG 2000」というフォーマットも作成されました。 「JPEG 2000」は技術的には従来のJPEGを大幅に上回る優秀なフォーマットにもかかわらず、処理負荷の高さや互換性の問題から一般消費者向けには普及しませんでした。 今となっては、それ程負荷は高くないのですが、開発された当時(2000年代前半)のPCのスペックを考えると厳しかったと思われます。 2001年のPCスペックを調べてみました。 Intel Pentium III 256MBから512MBのRAM 20GBから80GB Windows 98やWindows 2000が主流 この

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5を使ってみましたが、なんか音の厚みが増して日本語の再現度も上がって、歌唱クオリティが一ランク上がったように感じるほどです。 とりあえずバージョンの歴史から V2 (2023年秋):  最大生成時間は1分20秒でした V3 (2024年春):  生成時間が2分に更新されました V3.5 (2024年夏): 曲の構造が改善され、初回生成の最大時間が4分に、延長                       (Extend)は1回につき最大2分まで可能になりました V4 (2024年11月): ボーカル品質が向上し、初回生成の最大時間は4分です。また、「Extend(延長)」「Cover(カバー)」「Persona(ペルソナ)」機能が追加されました V4.5 (2025年5月): 初回生成の最大時間が8分に延長され、プロンプトへの忠実度やスタイルのマッシュアップ機能が向上しました V4.5+ (2025年7月): 「Add Vocals(ボーカル追加)」や「Add Instrumental(インスト追加)」などの制作ツールが更新されました V5 (2025年9月):  オーディ

「NANObanana」があれば、LINEスタンプいらなくね?

「NANObanana」があれば、LINEスタンプいらなくね?

LINEスタンプはすぐに返せて便利なんですが、返したいスタンプを探すのが結構手間になってきています。 スタンプをそれ程沢山持っている訳じゃないんですが、30弱程度あります。 それだけでも、確かこんなのあったなとか、軽い感じのお礼スタンプどれがいいかなとか、選ぶのに時間がかかると、手軽に返せるスタンプの意味がありません。 そこで「NANObanana」です。画像に日本語も入れてもらえるので、スタンプが必要な時に、その場にあったスタンプを作ってしまえばいい!! と言う事で、やってみました。 スタンプのプロンプトは、うまい人がいると思うので、そこを突き詰めたい人はその手の記事を参考にしてください。 今回は、お手軽にその場でスタンプを作って、友人とかに利用するってお話です。 とは言え、イメージ通りの結果は欲しいので、何を注意すればそれっぽく作れるのかは少し実験してみたいと思います。 まずはAIに素直に聞いてみる。AIの事はAIに聞くのが一番です。 次の事に注意しろと教えてもらえます。 キャラクター設定: どのキャラクターを使いたいかを明確に指定します。 セリフや感情表現: どのようなセ

「Claude Code」 関連記事まとめ

「Claude Code」 関連記事まとめ

日々「Claude Code」を使用していますが、新しいツールや「Claude Code」自信もバージョンアップしているため、私自身もアップデートしていかないと、いつの間にか置いて行かれて非効率な使い方をしていたなんて事になりかねません。 と言う訳で、個人的に参考になったり、読んでいて面白かった記事をピックアップしました。 良ければ参考にしてください。 簡単コピペでClaude Codeに144種類のエージェントチームを作成 ── agency-agentsという40Kスター超のAIエージェント集を使いこなす 「Claude Code」は、エージェント次第で生成するコードの質が変わってきます。 まだ使ってはいませんが、使って見ようと思ってます。 効果的なCLAUDE.mdの書き方 「Claude Code」は「CLAUDE.md」の書き方次第でも違いが出るので、この辺も見ておくといいかも内容です。「Claude Code」を使う上での基本ですね。 【2026年版】Claude Codeを最強にするプラグイン・MCP・ツール総まとめ これも結構参考になると思います。 はやり廃りがあ