オープンソースの2画面ファイラーで、欲しい機能をAIで追加してみた

Share
オープンソースの2画面ファイラーで、欲しい機能をAIで追加してみた

「shellfiler」というオープンソースの2画面ファイラーを愛用していました。
シェアウェアの頃から、お金を払わせてもらって使わせてもらっていたのですが、ある時からオープンソースになりました。
個人的に欲しい機能で、ネットワーク上のNASや他のPCの共有フォルダに手軽にアクセスする機能です。
具体的には「\PC名\共有フォルダ名」みたいなアクセスなんですが、これに対応していません。
ネットワークドライブ(ネットワーク上のアクセス先をドライブとしてWindowsに)を使えばアクセスは出来るので、全く使えない訳ではないのですが、共有フォイルだが多いとそれ全部にネットワークドライブを割り当てる訳にもいかず、最近は使わなくなっていました。

他のツールも試しましたが、「shellfiler」の使い勝手が結構良くて、個人的には変えたくいない!
そこで、せっかくオープンソースなんだから、AIで必要な部分を修正できれば、良さそう!

「shellfiler」のGITのURLです。

使用するAIは今回Geminiさんで、新しくなった「AntiGravity」でやってみます。

作業ファルダを指定して、次のプロンプトで作業してもらいました。

2画面ファイラーのC#コードです。
ネットワーク先のファイルを「\\AA\BB」のようなアドレス指定でアクセスできない、「webp」に対応していないなどの問題を解決したいです。
まずは、コンパイルできる環境を整えるなどベース部分を構築後に、上記2点の修正を行いたいです。

共有フォルダアクセス以外に、内蔵画像ビューアーを「webp」対応にする対応も加えました。
最近「webp」をよく使うので、これも対応していないと不便だったりします。
そんな訳で、実際に解析から初めてもらった解答になります。

コンパイル環境のベース構築を完了し、ご指摘いただいた2点の問題に対する調査を行いました。

ベース環境構築として、以下の対応を行いました。

ダウンロードしたファイルに付着していた MOTW (Mark of the Web) によるコンパイルエラーを解消しました。
外部依存となっている Tamir.SharpSSH.dll を NuGet から抽出し、プロジェクトの適切な場所に配置することでビルドが通る状態にしました。
「UNCパスへのアドレス指定アクセスエラー」および「WebP非対応」の2点について、具体的な修正方針を実装計画としてまとめました。

詳細は 
implementation_plan.md
 を作成いたしましたので、ご確認いただき、問題なければ「Proceed(実行する)」ボタンを押していただくか、承認の旨をご返信ください。

「implementation_plan.md」の内容は結構長いので、ポイントを抜粋します。

最初に環境構築ですが、C#のコンパイル環境などは既にインストール済みで、以下のようにビルドが通るようにしてくれました。

1. ベース環境構築(確認済み)
MOTW(Mark of the Web)の解除: ダウンロードされたファイル群に付与されているMOTWを一括で解除しました。
Tamir.SharpSSH.dll の配置: 外部依存である Tamir.SharpSSH.dll を Project\bin\Debug\ および Project\bin\Release\ に配置し、ビルドエラーを解消しました。

次が本命の共有フォルダアクセスですが、正規表現の問題だけでした。
これは、作者が意図的にやっている可能性もあるので、自分用に改良するのが良さそうです。
Geminiの解答が以下になります。

2. UNCパスアクセス(\AA\BB)への対応
ホスト名にアンダースコア _ や日本語などのマルチバイト文字が含まれている場合、現在の正規表現パターン([a-zA-Z0-9\-\.]+)では絶対パスと認識されず、相対パスとして処理されてしまうためエラーとなります。正規表現をバックスラッシュ以外の文字を許容するよう緩和します。

次は、内蔵ビューアーの「webp」対応です。
Geminiの対応内容は以下です。

3. WebP画像形式への対応
WebP画像のデコードをサポートするため、軽量な Imazen.WebP ライブラリ(および native libwebp.dll)を導入します。

ライブラリを自動で入れてくれて、対応コードも書いてくれました。
この辺は大変便利です。

コードの変更だけで無く、ビルドが通るかも自動でチェックしてくれるので、何も修正することも無く完成しました。
できあがった実行ファイルが普通に意図通りに動いたので、実行ファイルを差し替えて使っています。

AIで手軽に変更を加えることが出来るので、オープンソースのツールを自分好みに改良して使うってのも、これからの一つの形かもしれません。

Read more

自動的にカラオケっぽい歌詞を付けるアプリを作ってみた結果

自動的にカラオケっぽい歌詞を付けるアプリを作ってみた結果

sunoで作成した曲に歌詞を付けるのが手間だなぁ~と常々思っていたのですが、これを効率化したいと言う事で、今回は歌を解析して歌詞を指定すればタイミングを合わせて配置してくれるアプリを作ってみました。 せっかく作ったので少し解説と、どんな物が作れるのか、デモの動画と少し解説をしますが、アプリそのものはライセンスの問題で非公開です。 実際にこのツールで作成した動画を3本ほど紹介 スペルトナエル サイコロ勇者と魔王の城 アトミックピクニック 見てもらうと分かりますが、これが思ったより簡単に作れるようになったので、現在のように短期間で作れるようになりました。 歌詞入りで曲を公開する場合に、歌詞を入れる作業に時間がかかる割に、イマイチなできになる事も多いので、クオリティーが安定したのも良かったです。 では、次の動画で実際にツールを使って曲に歌詞を入れていきます。 使用しているAIのライセンス問題で、手軽に公開できないのと、需要がそれ程無さそうなので、こんなアプリで動画作成してますよって紹介になります。 音源さえ用意すれば、カラオケも作れちゃいます。 カラオケの例です。

ある人から、MarkdownのテキストをPDFにしてくれる何かが欲しいと言われたので、Claude Codeで作る事にした

ある人から、MarkdownのテキストをPDFにしてくれる何かが欲しいと言われたので、Claude Codeで作る事にした

実際、AIはMarkdownで解答を返してくる事が多く、普通に使っているだけでも、Markdown形式のテキストが手軽に表示したり、PDFに変換できると便利だと思うので、ブラウザで手軽に使える物を作りました。 作成後WEB上にアップしたのが以下のURLになります。 https://test.aisgm.me/test_prog/app/md2pdf/ VS Codeのプラグイン入れれば、同じ事は出来ますし、他にも同じようなアプリを作っている人がいるので、それを使うのも手なんですが、最近は怪しいサイトも多いですし、広告が大量に出るものも多いです。 更に、プラグインがウィルスに汚染されているケースなんかもニュースになっているので、セキュリティー的に使った事が無いものを人に勧めるのも怖いです。 そんな訳で、手軽に使えてインストール等の面倒な準備が必要無いってなると、WEBアプリでアクセスすれば使えて、ローカルで処理させるのが良さそうです。 配布やインストールの手間も必要無く、使いたい時にネットに繋がって、ブラウザさえあれば動くので一番使い勝手がいいですよね。 ってな訳で、Claude

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットに関する記事を見て色々と深掘りしてみた

画像フォーマットの正体とWebPの「予測マジック」を理解する 次世代画像フォーマットAVIFを触ってみた 割と最近の画像圧縮フォーマットについてです。 「webp」は比較的見るようになったフォーマットですが、従来は画像のサイズが小さいのはJPGで、透明色が使えて画質を維持するのがPNGって感じで、使い分けられていると思います。 しかし、JPGは古いフォーマットで圧縮アルゴリズムも古い上に、透明色が使えないなど改良の余地が多々あるので、「JPEG 2000」というフォーマットも作成されました。 「JPEG 2000」は技術的には従来のJPEGを大幅に上回る優秀なフォーマットにもかかわらず、処理負荷の高さや互換性の問題から一般消費者向けには普及しませんでした。 今となっては、それ程負荷は高くないのですが、開発された当時(2000年代前半)のPCのスペックを考えると厳しかったと思われます。 2001年のPCスペックを調べてみました。 Intel Pentium III 256MBから512MBのRAM 20GBから80GB Windows 98やWindows 2000が主流 この

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5の実力を過去バージョンと比較(比較曲多めでお送りします)

suno5.5を使ってみましたが、なんか音の厚みが増して日本語の再現度も上がって、歌唱クオリティが一ランク上がったように感じるほどです。 とりあえずバージョンの歴史から V2 (2023年秋):  最大生成時間は1分20秒でした V3 (2024年春):  生成時間が2分に更新されました V3.5 (2024年夏): 曲の構造が改善され、初回生成の最大時間が4分に、延長                       (Extend)は1回につき最大2分まで可能になりました V4 (2024年11月): ボーカル品質が向上し、初回生成の最大時間は4分です。また、「Extend(延長)」「Cover(カバー)」「Persona(ペルソナ)」機能が追加されました V4.5 (2025年5月): 初回生成の最大時間が8分に延長され、プロンプトへの忠実度やスタイルのマッシュアップ機能が向上しました V4.5+ (2025年7月): 「Add Vocals(ボーカル追加)」や「Add Instrumental(インスト追加)」などの制作ツールが更新されました V5 (2025年9月):  オーディ