>_ DevTrendsja

言語

ホーム

言語

セクション

フロントエンド バックエンド モバイル DevOps AI / ML ゲーム開発 セキュリティ
JavaScript

パーソナルホームレコーディングスタジオ:ACE-Step UIレビュー

4,234 スター

SunoやUdioのサブスクリプションにいくら払っているか考えたことはありますか?これらのサービスは確かに素晴らしいですが、権利がライセンス条件によって制限される可能性のある音楽生成に月額10〜20ドルを支払うのは、怪しい pleasure(喜び)です。それに、プロンプトやオーディオが誰かのサーバーに保存されていると思うと気がかりです。

最近、ace-step-uiプロジェクトを見つけました。これはゲームチェンジャーです。ACE-Step 1.5モデルのためのオープンソースインターフェースです。要するに、ローカルで自分のGPU上で動作する完全なSun代替機能が手に入ります。無料、無制限、そして完全にプライベートです。

そもそも何なのか

このプロジェクトは、ボーカル、楽器、個別トラックを含む完全な曲を生成できるニューラルネットワークのための現代的なシェルです。スタックはフロントエンドにReact 18、TypeScript、TailwindCSSを使用し、バックエンドはNode.jsとSQLiteデータベースで動作します。

ここでの主な特徴はアクセシビリティです。通常、同様のニューラルネットワークを実行しようとすると、「100505個のPython依存関係をインストールしてシステムを壊さない」という難題になります。ace-step-uiの作者は異なるアプローチを取り、Pinokio経由のワンクリックインストールを含む複数のインストールオプションを用意しました。

実際のところ何が良いのか

2010年代のオーディオ生成用Webインターフェースを使ったことがあるなら、ACE-Step UIは驚くほど満足できるでしょう。インターフェースは明らかにSpotifyからインスピレーションを得ています:ダークテーマ、ページ下部のクリーンなプレイヤー、便利なトラックライブラリ。

プロセス制御

クラウドサービスではボタンを押し続けても結果はお祈り级别ですが、ここでは設定を調整できます:

  • BPMとキーの選択。
  • [Verse][Chorus]のようなタグによる曲構造の設定。
  • 「シンキングモード」——ニューラルネットワークがまず構造を計画し、その後オーディオコードを生成します。低速ですが、結果は比べ物になりません。
  • リファレンスの活用。自分自身のオーディオファイルをアップロードでき、モデルがそのスタイルや構造をコピーしようとします。

組み込み処理ツール

これは単なる「テキストから音楽へ」のジェネレーターではありません。インターフェースには通常別途見つける必要がある便利なユーティリティがいくつか含まれています:

  • クイックトリミングとエフェクトのためのAudioMassオーディオエディタ。
  • Stem分離(Demucs)。ビートは好きだがボーカルはいらない(またはその逆)場合、ニューラルネットワークがトラックをコンポーネントに分解します:ドラム、ベース、ボーカル、そしてその他すべて。
  • 動画ジェネレーター。Pexelsから背景を添付してソーシャルメディア用の готовыйクリップをすぐに取得できます。

技術的なニュアンスとハードウェア

まず真っ先にお答えしましょう:VRAMはいくら必要ですか?基本的な作業には、4GBのVRAM搭載カードで十分です(例:RTX 3050、または古い1050 Tiでも忍耐すれば可)。しかし、LLMを使用したスマートモード(シンキングモード)を有効にしたい場合、要件は高くなります。開発者はすべての機能での快適な作業に12GBのVRAMを推奨していますが、プロジェクトはCPU上で言語モデルを実行できるため、一般的なPC所有者も助かります。

興味深いことに、生成データベース全体がSQLiteでローカルに保存されます。クラウドも同期もありません。ディスクが故障したら音楽も一緒に消えるので、バックアップは依然として必須です。

実行方法

最も面倒がなく信頼できる方法はPinokioです。ターミナルを好む場合、プロセスは次のようになります:

  1. ACE-Step 1.5エンジンをクローンし、依存関係をインストールする必要があります。Windowsには、設定済みPythonを含む約5GBのポータブルバージョンがあります。
  2. ace-step-ui自体をクローンします。
  3. 2つのサーバーを起動します:1つはニューラルネットワークAPI、もう1つはインターフェースとバックエンドを処理します。

Windowsユーザーの場合、起動を自動化するリポジトリ内の готовыйファイルがあります。

その後、パーソナルスタジオがhttp://localhost:3000で開きます。

試す価値はあるか

このプロジェクトはコンテンツクリエイターに最適です:配信者、YouTuber、ロイヤリティ支払いのないユニークなサウンドトラックが必要なインディーゲーム開発者など。

生成品質が歌詞の点で有料トップサービスに及ばない場合もあるのは確かですが、無制限のバリエーションを生成し、すぐにstemに分解できる機能は、この欠点を補って余りあります。それに、LAN上でローカルに作業できるため、1つの部屋に強力なPCにサーバーを置き、別の部屋のタブレットやラップトップからブレインストーミングできます。

NVIDIAカードと空闲時間があれば、ACE-Step UIは、気軽に使える最新のAIプロダクションを試す絶好のチャンスです。

関連プロジェクト