"AUDIO"検索結果
06:18

Kimiは新しい汎用オーディオ基盤モデルKimi-Audioを発表しました

Jin10データ4月26日、今日、Kimiは新しいオープンソースプロジェクト——新しい汎用オーディオ基盤モデルKimi-Audioを発表しました。紹介によると、このモデルは音声認識、音声理解、音声からテキストへの変換、音声対話など多様なタスクをサポートしています。
もっと
AUDIO0.44%
03:22

Alibaba Tongyiのオープンソースオーディオ言語モデルであるQwen2-AudioがACL 2024に選ばれました

金十データ8月13日のニュースによると、アリババは通義大モデルを引き続きオープンソース化し、Qwen2シリーズオープンソースファミリーに音声言語モデルQwen2-Audioを追加しました。Qwen2-Audioはテキスト入力なしで直接音声での質問応答が可能で、ユーザーの音声信号(会話、自然音、音楽など)を理解し分析します。このモデルは複数の権威ある評価で以前の最高モデルを大幅に上回っています。通義チームはさらに新しいオーディオ理解モデルのベンチマークテストを同時に発表し、関連論文は今週開催されている国際会議ACL2024に採択されました。
AUDIO0.44%
  • 3
03:40
Pinwan氏によると、Arxivのページには、Alibabaが最近Qwen-Audioという音声言語モデルをリリースしたことが示されている。 このモデルは、音声言語の事前学習を拡張して、30以上のタスクと、人間の声、自然の音、音楽、歌などのさまざまな音声タイプをカバーすることで、普遍的な音声理解を実現するように設計されています。 調査によると、Qwen-Audioは、タスク固有の微調整を必要とせずに、幅広いベンチマークタスクで大幅なパフォーマンスを達成しています。
AUDIO0.44%
05:16
10月24日、タイム誌は、私たちの生活を変える200のイノベーションを含む「ベストインベンション2023」リストを発表しました。 その中から、AdobeのPhotoshopのGenerative ExpandとGenerative Fill、OpenAIのGPT-4とDall-E 3、Runway Gen-2、Meta SeamlessM4T、Stable Audioなど、AIの分野で合計14のプロジェクトが選ばれました。
13:49
TechCrunch によると、9 月 13 日、Stability AI は人工知能音楽ジェネレーターである Stable Audio の発売を発表しました。 Stable は、これが潜在拡散と呼ばれる技術を通じて商用目的で「高品質」の 44.1 kHz 音楽を作成できる最初のツールであると主張しています。スタビリティ氏は、オーディオ ファイルの長さと開始時間だけでなく、オーディオ メタデータをトレーニングすることにより、以前にリリースされた生成音楽ツールと比較して、Audio Diffusion の基礎となるモデルには約 12 億のパラメータがあり、オーディオのコンテンツとコンテンツを合成できると述べました。間隔。 1 年前、Stability AI はひっそりと Dance Diffusion をリリースしましたが、その後、Stability AI がモデルの作成に資金を提供した研究機関 Harmonai が Dance Diffusion の更新を停止しました。本日発売されたStable AudioはHarmonaiだけが開発したものではありません。 4 月に正式に立ち上げられた Stability のオーディオ チームは、Stable Audio の基礎として Dance Diffusion からインスピレーションを得た新しいモデルを作成し、その後 Harmonai によってトレーニングされました。現在、Stable Audio は Web アプリを通じてのみ利用できます。また、Stability は、Stable Audio の背後にあるモデルをオープンソースとしてリリースする計画も発表していません。
  • 1
19:36
キム・アーゼンドルフ: 催眠術をかけるために設計された NFT アートを作成するメタリカのビデオ ディレクター デジタル表現主義者でありインターネットアート出身のキム・アーゼンドルフは、最新のNFTドロップ「Colors of Noise」を明らかにしました。 Feral File プラットフォーム用に Peggy Schoenegge によってキュレーションされた、50 点のユニークなアートワークのシリーズは、それぞれ 0.25 ETH で入手できます。 Asendorf は、Web Audio API を使用してホワイト ノイズを生成し、アニメーションを作成することで、彼のキャリアで初めてビジュアル アートとオーディオ アートを組み合わせました。
もっと詳しく
人気タグ

最新のトピック

もっと

暗号資産カレンダー

もっと
シンガポールミートアップ
ソラナ APEX シンガポールは、シンガポールで9月30日に予定されており、開発者、起業家、その他のエコシステム参加者が最近のネットワークの進展と成長の見通しを検討します。
2025-09-29
リキッドステーキングANN
"もうすぐ登場: Casperでのリキッドステーキング!あなたの$CSPRをステーキングして、柔軟性を保ちましょう。もうロックアップはありません。あなたの条件で、ただ受動的報酬を得るだけです。"
2025-09-29
エシル部族フェーズ1
Aethirは、成功裏にアルファフェーズを終えた後、トライブフェーズ1の本格的な開始を発表しました。この新しいフェーズは本日から始まり、9月30日まで続きます。この取り組みは、ユーザーがTypeformを通じて応募を提出することを促しています。AethirはAIに特化した分散型クラウドコンピューティングインフラを構築しており、トライブイニシアティブはそのエコシステムの拡張において重要な役割を果たしています。
2025-09-29
FNSAからKAIAへのスワップ終了
FNSAからKAIAへのトークンスワップサービスが正式に終了しました。
2025-09-29
FNSAからKAIAへのスワップ終了
Kaiaは、FNSA → KAIAトークンスワップサービスの最終的な終了と、従来のFinschiaチェーンの運用停止を発表しました。2024年8月に開始され、1年間のスワップ期間が設けられましたが、残りのユーザーに対応するためにウィンドウは1か月延長されました。スワップサービスとFinschiaチェーンの運用は9月30日に終了します。この日以降、スワップ機能は永久に無効となり、Finschiaインフラはシャットダウンされ、未請求のFNSAトークンに対してはサポートも補償も提供されません。
2025-09-29
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)