Stable Audio 2.

0 устанавливает новый стандарт в области звука, генерируемого искусственным интеллектом, создавая высококачественные полноценные треки с последовательной музыкальной структурой продолжительностью до трех минут при частоте стерео 44,1 кГц.
Новая модель представляет собой генерацию аудио в аудио, позволяя пользователям загружать и преобразовывать образцы с помощью подсказок на естественном языке.
Stable Audio 2.0 обучался исключительно на лицензионном наборе данных из музыкальной библиотеки AudioSparx , что учитывало запросы об отказе и обеспечивало справедливую компенсацию создателям.Эта модель позволяет воспроизводить высококачественные полноценные треки со связной музыкальной структурой продолжительностью до трех минут при частоте стерео 44,1 кГц с помощью одной подсказки на естественном языке.
Новая модель выходит за рамки преобразования текста в аудио и включает в себя возможности преобразования аудио в аудио. Теперь пользователи могут загружать образцы аудио и с помощью подсказок на естественном языке преобразовывать эти образцы в широкий спектр звуков. Это обновление также расширяет возможности генерации звуковых эффектов и передачи стилей, предоставляя художникам и музыкантам больше гибкости, контроля и более совершенный творческий процесс.
Stable Audio 2.0 основан на Stable Audio 1.0 , который дебютировал в сентябре 2023 года как первый коммерчески жизнеспособный инструмент для создания музыки с использованием искусственного интеллекта, способный создавать высококачественную музыку с частотой 44,1 кГц, используя технологию скрытой диффузии. С тех пор он был назван одним из лучших изобретений 2023 года по версии TIME .
Эта новая модель доступна для бесплатного использования уже сегодня на веб-сайте Stable Audio и вскоре будет доступна в Stable Audio API.
Новые возможности
Наша самая совершенная аудиомодель расширяет творческий набор инструментов для художников и музыкантов за счет новых функций. Благодаря подсказкам «текст-аудио» и «аудио-аудио» пользователи могут создавать мелодии, минусовки, стебли и звуковые эффекты, тем самым улучшая творческий процесс.
Полноформатные треки
Stable Audio 2.0 отличается от других современных моделей, поскольку может генерировать песни продолжительностью до трех минут, дополненные структурированными композициями, включающими вступление, развитие и завершение, а также стереозвуковые эффекты.Stable Audio 2.0 теперь поддерживает загрузку аудиофайлов для преобразования идей в полноценные сэмплы. Наши Условия обслуживания требуют, чтобы загружаемые файлы не содержали материалов, защищенных авторским правом, и мы используем расширенное распознавание контента для обеспечения соблюдения требований и предотвращения нарушений.оздание вариаций и звуковых эффектов
Эта модель усиливает воспроизведение звука и аудиоэффектов: от постукиваний по клавиатуре до рева толпы или шума городских улиц. Она предлагает новые способы повышения качества аудиопроектов.
Передача стиля
Эта новая функция плавно изменяет вновь созданный или загруженный звук в процессе генерации. Эта возможность позволяет настроить тему вывода в соответствии с конкретным стилем и тоном проекта.
Исследовать
Архитектура модели скрытой диффузии Stable Audio 2.0 специально разработана для создания полных треков с последовательной структурой. Для достижения этой цели мы адаптировали все компоненты системы для повышения производительности в долгосрочной перспективе. Новый автоэнкодер с высокой степенью сжатия сжимает необработанные аудиосигналы в гораздо более короткие представления. Для модели диффузии мы используем диффузионный преобразователь (DiT), аналогичный тому, который использовался в Stable Diffusion 3 , вместо предыдущей U-Net, поскольку он более приспособлен к манипулированию данными в длинных последовательностях. Сочетание этих двух элементов приводит к созданию модели, способной распознавать и воспроизводить крупномасштабные структуры, необходимые для создания высококачественных музыкальных композиций.
Следите за выпуском исследовательской работы с дополнительными техническими подробностями.оздание вариаций и звуковых эффектов
Эта модель усиливает воспроизведение звука и аудиоэффектов: от постукиваний по клавиатуре до рева толпы или шума городских улиц. Она предлагает новые способы повышения качества аудиопроектов.
Передача стиля
Эта новая функция плавно изменяет вновь созданный или загруженный звук в процессе генерации. Эта возможность позволяет настроить тему вывода в соответствии с конкретным стилем и тоном проекта.
Исследовать
Архитектура модели скрытой диффузии Stable Audio 2.0 специально разработана для создания полных треков с последовательной структурой. Для достижения этой цели мы адаптировали все компоненты системы для повышения производительности в долгосрочной перспективе. Новый автоэнкодер с высокой степенью сжатия сжимает необработанные аудиосигналы в гораздо более короткие представления. Для модели диффузии мы используем диффузионный преобразователь (DiT), аналогичный тому, который использовался в Stable Diffusion 3 , вместо предыдущей U-Net, поскольку он более приспособлен к манипулированию данными в длинных последовательностях. Сочетание этих двух элементов приводит к созданию модели, способной распознавать и воспроизводить крупномасштабные структуры, необходимые для создания высококачественных музыкальных композиций. https://stableaudio.com/generate

  • Страники - drum-solo-epic-emo-nostalgic-drum-solo
  • Страники - drum-solopost-rock-guitars-drum-kit-bass-strings-euphoric-up-lifting-moody-flowing-raw-drum-soloepic-sentimental-125-bpm-epic-emo
  • Страники - epic--emo--drum-solo--guitars-drum-kit-bass-euphoric-up-lifting--drum-solo-epic--emo-_
  • Страники - epic-emo-guitars-drum-solo--guitars-drum-solo-epic-emo-_
  • Страники - epic--emo-progressive-synthesizer--dramatic-chords-dynamic-flowing-epic--emo
  • Страники - post-rock-guitars-drum-kit-bass-strings-euphoric-up-lifting-moody-flowing-raw-epic--emo_
  • Страники - trance-ibiza-beach-sun-4-am-progressive-synthesizer-909-dramatic-chords-choir-euphoric-nostalgic-dynamic-flowing_0

Комментарии

Комментариев нет.