Meta представляет новые инструменты искусственного интеллекта для преобразования текста в музыку в конкуренции с Google.
Meta предлагает новые инструменты искусственного интеллекта для преобразования текста в музыку, конкурируя с Google.
Искусственный интеллект медленно проник в музыкальную индустрию, создавая вирусные песни, воскрешая голоса наших любимых певцов из мертвых и даже получая номинацию на “Грэмми” (в некотором роде). Meta выпустила новые инструменты искусственного интеллекта, которые сделают использование ИИ для создания музыки еще проще.
Также: Лучшие боты для чата с ИИ
Во вторник Meta представила AudioCraft – набор генеративных моделей искусственного интеллекта, которые могут создавать «высококачественную и реалистичную» музыку из текста, по словам Meta.
Audiocraft состоит из трех генеративных моделей искусственного интеллекта Meta: MusicGen, AudioGen и EnCodec. MusicGen и AudioGen генерируют звук из текста, одна создает музыку, а другая – конкретные аудио и звуковые эффекты.
Вы можете посетить MusicGen на HuggingFace и поиграть с демонстрацией. Для запроса вы можете описать любой тип музыки, который вы хотели бы услышать из любой эпохи. Например, Meta приводит пример: “Песня 80-х годов с сильными ударами и синтезаторами на заднем плане”.
EnCodec – это аудио кодек, состоящий из нейронных сетей, которые сжимают аудио и восстанавливают входной сигнал. В рамках анонса Meta выпустила самую улучшенную версию Encodec, которая позволяет получать музыкальные композиции более высокого качества с меньшим количеством артефактов, по словам пресс-релиза.
Также: Как достичь гиперперсонализации с помощью платформ генеративного искусственного интеллекта
Meta также выпустила предварительно обученные модели AudioGen, которые предоставляют пользователям возможность генерировать окружающие звуки и звуковые эффекты, такие как лай собаки или скрип пола.
Наконец, Meta поделилась весами и кодом для всех трех моделей с открытым исходным кодом, чтобы исследователи и практики могли использовать их для обучения других моделей.
Meta говорит в пресс-релизе, что AudioCraft может стать новым типом стандартного инструмента, подобного синтезаторам, когда они впервые появились.
Также: 4 способа отличить гиперперсонализацию от реальности в генеративном искусственном интеллекте
“С более широкими возможностями мы считаем, что MusicGen может превратиться в новый тип инструмента – так же, как синтезаторы, когда они впервые появились”, – сказал Meta.
Это не первая генеративная модель искусственного интеллекта такого рода. Google выпустил MusicLM в январе, свою собственную модель, которая может преобразовывать текст в музыку. Недавнее исследовательское исследование показало, что Google также использует ИИ для восстановления музыки из деятельности человеческого мозга.