Meta представляет новые инструменты искусственного интеллекта для преобразования текста в музыку в конкуренции с Google.

Meta предлагает новые инструменты искусственного интеллекта для преобразования текста в музыку, конкурируя с Google.

Искусственный интеллект медленно проник в музыкальную индустрию, создавая вирусные песни, воскрешая голоса наших любимых певцов из мертвых и даже получая номинацию на “Грэмми” (в некотором роде). Meta выпустила новые инструменты искусственного интеллекта, которые сделают использование ИИ для создания музыки еще проще.

Также: Лучшие боты для чата с ИИ 

Во вторник Meta представила AudioCraft – набор генеративных моделей искусственного интеллекта, которые могут создавать «высококачественную и реалистичную» музыку из текста, по словам Meta.  

🎵 Сегодня мы делимся подробностями о AudioCraft – семействе генеративных моделей искусственного интеллекта, которые позволяют легко создавать высококачественный звук и музыку из текста.https://t.co/04XAq4rlap pic.twitter.com/JreMIBGbTF

— Meta Newsroom (@MetaNewsroom) August 2, 2023

Audiocraft состоит из трех генеративных моделей искусственного интеллекта Meta: MusicGen, AudioGen и EnCodec. MusicGen и AudioGen генерируют звук из текста, одна создает музыку, а другая – конкретные аудио и звуковые эффекты. 

Вы можете посетить MusicGen на HuggingFace и поиграть с демонстрацией. Для запроса вы можете описать любой тип музыки, который вы хотели бы услышать из любой эпохи. Например, Meta приводит пример: “Песня 80-х годов с сильными ударами и синтезаторами на заднем плане”. 

EnCodec – это аудио кодек, состоящий из нейронных сетей, которые сжимают аудио и восстанавливают входной сигнал. В рамках анонса Meta выпустила самую улучшенную версию Encodec, которая позволяет получать музыкальные композиции более высокого качества с меньшим количеством артефактов, по словам пресс-релиза. 

Также: Как достичь гиперперсонализации с помощью платформ генеративного искусственного интеллекта

Meta также выпустила предварительно обученные модели AudioGen, которые предоставляют пользователям возможность генерировать окружающие звуки и звуковые эффекты, такие как лай собаки или скрип пола. 

Наконец, Meta поделилась весами и кодом для всех трех моделей с открытым исходным кодом, чтобы исследователи и практики могли использовать их для обучения других моделей. 

Meta говорит в пресс-релизе, что AudioCraft может стать новым типом стандартного инструмента, подобного синтезаторам, когда они впервые появились. 

Также: 4 способа отличить гиперперсонализацию от реальности в генеративном искусственном интеллекте

“С более широкими возможностями мы считаем, что MusicGen может превратиться в новый тип инструмента – так же, как синтезаторы, когда они впервые появились”, – сказал Meta. 

Это не первая генеративная модель искусственного интеллекта такого рода. Google выпустил MusicLM в январе, свою собственную модель, которая может преобразовывать текст в музыку. Недавнее исследовательское исследование показало, что Google также использует ИИ для восстановления музыки из деятельности человеческого мозга.