Google'ning yangi sun'iy intellekt loyihasi matnni musiqaga aylantirib beradi

Google'ning yangi sun'iy intellekt loyihasi matnni musiqaga aylantirib beradi

Google tadqiqotchilari matnni, hattoki g'o'ng'irlash yoki hushtakni musiqaga vayo tabiat ovoziga aylantirib beruvchi sun'iy idrok dasturini ishlab chiqishdi. Platforma MusicLM deb nomlandi. MusicLM Hozircha yopiq loyiha bo'lsa-da, kompaniya ushbu model yordamida paydo bo'lgan bir qancha namunalarni yuklagan.

Misollar hayratlanarli. Janr, tebranish va hattoki oʻziga xos asboblarni ovozini qo'shib beruvchi, paragrafgacha boʻlgan tavsiflardan yaratilgan haqiqiy qoʻshiqlarga oʻxshash 30 soniyali parchalar, shuningdek, “melodik texno” kabi bir yoki ikki soʻzdan yaratilgan besh daqiqalik musiqiy parchalar mavjud.

Mazkur havola orqali MusicLMda generatsiyalangan "sun'iy musiqa"ni tinglashingiz mumkin.

Sun'iy idrok musiqani generatsiya qilganiga ishonish juda qiyin. Loyihadan bexabar odam agar SI musiqasini tinglasa, "bu odatiy bastakor tomonidan qilingan" deb o'ylaydi.

Shuningdek, demo-saytda modeldan violonchel yoki marakas kabi cholg'u asboblaridan 10 soniyalik parchalar, ma'lum janrdagi sakkiz soniyalik parchalar, "qamoqxonadan qochish" iborasi uchun mos keladigan musiqalar yaratish so'ralganda ham SI misollar keltirdi. Hatto boshlang'ich pianinochi, kuchli pianinochi chaladigan musiqalarga misollab qila oldi.

MusicLM hatto inson vokalini taqlid qilishi mumkin. U ovozlarning ohangini va umumiy ovozini to'g'ri ijro qilganga o'xshasa-da, kamchiliklari bor. Ovoz uzilib qolishi va so'zlar kayfiyatini to'g'ri yetkazishda oqsaydi. Shunday bo'lsa-da, MusicLM sun'iy idrok sanoatida katta qadam. Boshlanishi uchun juda kuchli yurish.

Aytgancha, tepadagi havoladagi musiqa sport zalida o'ynaydigan musiqa yaratishni MusicLMdan so'rash natijasidir. Siz qo'shiq matni bema'ni ekanligini ham payqagan bo'lishingiz mumkin, lekin agar e'tibor bermasangiz xuddi kimdir ajnabiy tilda qo'shiq kuylayotganini tinglayotgandek bo'lasiz. Ingliz tilini bilgan holda parchani tinglab, "listening" mahoratingizdan shubha qilgan bo'lsangiz, havotirlanmang, musiqiy parcha ingliz tilida emas.

Google ushbu natijaga qanday erishganini quyidagi grafika bilan izohlagan:

SoundStream, w2v-BERT va MuLanni o'z ichiga olgan MusicLM jarayonining bir qismi ko'rsatilgan tasvir // Tadqiqotchilar Googlening yana bir loyihasi AudioLM bilan birgalikda foydalanadigan “ierarxik ketma-ketlikni modellashtirish vazifasini” tushuntiruvchi rasm. Diagramma muallifi: Google

SI tomonidan yaratilgan musiqa o'nlab yillar oldin boshlangan uzoq tarixga ega: SI estrada qo'shiqlarini bastalagan, 90-yillarda SI Baxning ijodiga o'xshash, musiqachilarnikidan yaxshiroq musiqa qilgani va jonli ijrolarga hamroh bo'lgan tizimlar mavjud. So'nggi talqinlardan biri - matn takliflarini spektrogrammalarga aylantirish uchun StableDiffusion SI tasvirini yaratish mexanizmidan foydalanadi, keyin esa musiqaga o'giradi. Google ta'kidlashicha, MusicLM o'zining "sifati va sarlavhaga rioya qilishi", shuningdek, audioni qabul qilishi va ohangni nusxalashi tufayli boshqa tizimlardan o'zib ketishi mumkin.

Oxirgi qism, ehtimol, tadqiqotchilar tomonidan taqdim etilgan eng zo'r namoyishlardan biridir. Sayt sizga kiritilgan audioni ijro etish imkonini beradi, u yerda kimdir kuyni xirillaydi yoki hushtak chaladi, keyin esa model uni qanday qilib elektron sintezator, torli kvartet, gitara yakkaxoni sifatida takrorlashini eshitish imkonini beradi.

Ushbu turdagi sun'iy intellekt bo'yicha boshqa tashabbuslar singari, Google o'zining ba'zi raqobatchilaridan farqli holda MusicLM bilan ancha ehtiyotkor. “Bizda hozircha loyihani ommaga ochish rejasi yo‘q. Sababi, ijodiy namunalar o'zlashtirilishi va noto'g'ri talqin qilinishi ehtimoli yuqori" deyilgan Google maqolasida.

Google MusicLM ommaga qachon taqdim etilishi haqida aniq ma'lumot bermagan, hozircha tadqiqotdan faqat musiqiy SI tizimlarini yaratuvchi boshqa dasturchilar foydalana oladi. Googlening ta’kidlashicha, u 5500 ga yaqin musiqa-matn juftliklari bo‘lgan ma’lumotlar to‘plamini ommaga e’lon qilmoqda, bu esa boshqa musiqiy SIlarni o‘rgatish va baholashda yordam berishi mumkin.

Muallif: Hidoyatxon Atabaev

O'QING: ChatGPTni muallif sifatida ko‘rsatib bo‘lmaydi

Terabayt.uz сайтининг видеолари: Youtube'даги каналимизда!