Програма розпізнавання образів систематизувала альбоми «Бітлз»

Навчання Перегляди: 56

Комп’ютерна програма розподілила пісні з альбомів «Бітлз» за часом їх створення. На фото: перший («Please Please Me») і останній («Abbey Road») альбоми групи «Бітлз», записані в Англії. З сайту en.wikipedia.org

  • Сучасні успіхи технологій розпізнавання образів дозволяють аналізувати твори мистецтв, художні та музичні. Так, двоє американських фахівців-комп’ютерників застосували розроблені методи до аналізу музики «Бітлз». Їх програмний комплекс — переведення аудіограм у візуальні спектрограми і подальше їх порівняння за тисячами параметрів — дав виключно змістовний результат. Всі альбоми «Бітлз» розподілилися за часом їх створення. Автори зазначають, що програмними засобами можна простежити стилістичну динаміку музики «Бітлз» надійніше, ніж це виходить у експертів.


Сучасні успіхи технологій розпізнавання образів дозволяють аналізувати твори мистецтв, художні та музичні. Так, двоє американських фахівців-комп’ютерників застосували розроблені методи до аналізу музики «Бітлз». Їх програмний комплекс — переведення аудіограм у візуальні спектрограми і подальше їх порівняння за тисячами параметрів — дав виключно змістовний результат. Всі альбоми «Бітлз» розподілилися за часом їх створення. Автори зазначають, що програмними засобами можна простежити стилістичну динаміку музики «Бітлз» надійніше, ніж це виходить у експертів.

Багато людей задаються питанням: що таке мистецтво — рекламний піар або щось у цьому є глибинно-правдиве? У буденному житті часто доводиться прислухатися до експертної думки, що тлумачить так чи інакше твори мистецтва або аналізує творчість авторів. Але завжди залишається дещиця сумніву, що це всього лише думка однієї людини, а насправді альтернативних оцінок може бути стільки, скільки людей на світі. І справа тут в тому, що у нас немає об’єктивних ознак, які б відрізняли справжнє від кітчу або підробки. Дійсно, не можна ж вважати ті мурашки, що біжать по спині, критерієм чогось вартого.

Однак фахівці в галузі розпізнавання образів серйозно просунулися в пошуку таких ознак. Ліор Шамір (Lior Shamir) і Джо Джордж (Joe George) з Технологічного університету братів Лоуренс представили результати комп’ютерної класифікації пісень «Бітлз». Комп’ютер блискуче впорався із завданням, розставивши альбоми «Бітлз» в хронологічному порядку і виділивши збірні альбоми з піснями різних періодів творчості. Це, звичайно, не суть людської творчості, але вже щось дозволяє приступити до об’єктивних міркувань про творчість. Комп’ютерні програми, які не мають суб’єктивних уподобань, виділили суть стилістичного розвитку «Бітлз», і саме ця динаміка позначилася в комп’ютерному рішенні.

Ясно, що ця робота з’явилася не на порожньому місці. Шамір зі своїми колегами починав дослідження з аналізу сигналів китів (Lior Shamir, 2014. Classification of large acoustic datasets using machine learning and crowdsourcing: Application to whale calls). Вчені займалися розрізненням звукових сигналів різних видів китів, а також популяцій одного виду, що мешкають в різних частинах ареалу. Це допомогло відпрацювати техніку класифікації аудіосигналів. Спочатку аудіоінформація трансформується у візуальну у вигляді спектрограм (оскільки візуальний запис аналізувати простіше, ніж звуковий). У спектрограмі комп’ютер може вичленувати близько 2880 ознак, за якими і ведеться порівняння. Приблизно тією ж методикою вчені скористалися при аналізі пісень «Бітлз».

З 13 альбомів групи вибрали по 11 пісень, перевівши їх у спектрограми.

Приклад спектрограми голосу пісні «Lonely hearts» (є спектрограми окремих інструментів). Малюнок з препринту статті Joe George, Lior Shamir, 2013. Computer-based approaches to music research

Для кожного альбому була виділена квінтесенція стилю — комплекс загальних характеристик. Потім за ступенем схожості виділених параметрів самі альбоми були розкласифіковані з використанням звичайних методів побудови філогенетичних дерев. І на підсумковому дереві вони розташувалися строго закономірним чином — в хронологічному порядку.

Схема розвитку музичного стилю «Бітлз», виконана програмою розпізнавання образів. Зображення зі статті: Joe George, Lior Shamir. Computer analysis of similarities between albums in popular music

Навіть порушення хронологічного порядку на цьому дереві мають сенс. Так, альбом «Let it be», випущений в 1970 році, поміщається перед альбомом 1969 року «Abbey Road», так як «Let it be» був насправді записаний раніше. Те ж і з альбомом «Help!», який був зібраний раніше, ніж «Rubber Soul».

Тож комп’ютерний алгоритм аналізу пісень «Бітлз» чудово «розібрався» у творчій динаміці музичного стилю групи. Не кожен знавець зможе потягатися в цьому з комп’ютером. Очевидно, ті експертні оцінки, на які прийнято орієнтуватися, експлуатують величезний комплекс параметрів того чи іншого твору. Експерт рідко віддає собі в цьому звіт, конкретизуючи в розумі той чи інший критерій, але його мозок тонко реагує на весь комплекс критеріїв. Комп’ютерна програма, мабуть, робить частково те ж саме, але тільки не відволікаючись на суб’єктивні моменти.

Розроблений і випробуваний метод — це прекрасний інструмент для вивчення сутності експертних оцінок мистецтва, для виявлення окремих шкіл і тенденцій в сучасному і класичному мистецтві. Потрібно буде ще виконати додаткову роботу, щоб довести, що програма аналізує дійсно елементи творчості, а не відхилення в роботі звукозаписних пристроїв. Але так чи інакше, Шамір з колегами вже випробував свою технологію і на творах художнього мистецтва, також отримавши інтригуючі результати. Навіть суперечливий художній стиль Джексона Поллока, в основі якого — псевдобеспорядні бризки і розлучення фарби, піддається аналізу за допомогою розробленого комплексу програм.

Джерела:

1) Joe George, Lior Shamir. Computer analysis of similarities between albums in popular music // Pattern Recognition Letters. 1 August 2014. V. 45. P. 78–84.

2) Lior Shamir. What makes a Pollock Pollock: A machine vision аpproach.

3) Lior Shamir. Computer analysis of art // Journal on Computing and Cultural Heritage (JOCCH). 2012. V. 5, Issue 2. Article No. 7.

Олена Наймарк

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *