Шазам самые популярные. Угадай мелодию: как работает Shazam? Почему так случилось?

Технологии способны удивлять. Помню, как мне показали распознавание музыки на айфоне. Про Shazam тогда ещё ничего не знал, впечатления были на уровне американского wow-эффекта. А на днях набрёл на материал, где доступно и понятно рассказано о таинстве фокуса. Есть подозрение, что сеанс разоблачения будет интересен и вам, уважаемые читатели.

Почему так случилось?

Что в этом хорошего, так это то, что он также позволяет воспроизводить большинство идентифицированных треков, а также просматривать связанные видео. Объявления. Баннеры постоянно появляются на экране, занимая довольно много места. К счастью, вы можете заплатить за их удаление.

Если вы любитель музыки, это отличное приложение. Вам не нужно удалять рекламу, чтобы наслаждаться ею, но если вы это сделаете, это приложение действительно станет угощением. Пойте вместе с песнями с музыкой в ​​реальном времени или просмотрите их видео. Проверьте рекомендуемые треки, чтобы найти новую музыку. В мире, вероятно, более сотни миллионов песен, и число их каждый день увеличивается. С таким количеством песен шансы на то, что вы слушаете песню, которая вам действительно нравится, и не зная названия или автора, довольно высоки.


Существует клёвый сервис под названием Shazam , который по короткому музыкальному отрывку идентифицирует песню. Есть несколько способов, чтобы пользоваться им, но удобнее всего с помощью бесплатного приложения для iPhone (и не только, Symbian и Android не оставили в стороне ). Просто нажмите "tag now", держите микрофон телефона возле динамиков, и Shazam, как правило, определит песню, предоставив информацию об исполнителе, а также ссылки для покупки альбома.

Что примечательно в сервисе, он работает с малоизвестными песнями и определяет их даже в присутствии посторонних шумов. У меня получилось распознать трек, сидя в переполненном кафе и пиццерии.

Мне стало любопытно, как же это работает, и, к счастью, нашлась с объяснениями процесса. Конечно, там исключены некоторые детали, но основной идеей является то, что вы и предполагали: алгоритм сравнивает „отпечатки“ музыки, основанные на спектрограммах .

Что касается настольных компьютеров, распознавание музыки также возможно через это бесплатное программное обеспечение или онлайн-услуги. Вы можете петь, гулять или даже играть музыку, если вам удалось записать ее, и мидоми попытается распознать песню. Нет смысла использовать Шазам.

Выберите жанр, который, по вашему мнению, принадлежит музыке, а также язык. Помните, что вы гуляли по улице, в автобусе, на этой случайной вечеринке, и вы слышали песню, которую хотели добавить в свой любимый плейлист, и задавались вопросом: какая это песня?

Он очень точен и быстро определяет песню. Просто нажмите большую синюю кнопку и дайте ей послушать музыку. Нет соединения с интернетом? Нет проблем. Есть также настольная версия, которую вы можете проверить. 🙂. Забыл лирику, несмотря на вашу лучшую попытку запомнить их? Это даст вам список возможных песен, поэтому не беспокойтесь, если ваше пение не идеально подходит. Это самый простой способ определить песни, если вы не хотите загружать сторонние приложения.

Вот основные шаги:

  1. В Shazam заранее создали картотеку отпечатков музыки и сохранили её в базе данных.
  2. Пользователь „отмечает“ услышанную песню, для которой генерируется отпечаток на основе десятисекундного образца звука.
  3. Приложение отправляет отпечаток сервису Shazam, который ищет соответствия в базе данных.
  4. Если соответствие найдено, информация о песне отображается у пользователя, в противном случае возвращается ошибка.
Вот как работает снятие отпечатков:
Вы можете представить музыкальное произведение как частотно-временной график, называемый спектрограммой. На одной оси откладывают время, на другой — частоту, на третьей — интенсивность. Каждая точка на графике представляет интенсивность конкретной частоты в данный момент времени. Располагая временную шкалу на оси х, а частотную — на оси у, получаем горизонтальную линию, которая представляет собой непрерывный чистый тон и вертикальную линию, иллюстрирующую мгновенный всплеск белого шума . Вот пример того, как может выглядеть песня:
Спектрограмма отрывка песни с пиками интенсивности, отмеченными красным цветом.

Алгоритм Shazam делает отпечаток песни путём создания этого трёхмерного графика и выявляет частоты „пика интенсивности“. Для каждого из этих пиковых значений он отслеживает частоту и промежуток времени от начала трека. В примере из статьи, я предполагаю, они находят около трёх подобных точек в секунду. [Обновление: комментатор отмечает, что в его собственной реализации ему нужно больше 30 точек в секунду.] Таким образом, отпечаток десятисекундного образца может быть следующим:
Частота в герцах Время в секундах
823.44 1.054
1892.31 1.321
712.84 1.703
. . . . . .
819.71 9.943

Shazam строит свой каталог отпечатков в виде хэш–таблицы , в которой роль ключа исполняет значение частоты. Когда Shazam получает отпечаток, как показано выше, он использует первый ключ (в данном случае 823.44) для поиска подходящих песен. Их хэш–таблица может выглядеть следующим образом:
Частота в герцах Время в секундах, информация о песне
823.43 53.352, “Song A” by Artist 1
823.44 34.678, “Song B” by Artist 2
823.45 108.65, “Song C’ by Artist 3
. . . . . .
1892.31 34.945, “Song B” by Artist 2

[Некоторые дополнительные подробности: Они не просто отмечают точку в спектрограмме, они отмечают пары точек: „пик интенсивности“ плюс вторую „опорную точку“. Поэтому их ключ содержит не только одиночную частоту, это хэш частот обеих точек. Что, в свою очередь, ведёт к меньшему числу коллизий (когда хэш двух различных ключей совпадает) и ускоряет поиск по каталогу на несколько порядков, позволяя им в большей степени использовать среднее время выполнения . Есть много увлекательных вещей, связанных с хэшированием, но я не собираюсь вдаваться в подробности, так что просто изучите ссылки в этом пункте, если вы заинтригованы.]

12 комментариев:

11.10.2010, 10:56 virens комментирует...

Занятно, спасибо Акулович.

Когда все остальное не удается, краудсорсинг ответа может спасти день. Напишите столько сведений, которые вы знаете об этом, и другие участники помогут вам назвать его как можно быстрее. Рекордные компании отслеживают загрузку и поиск данных, чтобы предсказать, какие новые песни будут хитами. Это было хорошо для бизнеса, но это плохо для музыки?

Д. назвал Эйвери Ван соучредителем, с парой выпускников бизнес-школ, технологического запуска под названием «Шазам». Их идея заключалась в том, чтобы создать службу, которая могла бы идентифицировать любую песню за несколько секунд, используя только мобильный телефон, даже в переполненном баре или кафе.

По теме алгоритма. Это Time-Frequency Analysis, то есть это мгновенное Фурье-преобразование. БПФ берётся не по всему сигналу, а скользящим окном - то есть получается свёртка участка сигнала и функции окна. Это на пальцах и есть спектрограмма - фурье-преобразование сигнала в небольшом участке по времени. Получается такой бегущий фурье-спектр. Замечательный инструмент для анализа нестационарных сигналов.

Сначала Ван, который изучал аудиоанализ и отвечал за создание программного обеспечения, опасался, что это может быть невыполнимой задачей. Никакой технологии не существовало, чтобы отличить музыку от фонового шума, а для каталогизации песен для заметок требуется авторизация с этикеток. Но затем он сделал прорыв: вместо того, чтобы пытаться захватить целые песни, он построил алгоритм, который создавал бы уникальный звуковой отпечаток пальца для каждого трека. Он понял, что трюк превратил песню в кусок данных.

С тех пор он был загружен более 500 миллионов раз и использовался для определения около 30 миллионов песен, что делает его одним из самых популярных приложений в мире. Это также помогло совершить революцию в индустрии звукозаписи. Карта представляет собой сейсмограмму в реальном времени самой популярной новой музыки в мире, помогая разведчикам открывать неподписанные художники так же, как они начинают создавать тремор. «Мы знаем, где начинается популярность песни, и мы можем наблюдать за ее распространением», - сказал мне Титус.

Я эпизодически ковырял Time-Frequency Analysis на предмет того, можно ли его использовать для предсказания турбулентности при распространении света в атмосфере. И, хотя сейчас проект несколько сместился в сторону теории управления (интересна динамика компонентов системы), знакомство с Time-Frequency расширило мой кругозор весьма основательно.

Возьмите, к примеру, Лорда. Фактически, все наши поиски, потоковая передача, загрузка и обмен используются для ответа на вопрос, который музыкальная индустрия просила на протяжении столетия: что люди хотят услышать дальше? Вопрос в том, что руководители лейблов однажды ответили в основном, доверяя их кишке. Но данные о наших предпочтениях сдвинули баланс сил, заменив инстинкты экспертов мудростью толпы. В результате ярлыки стали намного лучше понимать то, что мы хотим слушать. Это одна серебряная подкладка, которую музыкальная индустрия нашла в цифровой революции, которая неуклонно сокращает прибыль.

А с угадыванием музыки это да, здесь метод в самую точку. Дальше корреляционное сравнение спектров композиции и известной песни. Скоро айфоны будут угадывать песню по насвистыванию:-) Ерунда, конечно, но почему бы и нет.

17.10.2010, 13:33 Dr.AKULAvich комментирует...

> Занятно, спасибо Акулович.
You are welcome:-)

Так что это хорошо для бизнеса, но хорошо ли это для музыки гораздо менее очевидно. Поп-музыка - сентиментальный бизнес, и предсказывать, что следующая большая вещь часто означает находиться внутри этого переполненного бара, наблюдая, как молодая группа соединяется с одурманенной, качающейся толпой.

Новые инструменты могут в дальнейшем еще больше уменьшить значимость исполнителей на самом деле. Лучшие 1% групп и сольных исполнителей теперь получают 77% всего дохода от записанной музыки. В то время как получение песни на радио гарантирует, что люди услышали это, Калбертсон говорит: «Шазам говорит вам, что люди хотели узнать больше». Чтобы получить песню на радио, в первую очередь, музыкальные лейблы сталкиваются с парадоксом: как вы докажете, что это будет удар, прежде чем кто-нибудь его услышит?

Специально подождал недельку, будут ли новые комменты. Предположение подтвердилось. После комментария virens"а нечего добавить:-) Миша "задавил" всех мгновенным Фурье-преобразованием.

Мне приглянулась эта статья своими переплетениями с математикой, технологиями и применением "в быту". Так намного интереснее постигать научные знания.

Раньше лейблы иногда оказывали давление или откровенно подкупали станции, чтобы продвигать свою музыку. Песни стали хитами, потому что руководители решили, что они должны быть хитами. Но радио тоже стало больше полагаться на данные, и теперь, когда руководители лейблов отправляют станцию, они, скорее всего, будут вооружены электронными таблицами. Чтобы убедить основную радиостанцию ​​сыграть новую песню, лейблам необходимо соединить все эти точки. Любая песня, которая оценивается выше 65, считается возможным прорывом, хотя выше этого порога самые высокие оценки не всегда делают лучше всего.

22.10.2010, 12:55 virens комментирует...

@Dr.AKULAvich
Миша "задавил" всех мгновенным Фурье-преобразованием.
Никого я не давил. Просто твой пост настроил меня на волну радиостанции "Юность" и песню "Как молоды мы были" :-) Кстати, может быть мне ещё придётся Time-Frequency применять в моём проекте.

Мне приглянулась эта статья своими переплетениями с математикой, технологиями
Нету там технологий - это применение алгоритма анализа сигналов для увеселения праздношатающейся публики.

Подобная революция произошла в музыкальных чартах. Обе стороны лгали, часто потому, что этикетки подталкивали или подкупали их, чтобы подключить определенные записи, или потому, что владельцы магазинов не хотели рекламировать альбомы, которые они больше не имели на складе. Вся индустрия была предвзятой к оттоку: ярлыки и магазины хотели, чтобы песни быстро вошли и вышли из графика, чтобы они могли продолжать продавать новые хиты. Горячий 100 имеет значение, потому что он не только отражает предпочтения слушателя, но и формирует их.

Исследователи отправили участников на разные музыкальные веб-сайты, где они могли слушать десятки треков и загружать своих избранных. Некоторые сайты отображали рейтинг самых загружаемых песен; Другие - нет. Участники, которые видели рейтинги, с большей вероятностью прослушивали самые популярные треки.

Так намного интереснее постигать научные знания.
Чтобы было веселее постигать, можно начать . Далее - matlab и tfkmvphdproject. И хотя тема моего Ph.D. другая, дела это не меняет. Если заинтересует, могу выслать тебе книжку несравненного Patrick Flandrin - он отец и бог этой области. Книжка у него просто классная.

25.10.2010, 21:03 Dr.AKULAvich

Shazam на сегодняшний день является самой популярной программой, которая поможет в течении нескольких секунд найти нужную песню. Причем не важно откуда она, будь то реклама, хит по радио либо даже из шоу. Это программное обеспечение поддерживают все популярные мобильные платформы – Windows Phone, iOS, . Для того, чтобы найти нужный трек, достаточно просто поднести микрофон телефона к источнику звука и подержать секунд 15. После этого приложение предложит варианты, которые подходят к мелодии.

Затем исследователи задавались вопросом, что произойдет, если они манипулируют рейтингами. В последующем эксперименте некоторые сайты отображали истинное количество загрузок, а другие показывали перевернутое ранжирование, где наименее популярная песня была указана в № 1. Перевернутое ранжирование изменило все: ранее проигнорированные песни взлетели в популярности, а ранее популярные песни были проигнорированы. Просто полагая, даже ошибочно, что популярная песня заставила участников с большей вероятностью ее загрузить.

Когда это произошло, хип-хоп и страна, выросшие в рейтинге, и старомодный рок медленно начали исчезать, что говорит о том, что, возможно, в промышленности, где доминируют белые парни на побережье, не уделялось достаточного внимания музыкальным интересам городских меньшинств и южных белые.

Это приложение универсальное: можно найти как мелодию, которая проигрывается по радио, так и просто напеть самому по нотам песню. Это очень полезно, когда засядет в голове какая-то песня и нужно ее найти, потому как не будет покоя. Приложение доступно не только пользователям смартфонов, но и владельцам ноутбуков и ПК. В этом случае полноценно поддерживается только операционная система Windows 8. Для Mac OS и Linux следует установить дополнительное программное обеспечение, которое позволяет запускать файл. Даже есть Shazam топ 100, где описаны все популярные запросы пользователей.

Но вот улов: если вы слишком много говорите людям, они будут просить одинаковые знакомые звуки в бесконечном цикле, укрепляя музыку, которая повторяется, производна и неустанно разыгрывается. Поскольку самые популярные песни теперь остаются на графиках в течение нескольких месяцев, относительная ценность хита взорвалась. Лучшие 1% групп и сольных исполнителей теперь получают 77% всех доходов от записанной музыки, сообщают исследователи средств массовой информации. И хотя объем проданной цифровой музыки вырос, 10 самых продаваемых треков на 82% больше рынка, чем десять лет назад.


В дополнительные функции программы входит поиск информации о треках, исполнителе и сам текст песни. Все функции программы:

  • Смотреть видео-клипы на YouTube;
  • Караоке вместе с любимым исполнителем;
  • Прослушивать песни через радио либо другой аналогичный интернет-сервис;
  • Сохранение истории запросов и поисков, чтобы быстро вернуться к запрошенным композициям;
  • Позволяет запостить найденные аудиозаписи в соцсети.

Топ 5 лучших песен в Shazam Россия:

    Don’t Be So Shy (Filatov & Karas Remix) Imany

    Появление собственных художников в эпоху цифровых технологий, возможно, выросло на длинный хвост музыки, но его толстая голова все больше становится толще. Между тем, радиостанции подталкивают границы повторения к новым уровням. Опора на данные может привести к «кластеризации» стилей и удручающему сходству в поп-музыке.

    И мы не только слышим одни и те же хиты с большей частотой, но и сами хиты кажутся все более похожими. Поскольку ярлыки стали более искусными в признании того, что продается, они быстрее, чем когда-либо, инвестировали в подражателей. Поп, казалось, все более мягко, громко и предсказуемо, снова и снова перерабатывает те же самые последовательности аккордов. Исследователи пришли к выводу, что старые песни могут звучать «романно и модно», просто освежая приборы и увеличивая «среднюю громкость».

    How Deep Is Your Love Calvin Harris & Disciples

    Breezeblocks Alt-J

    Reality Lost Frequencies Feat. Janieck Devy

    Stole The Show Kygo Feat. Parson James

Топ 100 песен Шазам на Youtube:

Для удобства пользователей даже создали специальную подборку шазам топ 100 россии, где собраны самые популярные композиции только русских исполнителей. Чтобы посмотреть самые популярные треки по всему миру следует воспользоваться подборкой Shazam Top 100.

Проблема не в наших поп-звездах. Наши мозги подключены, чтобы предпочесть мелодии, которые мы уже знаем. Это потому, что знакомые песни легче обрабатывать, и чем меньше усилий нужно продумать - будь то песня, живопись или идея - тем больше нам нравится. В психологии эта идея известна как беглость: когда часть информации потребляется свободно, она аккуратно скользит в наши закономерности, наполняя нас удовлетворением и уверенностью.

«Вещи, которые знакомы, утешительны, особенно когда вы чувствуете беспокойство», - сказал мне Норберт Шварц, профессор психологии из Университета Южной Калифорнии, который учится беглости. Когда у вас плохое настроение, вы хотите увидеть своих старых друзей. Когда вы испытываете стресс, вы не хотите ставить новый фильм или сложную музыку.