Shazam’ın saniyeler içinde müzik bulma yeteneğinin perde arkasında neler olduğunu açıklıyoruz. Anlattıkça uzayacak olan bu süreç, şaşırtan biçimde saniyeler içinde gerçekleşiyor.

Oturduğumuz bir kafede, katıldığımız etkinliklerde yahut en kolayından havalı video edit’lerinde duyduğumuz şarkılar güzelimize gittiğinde telefonumuzu açıp Shazam’a giriyoruz ve Shazam da saniyeler içinde o şarkıyı bize verebiliyor.
Bunu bilhassa de kafe ve etkinlik aynıi arka plan seslerinin ağır olduğu ortamlarda yapabilmesi ise durup; “nasıl saniyeler içinde şarkıyı buluyor” diye düşündürüyor. Elbette şarkıyı bulduktan sonra, sıradaki şarkıyı Shazam’lama ihtiyacı duyana kadar uygulamanın yüzüne bakmadığımız için arka planda dönenlere pek de dikkat etmiyoruz. işin o kısmı daha etkileyici.
Öncelikle kısaca Shazam’dan bahsedelim.
2022’de ayda 225 milyonu aşkın kullanıcıya ulaşmış olan uygulamamız epey kolay bir mantığa sahip. Uygulamayı açtığınızda yapmanız gereken tek şey büyük logoya bir defa dokunmak. Bunun akabinde Shazam, mikrofonunuzu kullanarak müziği dinliyor ve ne olduğunu adeta bir kara büyü saniyeler içinde buluyor.
Tabii biz tekrar de Orta Çağ geleneklerinden uzaklaşıp Shazam’a kara büyü dememeyi tercih edelim. İşte gerisindeki mantık:
Shazam’a müziği dinlettiğinizde uygulamada o müziğin ses dalgaları, bilgisayarın işleyebileceği verilere dönüşmüş oluyor. Bu sayede her müzik için eşsiz bir dalga oluştuğundan, bir parmak izi oluşturulmuş oluyor. Bu işlem bir basitleştirme temelinde ilerliyor. Sesin yükseldiği, inceldiği ya da kalınlaştığı yerleri tümüyle dahil etmek yerine bu olayların ses dalgalarındaki zirve noktaları dikkate alınıyor. Zati sürecin saniyeler sürmesini sağlayan da bu kolaylık.
Temel mantığı anladıktan sonra pratik örneğe geçelim. Diyelim ki kafede otururken çalan müzik hoşunuza gitti ve şarkıyı Shazam’ladınız. Logo’ya bastığınız an Shazam, sesi kaydederek bir spektrogram oluşturuyor. Mikrofona gelen tüm seslerin makul bir zaman (Shazam için maks. 20 saniye) aralığında kaydedildiği bu spektogram’da daha sonradan, az önce bahsettiğimiz zirve noktaları oluşturuluyor ve üstte gördüğünüz karmaşa kolaylaşmış oluyor.
Son evrede ise artık veriye dönüşmüş olan bu zirve noktaları, birbiriyle eşleştirilerek Shazam’ın devasa kütüphanesinde diğer bilgi çiftleriyle karşılaştırılıyor. Şayet gereğince çift eşleşirse de Shazam, şarkıyı bulduğunu söyleyerek şarkı ismini ve sanatçıyı verebiliyor. Elbette bu uzun uzun anlattığımız süreç, bilgisayar tarafından geliştirildiğinden saniyeler içinde bitebiliyor.
Bu açıdan baktığımızda Shazam algoritması, bizim nefes alıp vermemiz kadar kolay ve şekilde ayrıntılı.