. به خاطر دوره تناوب‌هایزیاد تجزیه و تحلیل ضرب، downsamplingسیگنالزمانمحاسباتبرایمحاسبههمبستگی را بدونتأثیر بر عملکردالگوریتم کاهش میدهد.
Y[n] = x[kn]
حذف میانگین:
منظور ایجاد تمرکز سیگنالبهصفربرای مرحله همبستگی اعمال می‌شود
Y[n] = x[n] – E[x[n]]
همبستگی پیشرفته:
قلههای تابع خود همبستگی مربوط به تأخیرهای زمانی هستند؛جایی که در آن سیگنال بیشتر شبیه به خود است. تأخیرهای زمانی قلهها در محدودهی زمانی مناسب برای تجزیه و تحلیل ریتم مربوط به دوره تناوب ضرب است. تابع خود همبستگی اصلی خلاصهی پاکتها، به ارزش‌های مثبت و پس از آن به مقیاس زمان با ضریب دو کوتاه شده و از تابع اصلی کوتاه شده، کم شده است. همین روند با عوامل دیگر از جمله قله‌های تکراری که در آن مضارب عدد صحیح حذف می‌شوند، تکرار می‌شود.
Y[k] =
تشخیص قلهومحاسبههیستوگرام:
سهقلهاولتابعخودهمبستگیافزایش یافته که درمحدودهمناسببرای تشخیصضربهستندانتخاب می‌شوندوبههیستوگرام ضرب‌اضافه میشوند.Binهای هیستوگراممربوط بهضرباندر هردقیقه(BPM) از40 تا200ضربه در دقیقهاست.برای هر قله تابعخودهمبستگیافزایش یافته، دامنهقلهبههیستوگراماضافه شده است.این قلهکه دارایدامنهبالابهشدتنسبتبهقله‌های ضعیف‌تردر محاسبههیستوگراموزن دار شده‌اند.
شکل2-1-فلوچارت محاسبه هیستوگرام ضرب]3[
شکل2-2یک هیستوگرامضرببرای 30ثانیه از این آهنگ “Come Together” بیتلز را نشان می‌دهد.دو قله اصلیBH مربوط به ضرب اصلی در حدود 80 ضرب در دقیقه و هارمونی اول آن (دو برابر سرعت) در 160 ضرب در دقیقه است.
شکل2-2 نمونه هیستوگرام ضرب
قدرت قوی‌ترین ضرب:
معیاری است از این که چقدر قوی‌ترین ضرب در مقابل سایر ضرب‌های ممکن قوی است. این معیار با یافتن انرژی متناظر قوی‌ترینضرب در هیستوگرام ضرب و تقسیم ان به مجموع کل انرژی در هیستوگرام ضرب محاسبه می‌شود.
قوی‌ترین ضرب:
ویژگی است که قوی‌ترینضرب در سیگنال را استخراج می‌کند. که از طریق پیدا کردن بلندترین bin در هیستوگرام ضرب تولید می‌شود.
مجموع ضرب‌ها:
ویژگی خوبی که نشان می‌دهد چقدر یک ضرب معمولی در ین قطعه موسیقی نقش مهمی را بازی می‌کند. و از حاصل جمع تمام مقادیر درهیستوگرام ضرب به دست می‌آید.
نرخ گذار از صفر:
نرخ گذار از صفر شکل موج حوزه زمان یکی از قوی‌ترین معیارها برای تشخیص گفتار است و به طور گسترده ای به عنوان معیاری قوی برای تشخیص گفتار صدادار از سایشی استفاده می‌شود. نرخ گذار از صفر به طور ساده تعداد نقاط تلاقی با صفر در یک پنجره سایز ثابت است. یعنی تعداد دفعاتی که شکل موج صوتی علامتش در طول فریم تغییر می‌کند. نرخ گذار از صفر زمانی اتفاق می‌افتد که نمونه‌های متوالی علامت‌های جبری مختلفی داشته باشند. معادله زیر نرخ گذار از صفر را نشان می‌دهد: