موسیقى تراوش احساسات و اندیشه‌هاى آدمى و مبین حالات درونى وى مى‌باشد. شنیدن یک آهنگ آرام‌بخش و جذاب مى‌تواند پایان‌پذیر خستگى‌ روزانه آدمی باشد. موسیقى به معنى پیوند آهنگ‌هاست. تعریف ساده‌ی موسیقى یا صداهاى موسیقایی، صداهاى خوشایندى مى‌شود که انسان از شنیدن آن‌ها احساس لذت مى‌کند.
صداهاى خوشایند، صداهایى هستند که از نظمى خاص پیروى مى‌کنند و بین آن‌ها نسبت‌هاى معینى وجود دارد. براى همین عدد در موسیقى داراى اهمیت بسیارى است. تا جایی که فیثاغورث معتقد است که عدد اصل وجود در آفرینش است. پیروان او اجسام را هر یک عدد مى‌داشتند و معتقد بودند که چون کرات آسمانى و افلاک از یکدیگر فاصله‌هاى معینى دارند، از نسبت آن‌ها نغمه‌ها ساخته مى‌شود و آوازها در اصل ناشى از حرکت افلاک هستند.
موسیقى سنتى ایران شامل قطعاتى است که در مجموع به عنوان ردیف موسیقى ایرانى گفته مى‌شود. امتیاز موسیقى ایرانى در امکانات وسیع مقامى و ملودى‌هاى غنى آن است. این موسیقى هنرى است بسیار ظریف و عمیق.
موسیقی فقط غذای روح و زبان احساسات نیست، بلکه درمانی برای جسم نیز هست. تحقیقات نشان داده است موسیقی که ترکیبی از صداهای گوناگون است، بر روی عملکرد و متابولیسم بدن تأثیر می‌گذارد و اثری مستقیم بر روی بخش‌های اصلی بدن از جمله غدد گوناگون، قلب، دستگاه تنفسی، مغز و … دارد و موسیقی به عنوان ترکیبی منظم و زیبا از اصوات، تأثیری مثبت بر روی جسم نیز می‌گذارد.ولی شناخت تأثیرات مستقیم آن بر روی بدن نیاز به ورود به دنیای علم موسیقی درمانی دارد. البته ارتباط روح و جسم انسان باز هم به ما می‌گوید که در هر لحظه، لذت بردن روح از یک موسیقی مترادف است با تأثیر مثبت آن بر روی جسم انسان. روح انسان است که زیبایی موسیقی را می‌فهمد و این روح است که مانند یک استاد خبره‌ی زیباشناسی در مورد موسیقی قضاوت می‌کند.
زیبایی‌شناسی در موسیقی دارای دو جنبه‌ی تحلیلی و ترکیبی است. زیبایی‌شناسی تحلیلی مربوط به زیبایی اصوات و نوای سازهاست و موج برخاسته از پیانو و ناله و فغان ویولن و کمانچه و … همه واژه‌های زیبایی هستند برای گفتن سخنی زیبا.در مقابل بعد ترکیبی موسیقی برمی‌گردد به نظم و آهنگی که هنرمند با کنار هم چیدن نت‌ها و آواها می‌آفریند.در جنبه‌ی ترکیبی است که هنرمند معنا پیدا می‌کند و موسیقی سخن می‌گوید و جمله‌ای زیبا می‌شود از واژه‌های زیبا.
2-2-2 ویژگی‌های صوتی موسیقی
نواک: نواک که به زیرایی نیز معروف است تحت عنوان زیری و بمی صدا تعریف می‌شود. روشن است که صداهای موسیقایی می‌توانند در سطوح مختلف زیر و بمی حاصل شوند، مثلا می‌دانیم صدای اصلی مردان از صدای زنان یا کودکان کلفت‌تر و بم‌تر است و صدای کودان نسبت به مردان نازک‌تر و زیرتر است.در سازهای سیمی سیم‌هایکوتاه‌تر (و سبک‌تر) زیرتر و سیم‌های بلندتر بم‌تر صدا می‌دهند.در ساز‌های بادی (لوله‌های صوتی) هر قدر لوله درازتر باشد صوت حاصل از آن بم‌تر است و بالعکس.
دیرند:دیرند به کشش و امتداد نیز معروف است وبه مدت زمانی که یک صدا طول می‌کشد گویند.دیرند یعنی “زمانی” که هر صدای موسیقایی ادامه می‌یابد.روشن است که یک آهنگ موسیقایی از صداهایی تشکیل شده که اکثرا ارزش‌های متفاوت زمانی دارند.
شدت:شدت یا دینامیک،میزان قوی (بلند) و یا ضعیف (کم) بودن صدا است. صداهای موسیقی ممکن است نسبت به یکدیگر ضعیف‌تر و یا قوی‌تر باشند.
رنگ:رنگ یا طنین یا شیوشتفاوت صدای ایجاد شده توسط پیانو و ویولون و یا دو انسان که دارای نواک و دیرند و شدت یکسان باشد، می‌باشد.صداها از نظر طنین و رنگ (شخصیت صوتی) هم می‌توانند با یکدیگر متفاوت باشند.در واقع به علت رنگ صدای هر ساز است که ما صدای ساز‌های مختلف را از هم تمیز می‌دهیم.
2-2-3 تولید موسیقی
تن پایه‌ای‌ترین عنصر در صدای موسیقی است. دو نوع ساختار تن وجود دارد: یک تن ساده فرم گرفته از شکل موج سینوسی واحد و یک تن پیچیده شکل یافته از بیش از یک هارمونیک]2[ است. کیفیت تن به عناصر فرکانسی غیرهارمونیک بستگی دارد. همه تن‌های موزیکال کلاسیک از یک فرکانس رزونانساز بخش‌های مالشی یا در حال حرکت ابزار آلات موسیقی ایجاد می‌شوند و برخی از تن‌ها از رزونانس‌های لوله می‌آیند. به جز موزیک الکترونیک که تن اش را بسته به نیروی الکترومغناطیسی تولید می‌کند. تولید موسیقی عمیقا به نوع ابزار موسیقی بستگی دارد. انواع متداول ابزار موسیقی به صورت زیر خلاصه می‌شوند]2[:
آلات رشته‌ای:تن‌هایش از لرزش ریسمان‌ها ایجاد می‌شود. این لرزش از طریق نوسان مستقیم ایجاد می‌شود مثل گیتار و یا از طریق کشیدن بین تارها، مثل ویولون، هر تار یک فرکانس پایه‌ای معین دارد به طوری که یک ابزار موسیقی به تنهایی همه باندهای صوتی را پوشش می‌دهد. این نوع تن‌های پیچیده را تولید می‌کند.
آلات دمیدنی: اساسا این ابزار شامل یک لوله استوانه ای باز در دو انتها مثل فلوت می‌باشد. دریچه‌ها در جدار این ابزار طول موج رزونانس ایستا را تعریف می‌کند و باعث منعکس شدن صدا می‌شود. برخی از ابزار دمیدنی از یک قطعه مسsmall-vibrated برای تولید تن‌های موسیقی مثل آکوردئون استفاده می‌کنند. این نوع ابزار تن‌های هارمونیک تولید می‌کند.
آلات Brass: این نوع مثل woodwind وابسته به دمیدن می‌باشد اما دو تفاوت اساسی آن‌ها را از هم تمیز می‌دهد. تفاوت اول این است که نوع brass یک شکلی از بوق مثل شیپور دارد. تفاوت دوم این است که نوع woodwind وابسته به فشار هوا برای تولید تن‌های مختلف است. در حالی که نوع brass وابسته به سرپوش دستی برای کنترل اندازه حفره می‌باشد مثل ترومپت. نوع brass یک تعداد زیادی از موجودیت‌هایغیر هارمونیک در طیفش دارد.
آلات خانواده پیانو: این نوع از رشته‌های لرزنده به عنوان منبع تن استفاده می‌کند ( از طریق ضربه زدن به آن که به وسیله صفحه کلید کنترل می‌شود) هر دکمه از صفحه کلید برای تولید یک تن واحد طراحی شده است. دامنه تن وابسته به فشار ضربه از طریق انگشتان پیانیست است. برخی تولیدکننده‌ها میله‌های لرزاننده مسی را به جای رشته‌ها قرار می‌دهند. هارمونیک‌های خالص اکثریت توان تن تولیدشده را دارند.
آلات ضربی مثل طبل: مثل طبل، طبل هندی، میله‌های لرزان یا سنتور زنگی که از طریق ضرباتی از طریق baton انجام می‌شود. Baton یک چوب یا پلاستیک مخصوص می‌باشد. خصوصیات تن‌های تولید شده به ابعاد فیزیکی و مقاومت و موقعیت ضربه baton بستگی دارد. بیشتر توان تن اجزای غیر هارمونیک را تولید می‌کند.
تولید الکترونیک موسیقی:ارگ از این دسته است. یک ابزار موسیقی دقیق و قوی که دکمه‌های زیادی را در یک صفحه کلید بزرگ دارد. هم چنین حافظه ای دارد که می‌تواند هر نت را ذخیره کند و از آن بارها به عنوان یک آهنگ یا تن پایه استفاده کند و نیز می‌تواند دائما یک ملودی را در پس زمینه اجرا کند که به نوازنده اجازه می‌دهد که فقط برخی از touch‌های موزیکال را برای کامل شدن ملودی اصلی اضافه کند. راک و پاپ و دیسکو و جاز بدون کمک ارگ نمی‌توانند اجرا شوند. اگرچه همه آهنگ‌های مخصوص ارگ بعد از محاسبات دقیق با استفاده از کامپیوترها ساخته شده‌اند، هر صدا از هر جا می‌تواند ضبط و سپس به عنوان یک آهنگ پایه مورد استفاده قرار گیرد. اگرچه ارگ بزرگ‌ترین و گران‌ترین ابزار موسیقی است تنها تولیدکننده موزیک الکترونیک نیست. ابزار زیادی از این نوع با نام‌هاو سایزهای مختلف وجود دارند بنابراین هر شخص به تنهایی می‌تواند مارک دلخواه خود را بخرد و موزیک الکترونیک اجرا کند. نهایتا توجه به این نکته مهم است که اگر ابزار موسیقی الکترونیک برای تولید موسیقی مورد استفاده هستند، نیازی به فکر کردن در مورد هارمونیک‌ها یا فرکانس پایه برای اندازه گیری کیفیت تن نیست.
2-3استخراج ویژگی‌های محتوایی از فایل صوتی
2-3-1انواع ویژگی‌ها
در این بخش ویژگی‌های صوتی مورد استفاده در کاربردهای رده‌بندی صوت با جزئیات توضیح داده می‌شود.ویژگی‌ها مطابق با جدول 2-1 به شش دسته، ریتم، تمپو، تون، نواک، رنگ و ویژگی‌های آماریسیگنال صوتی شده است. و ویژگی‌های صوتی مربوط به هر دسته در جدول دسته بندی شده است.دسته بندی انجام شده بر اساس مستندات نرم افزار استخراج ویژگی مورد استفاده،jaudio میباشد.تعاریف هر دسته عبارتند از: