در متون گذشته روشهای زیادی برای ردهبندی ارایه شده است. از جمله روشهای ردهبندی معروف میتوان به بیز ساده[35]، شبکه عصبی [36]، درختهای تصمیمگیری [37] و الگوریتم ژنتیک [38] اشاره کرد. روشهای ردهبندی برای طبقهبندی نمونهها راهبردهای مختلفی را دنبال میکنند. یکی از مهم‌ترین راهبردها، استخراج قوانین در مرحله آموزش و به‌کارگیری این قوانین روی مجموعه آزمون است. برای استخراج قانون دو استراتژی کلی وجود دارد [39]. در استراتژی اول یک درخت تصمیمگیری ایجاد شده و سپس به یک مجموعه قانون تبدیل میشود. در این استراتژی میتوان با دنبال کردن یک مسیر از ریشه درخت به سمت یک برگ یک قانون را استخراج کرد. به عنوان مثال اگر درخت موجود در شکل 2-5 یک درخت ساخته شده توسط یک روش ردهبندی درخت تصمیمگیری باشد، میتوان قوانینی را به شرح زیر از آن استخراج کرد:
شکل2-5- یک نمونه درخت تصمیم‌گیری
اگر سن شخص جوان و فرد دانشجو باشد آنگاه برچسب وی بله است.
اگر سن شخص جوان و فرد دانشجو نباشد آنگاه برچسب وی خیر است.
اگر سن شخص مسن باشد آنگاه برچسب وی بله است.
اگر سن شخص میان سال بوده و جنسیت وی مرد باشد آنگاه برچسب وی بله است.
اگر سن شخص میان سال بوده و جنسیت وی زن باشد آنگاه برچسب وی خیر است.
روشهای ردهبندی زیادی وجود دارند که درخت تصمیمگیری ایجاد میکنند، ازجمله ID3[40]، C4.5[37] و C5.0[41]. از آنجایی که در روشهای درخت تصمیمگیری یک مشخصه در هر مرحله در نظر گرفته میشود، برخی محدودیتها برای رسیدن به دقت بالا در آن‌ها وجود دارد. به عنوان مثال آن‌ها ممکن است ساختاری که در آن همه ویژگیها با همدیگر برچسب را تعیین میکنند را از دست بدهند [42].
در استراتژی دوم میتوانیم از روشهای بر مبنای قانون استفاده نماییم که یک قانون را در هر مرحله استخراج میکنند. در این استراتژی بعد از استخراج یک قانون، تمام نمونههای موجود در مجموعه آموزش که توسط آن پوشش داده میشوند حذف شده و به دنبال استخراج قوانین بعدی برای نمونههای باقیمانده خواهیم بود. الگوریتمهای ردهبندی بر مبنای قانون زیادی در متون گذشته ارایه شدهاند که در هر مرحله فقط یک مشخصه را در نظر میگیرند، مثل CN2[43]، PART[39] و RIPPER[44]. روشهای ردهبندی وابستگی-پی یکی از انواع خاص ردهبندی بر مبنای قانون هستند که یک دید جامع روی مشخصهها دارند. غنای قوانین در این راهبرد میتواند منجر به یافتن ساختار مناسب برای ردهبندی شود [42].
درخت تصمیمگیری:
ایجاد درخت تصمیمگیری شامل دو مرحله میباشد. در مرحله اول درخت ساخته شده و در مرحله بعداین درخت هرس میگردد. درمرحلههرس، آندسته از شاخههاییکه بیشترین نرخ خطا را داشتهاند، حذف میشوند[45]. یکی از انواع مهم درختان تصمیم، درخت تصمیمگیری C5.0 است که تحقیقات بسیاری در رده‌بندی موسیقی از آن استفاده کردهاند [34, 46, 47]. در ادامه به شرح این نوع درخت میپردازیم:
الگوریتم C5.0 توسعه یافته الگوریتم ID3[37] است که درخت تصمیمگیری را بر اساس تئوری اطلاعات میسازد. در هر گره از درخت، مشخصهای که بالاترین مقدار بهره اطلاعاتی را داشتهباشد به عنوان تصمیمگیرنده انتخاب میشود. هنگامیکه تمام نمونههای موجود در یک گره از یک کلاس باشند آن گره تشکیل یک برگ را میدهد و الگوریتم در برگها متوقف میشود.
2-5-2 رده‌بندی در کارهای انجام شده
همانطور که قبلا اشاره شد، رده‌بندی یکی از تکنیک‌های جذاب در بازیابی اطلاعات موسیقی می‌باشد. در این بخش مروری کوتاه بر چند تحقیق گذشته خواهیم داشت. این مرور در ساختار جدول سازمان‌دهی شده است. برای هر تحقیق اطلاعاتی نظیر نوع رده‌بندی- حالت، سبک، خواننده و…- نوع الگوریتم رده‌بندی- درخت تصمیم، شبکه‌های عصبی، قواعدتصمیم‌گیری و….- ویژگی‌های مورد استفاده در تحقیق، مجموعه داده‌های مورد استفاده و سال انتشار تحقیق آورده شده است.
جدول2-3 مرور متون گذشته در ارتباط با رده‌بندی موسیقی
سال انتشار
مجموعه داده‌ها
ویژگی‌ها
الگوریتم رده‌بندی
نوع رده‌بندی
مقاله