درخت تصمیم‌گیری نشان می‌دهد کدام فیلد یا متغیرها تأثیرات مهمی در پیش‌بینی و دسته‌بندی دارند.
سادگی در تحلیل و قابلیت تحلیل ساختار در مواقع پیچیدهتر و در حضور داده‌های ناقص نیز وجود دارد.
در صورت نیاز می‌توان به سادگی با نتایج روش‌های دیگر ترکیب‌شده و مدل را گسترش داد.
این ساختار قادر به کار کردن با مقادیر غیر عددی بوده و تعامل بهتری با اطلاعاتی با ماهیت غیر عددی دارد.
2-14 معایب درختان تصمیم
در مقابل این مزیت‌ها میتوان به معایبی از جمله عدم تطابق با ویژگی‌های پیوسته در این درخت نیز اشاره نمود، این ساختار تنها قادر به کار کردن با ویژگی‌های است که مقادیر گسسته (با تعداد محدود) را در بر بگیرند. برای غلبه بر این مشکل، روشهای بسیاری پیشنهادشده تا مقادیر پیوسته به تعدادی خوشه‌های کوچک‌تر تقسیم شوند و به جای استفاده از مقادیر پیوسته هر ویژگی، مشخصه خوشه‌ای که این مقدار را در بر می‌گیرد در تصمیم‌گیری ساختار درخت تصمیم مورد استفاده قرار گیرد. برای این کار میتوان از روشهای خوشه‌بندی و یادگیری بدون ناظر استفاده نمود. همان طور که در بخشهای بعدی توضیح داده خواهد شد، در این پژوهش برای حل چنین مشکل‌هایی از الگوریتم خوشه‌بندی K-means استفاده ‌شده که در بخش مربوطه توضیح داده خواهد شد.
از دیگر مشکلات درخت تصمیم، نحوه ساختن یک درخت بهینه با کمترین میزان خطا و تا حد ممکن ساده است. فرآیند ساخت درخت، یک فرآیند واحد نمیباشد. متأسفانه، مشکل پیدا کردن کوچک‌ترین درخت تصمیم از روی یک نمونه دادهای، مسئله NP-Complete است [34]. به همین دلیل، اکثراً روش‌هایی بر پایه روشهای ساخت درخت غیر عقبگرد و به صورت حریصانه عمل مینمایند.
از معایب دیگر آن می‌توان به موارد زیر اشاره کرد:
در مواردی که هدف از یادگیری، تخمین تابعی با مقادیر پیوسته است مناسب نیستند.
در موارد با تعداد دسته‌های زیاد و نمونه آموزشی کم، احتمال خطا بالاست.
تولید درخت تصمیم‌گیری، هزینه محاسباتی بالا دارد.
هرس کردن درخت هزینه بالایی دارد.
در مسائلی که دسته‌های ورودی با نواحی مکعبی به خوبی جدا نشوند و دسته‌ها همپوشانی داشته باشند، خوب عمل نمی‌کنند.
در صورت همپوشانی گره‌ها تعداد گره‌های پایانی زیاد می‌شود.
در صورتی که درخت بزرگ باشد امکان است خطاها از سطحی به سطحی دیگر جمع شوند (انباشته شدن خطای لایه‌ها بر روی یکدیگر) [35].
طراحی درخت تصمیم‌گیری بهینه، دشوار است. کارایی یک درخت دسته‌بندی کننده به چگونگی طراحی خوب آن بستگی دارد.
احتمال تولید روابط نادرست وجود دارد.
بازنمایی درخت تصمیم دشوار است.
وقتی تعداد دسته‌ها زیاد است، می‌تواند باعث شود که تعداد گره‌های پایانی بیشتر از تعداد دسته‌های واقعی بوده و بنابراین زمان جستجو و فضای حافظه را افزایش می‌دهد.
این الگوریتم به حافظه زیادی نیاز دارد [35].
2-15 آنتروپی
در نظریه اطلاعات آنتروپی میزان خلوص (بی‌نظمی یا عدم خالص بودن) مجموعه‌ای از مثال‌ها را مشخص می‌کند. اگر مجموعه S شامل مثال‌های مختلف با کلاس‌های مشخص 1و 2و .. وn باشد و نشان‌دهنده نسبت تعداد اعضای کلاس i به کل داده‌های موجود باشد، در این صورت داریم: