دانلود منابع پایان نامه در رابطه با رویکردی مبتنی برگراف به ...

و در نهایت نسبت بین جدایی خوشه ها و فشردگی خوشه ها بعنوان تابع ارزیابی تعریف میشود:
انتخاب تعداد خوشه های مناسب با ماکزیمم کردن تابع فوق بدست می آید.
2-9-6 تابع M.Ramze Rezaee
آقای Ramze Rezaee و همکارانش تابع دیگری را برای ارزیابی الگوریتم خوشه بندی c میانگین ارائه داده اند. روش آنها نیز مبتنی بر معیارهای جدایی و فشردگی خوشه ها می باشد که در ادامه روش مورد نظر آورده شده است.

( اینجا فقط تکه ای از متن فایل پایان نامه درج شده است. برای خرید متن کامل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )

فرض کنید که داده های ورودی p بعدی باشند و می خواهیم آنها را به c خوشه گروه بندی کنیم:
مراکز خوشه ها با v_iمشخص می شوند و میزان تعلق نمونه ها با خوشه ها نیز با ماتریس U نشان داده می شود.
اگر واریانس نمونه های X را  درنظر بگیریم برای p امین مولفه واریانس خواهیم داشت:
که در فرمول فوق  ، p امین مولفه متوسط نمونه ها می باشد. متوسط نمونه ها نیز با فرمول زیر محاسبه می شود:
اگر تغییرات خوشه i ام را  در نظر بگیریم برای p امین مولفه تغییرات خواهیم داشت:
با بهره گرفتن از معادلات تعریف شده متوسط پراکندگی تمامی خوشه ها بصورت زیر تعریف شده است:
همچنین یک تابع فاصله نیز بصورت زیر تعریف شده است:
که برای D_maxو D_min داریم:
فرمول فوق ماکزیمم (می نیمم) فاصله بین مراکز خوشه ها را محاسبه می کند. از روی فرمول های فاصله و پراکندگی آقای Ramze Rezaee و همکارانش تابع ارزیابی را بصورت زیر تعریف کرده اند:
جمله اول فرمول فوق متوسط پراکندگی خوشه ها را نشان می دهد که هر چه این مقدار کوچک باشد نشان دهنده این است که خوشه ها فشرده تر هستند. اما همانطور که قبلا گفته شد این جمله بتنهایی نمی تواند معیار خوبی برای خوشه بندی باشد و باید جدایی خوشه ها نیز در نظر گرفته شود که این معیار توسط جمله دوم فرمول فوق محقق می شود. ضریب α نیز که برابر است با D(c_max) برای متعادل کردن دو جمله بکار گرفته شده است. الگوریتم پیدا کردن تعداد خوشه های بهینه بدین صورت است که تعداد خوشه های بهینه بین c_min و c_max در نظر گرفته می شود و سپس تابع ارزیابی فوق را برای تمامی مقادیر بین c_min و c_max محاسبه و ذخیره کرده و در نهایت مقدار c متناظر می نیمم مقادیر ذخیره شده، تعداد خوشه های بهینه خوشه بندی می باشد.
2-10 خوشه‌بندي ترکيبي
روش های خوشهبندی ترکیبی شامل دو مرحله می باشد : تولید افراز های اولیه و تابع ترکیب کننده می باشد تولید اولین گام در روش های خوشبندی ترکیبی می باشد در این مرحله ، مجموعه ای از افراز ها برای ترکیب ، تولید می شوند چرا که نتایج نهائی به نتایج اولیه بستگی دارد[28]. روش های مختلفی برای تولید نتایج اولیه وجود دارد که می توان این روش ها را به دو دسته تقسیم نمود 1. استفاده تنها از یک الگوریتم 2. استفاده از الگوریتم های مختلف ، روش اول با بهره گرفتن از یکی از الگوریتم های خوشبندی پایه و راهکار های مختلف که در ادامه بیان شده است افراز های متفاوتی را تولید می کند برای مثال در الگوریتم k-means استفاده از مقداردهی اولیه مختلف می تواند منجر به تولید افرازهای گوناگون شود علاوه براین ، روش های دیگری برای ایجاد افرازهای پایه وجود دارد از قبیل به کاربردن یک الگوریتم خووشه بندی با پارامترهای مختلف یا حتی به کاربردن تصویر داده ها به فضای ویژگیهای جدید، زیرمجموعه های مختلف از داده ها و زیرمجموعه های مختلف از ویژگی ها می باشد .
روش دوم یعنی استفاده از الگوریتم های مختلف شامل چهار روش عمده می باشد 1. روش سلسله مراتبی 2. روش افرازبندی 3. روش های مبتنی بر چگالی 4. روش های مبتنی بر مشبک کردن فضا ، از الگوریتم های مربوط به روش های افرازبندی می توان به k-means و k-medoids اشاره نمود.الگوریتم های همچون AGNES و DIANA نیز از روش های سلسله مراتبی محسوب می شوند. DBSCAN و DENCLUE از متداولترین روش های مبتنی بر چگالی می باشند.ابتدایی ترین و ساده ترین روش در الگوریتم های مبتنی بر مشبک کردن فضا می توان به STING اشاره نمود. [2]
حال اینکه چه الگوریتمی برای یک مسئله خاص مناسب می باشد. اغلب کار دشواری می باشد.تجربه کارشناس دامنه ی مسئله در این موارد می تواند خیلی مفید فایده باشد.ولی اگر اطلاعاتی در مورد مسئله وجود نداشته باشد ، تولید افراز های پراکنده برای خوشبندی ترکیبی توصیه می شود. چرا که هر چه میزان پراکندگی در مجموعه ی افراز ها بیشتر باشد ، اطلاعات بیشتری برای تابع ترکیبی در دسترس خواهد بود. این پراکندگی نیز بوسیله ی استفاده از مکانیزم های مختلف تولید افرازهای پایه حاصل می شود. [28]
گام اصلی در هر الگوریتم خوشبندی ترکیبی تابع توافقی یا همان تابع ترکیب کننده می باشد که صراحتاً می تان گفت یکی از بزرگترین چالشها پیش روی خوشبندی ترکیبی تعریف یک تابع ترکیب کننده مناسب می باشد.
دو رویکرد کلی برای توابع ترکیب کننده وجود دارد : 1. بر پایه Objects Co-Ocurrence 2. بر پایه Median Partition در رویکرد اول ایده اصلی ، تعیین اینکه کدام برچسب متعلق به یک نمونه خاص در افزار ترکیب شده می باشد. برای انجام این کار تعداد دفعاتی که یک نمونه در یک خوشه قرار دارد یا دفعاتی که دو نمونه در یک خوشه مشابه قرار دارند محاسبه می شود ، به عبارتی تابع ترکیب کننده از فرایند رای گیری میان نمونه ها استفاده می کند برای مثال می توان به روش های برچسب گذاری-رای گیری ،ماتریس همبستگی و متدهای فازی اشاره نمود . متدهای فازی به منظور ترکیب افرازهای حاصل از الگوریتم های مختلف فازی[29] مورداستفاده قرار می گیرد[30]. در رویکرد دوم تابع ترکیب کننده ، افراز ترکیبی بوسیله ی راه حل مسئله ی بهینه سازی حاصل می شود. روش هایی همچونMethods Kernel و Mirkin Distance این نوع از توابع ترکیب کننده می باشند.
اما پاسخ به بعضي سوالات در اين زمينه همچنان با ابهامات زيادي روبروست. اين که در حضور يک مجموعه از نتايج خوشبندي هاي اوليه، آيا استفاده از زيرمجموعهاي از نتايج مي تواند بهتر از استفاده از کل نتايج باشد يا نه؟ کدام زيرمجموعه از نتايج اوليه ميتواند منجر به بهبود عملکرد خوشبندي ترکيبي شود؟ نتايج اوليه با چه معياري نسبت به هم ارزيابي شوند؟ انتخاب زيرمجموعهاي از نتايج اوليه براي استفاده در ترکيب نهايي، مسئلهاي است که اخيرا مطرح شده و با وجود ابهامات فراوان در جوانب اين مسئله، امروزه به صورت جدي دنبال ميشود.[31] ايده هاي اوليه با ارايه يک معيار ارزيابي براي کيفيت خوشه آغاز شد. تعدادي از مطالعات انجام شده سعي در انتخاب زيرمجموعه مناسبي از افرازهاي اوليه دارند (فرن و لين، ۲۰۰۸ ) و تعدادي نيز زيرمجموعه اي از خوشه هاي اوليه را مورد آزمايش قرار داده اند (فرد و جين، ۲۰۰۶). پاسخ به اين سوال که انتخاب چه زيرمجموعهاي از نتايج اوليه موجب بهترين کارايي خوشبندي ترکيبي مي شود هنوز نياز به انجام تحقيقات گسترده تري دارد. در چند سال اخير، پايداري خوشه به عنوان يک معيار ارزيابي خوشه مورد توجه زيادي قرار گرفته است(فرد و جين، ۲۰۰۶) کامپلو نیز روشي براي تعيين تعداد خوشه ها ارايه کرده است که با تغییر در روش جین و همکاران و با بهره گرفتن از معیار سازگاری برای اعتبار سنجی افرازهای فازی استفاده نموده است[32,33].(فرن و لين ۲۰۰۸ ) روشي براي خوشبندي ترکيبي پيشنهاد کرده اند که از زيرمجموعه ی موثرتري از افرازهاي اوليه در ترکيب نهايي استفاده ميکند. در اين روش اگر چه تعداد اعضاي شرکت کننده در ترکيب نهايي کمتر از يک خوشبندي ترکيبي کامل است، به دليل انتخاب افرازهاي با کارايي بالاتر، نتايج نهايي بهبود ميابند. پارامترهايي که در اين روش مورد توجه قرار گرفته اند، عبارتند از: کيفيت و پراکندگي (فرن و لين ۲۰۰۸ ) نشان داده اند که بهينه سازي همزمان دو عامل، پراکندگي و کيفيت در نتايج اوليه خوشبندي ترکيبي مي تواند کارايي خوشبندي ترکيبي را به طور چشمگيري بهبود بخشد[34].
روشهاي خوشه‌بندي ترکيبي سعي ميکنند تا با ترکيب افرازهاي مختلف توليد شده از روشهاي خوشه‌بندي پايه، يک افراز مستحکم از داده‌ها را توليد کنند .[14,25] در اکثر مطالعات اخير، همه افرازها با وزن برابر در ترکيب نهايي حاضر مي‌شوند و همه خوشه‌هاي موجود در همه افرازها نيز با وزن برابر در ترکيب نهايي شرکت مي‌کنند[26]. استرل و گاش [14]يک معيار براي انتخاب از ميان ترکيبات ممکن ارايه کرده‌اند که مبتني بر کيفيت کلي يک خوشه‌بندي است. براي اين کار، آنها ميزان ثبات بين افراز ترکيبي و افرازهاي پايه را در نظر گرفته‌اند و با بهره گرفتن از يک قاعده ترکيبي ثابت، يک معيار شباهت دو به دو را روي فضاي ويژگي‌هاي d-‌‌‌‌‌بعدي به کار برده‌اند.
عظيمي[2] از مفهوم پراکندگي براي هوشمند نمودن خوشه‌بندي ترکيبي استفاده کرده است. دراين روش که به صورت پويا اقدام به انتخاب زيرمجموعه بهينه‌اي از نتايج اوليه در ترکيب نهايي مي‌کند، ابتدا يک خوشه‌بندي ترکيبي ساده انجام ميشود. سپس اين روش ميزان شباهت تمام نتايج خوشه‌بندي‌هاي اوليه را نسبت به جواب به دست آمده ارزيابي مي‌کند و سعي در طبقه‌بندي مجموعه داده‌ها به سه مجموعه داده راحت ، معمولي و سخت مي‌کند. در اين طبقه‌بندي، مجموعه داده راحت به مجموعه داده‌اي اطلاق مي‌شود که خوشه‌بندي‌هاي اوليه تفاوت چنداني با خوشه‌بندي ترکيبي به دست آمده نداشته باشند. به اين معني که هر خوشه‌بندي ساده بتواند تقريبا مانند خوشه‌بندي ترکيبي نتايج مشابه‌اي ارايه کند. مجموعه داده معمولي به مجموعه داده اي اطلاق مي‌شود که خوشه‌بندي‌هاي اوليه نه تفاوت چنداني و نه تشابه چنداني با نتايج خوشه‌بندي ترکيبي به دست آمده دارند. مجموعه داده سخت به مجموعه داده‌اي اطلاق ميشود که خوشه‌بندي‌هاي اوليه تشابه چنداني با خوشه‌بندي ترکيبي به دست آمده نداشته باشند. اين رويداد نشان مي‌دهد که داده‌هاي مجموعه موردنظر کاملا داراي مرزهاي مشترک هستند و روشهاي ساده و معمولي خوشه‌بندي همانند روشهاي پيچيده و قدرتمند خوشه‌بندي ترکيبي قادر به جداسازي نمونه‌ها نمي‌باشند. سپس کل نتايج خوشه‌بندي‌هاي اوليه به چهار زيرمجموعه متفاوت بر اساس ميزان تطبيق دقتشان با نتايج خوشه‌بندي ترکيبي ساده تقسيم مي‌شوند و بر اساس رده هر مجموعه داده (راحت، معمولي و سخت) اقدام به انتخاب يکي از اين زيرمجموعه ها براي ترکيب و به دست آوردن نتيجه نهايي مي‌کنيم. نتايج تجربي صورت گرفته در [2] نيز نشان داده‌اند که ترکيب خوشه‌بندي‌هاي اوليه با بيشترين کمترين و ميزان متوسطي از تطبيق با خوشه‌بندي ترکيبي اوليه، نتيجه بهتري را به ترتيب، در مجموعه داده‌هاي راحت، سخت و متوسط مي‌دهد. روش فوق در هر مجموعه داده سعي ميکند تا نتايج خوشه‌بندي اوليه‌اي که موجب منحرف شدن نتايج نهايي ميشود را از ترکيب نهايي خارج کند و به اين ترتيب خوشه‌بندي‌هاي ترکيبي اوليه‌اي را که داراي دقت نسبتا مناسبي هستند، وارد ترکيب نهايي کند.
در اکثر الگوريتم هاي پايه براي خوشهبندي ترکيبي از نمونه‌برداري داده‌ها استفاده مي‌شود. مسئله اصلي در اين روشها چگونگي ارزيابي خوشه و خوشه‌بندي (افراز) است[3] . بامگارتنر و همکاران [35] يک روش مبتني بر بازنمونه‌برداري را براي بررسي اعتبارسنجي نتايج خوشه‌بندي فازي ارايه کرده‌اند. در چند سال اخير، پايداري خوشه به عنوان يک معيار ارزيابي خوشه مورد توجه زيادي قرار گرفته است [26] ايده‌هاي اوليه براي اعتبارسنجي خوشه با بهره گرفتن از بازنمونه‌برداري در [36] ارايه شده است .راس و همکاران[37] نيز يک روش مبتني بر بازنمونه‌برداري براي اعتبارسنجي خوشه ارايه کرده‌اند. عنصر اصلي در اين روش، که در واقع کامل شده‌ی روش‌هاي پيشين مي‌باشد، پايداري خوشه است. معيار پايداري، ميزان همبستگي افرازهاي به دست آمده از دو نمونه‌برداري مستقل از مجموعه داده را اندازه‌گيري مي‌کند. هر چه ميزان پايداري براي يک خوشه‌بندي بيشتر باشد، به اين معني است که اگر الگوريتم خوشه‌بندي چندين مرتبه ديگر روي آن نمونه‌ها به کار رود، نتايج مشابهي حاصل ميشود [38] .چندين روش اعتبارسنجي خوشه مبتني بر ايده استفاده از پايداري پيشنهاد شده است [39] بن هور و همکاران [40] نيز روشي براي محاسبه پايداري ارايه کرده‌اند که بر مبناي شباهت بين نمونه‌ها درخوشه‌بندي‌هاي مختلف عمل مي‌کند. در اين روش، ابتدا ماتريس همبستگي با بهره گرفتن از روش بازنمونه‌برداري به دست مي‌آيد. سپس ضريب جاکارد به عنوان معيار پايداري بر اساس اين ماتريس محاسبه مي‌شود.داس و سيل روشي براي تعيين تعداد خوشه‌ها ارايه کرده‌اند که از اعتبارسنجي خوشه‌ها براي تقسيم و ادغام آنها بهره مي‌برد. فرن و لين روشي براي خوشه‌بندي ترکيبي پيشنهاد کرده‌اند که اززيرمجموعه‌ی موثرتري از افرازهاي اوليه در ترکيب نهايي استفاده ميکند. در اين روش اگر چه تعداد اعضاي شرکت کننده در ترکيب نهايي کمتر از يک خوشه‌بندي ترکيبي کامل است، به دليل انتخاب افرازهاي با کارايي بالاتر، نتايج نهايي بهبود مي‌يابند. پارامترهايي که در اين روش مورد توجه قرار گرفته‌اند، عبارتند از: کيفيت و پراکندگي. اين روش سعي مي‌کند تا زيرمجموعه‌اي از افرازهايي از نتايج اوليه را وارد ترکيب نهايي کند که از بالاترين ميزان کيفيت برخوردار بوده و در عين حال نسبت به هم بيشترين پراکندگي را دارا باشند. در اين روش از معيار مجموع اطلاعات متقابل نرمال شده(SNMI ) (براي يک افراز در مقايسه با افرازهاي ديگر ترکيب) براي اندازه‌گيري کيفيت يک افراز استفاده شده است. همچنين، معيار اطلاعات متقابل نرمال‌شده(NMI) (بين تمام افرازهاي موجود درترکيب) براي اندازه‌گيري پراکندگي لازم براي ترکيب به کار رفته است. فرن و لين نشان مي‌دهند که روش آنها نسبت به خوشه‌بندي ترکيبي کامل و يا روش انتخاب تصادفي از کارايي بهتري برخوردار است.
علیزاده و همکاران نیز از زیر مجموعه ای از نتایج اولیه به جای کل خوشه های یک افراز در خوشه بندی ترکیبی استفاده نموده است.این گونه که پس تولید افرازهای اولیه ، با بهره گرفتن از یک معیار ارزیابی جدید توسعه یافته توسط علیزاده و همکاران به نام AMM که معیاری مبتنی بر NMI می باشد ، میزان پایداری هر یک از خوشه های یک افراز را اندازه گیری و توسط چند سازگار پیشنهادی با کیفیت ترین آنها را انتخاب نموده و با تغییر و بروز رسانی روش انباشت مدارک توسعه یافته (EAC) به منظور ایجاد ماتریس همبستگی برای خوشه های حاصل از افراز های گوناگون به استخراج خوشه هاي نهايي از اين ماتريس پرداخته است.[31]
فصل سوم
روش تحقيق
3-1 مقدمه
داده کاوی در کاربرد هایی نظیر کشف دانش از داده ها مورد استفاده قرار میگیرد خصوصا ً زمانی که با حجم عظیمی از داده ها مواجه هستیم . روشها وتکنیک های بسیاری در داده کاوی موجود است که در امر کاوش داده ها تسهیل نموده اند و روز به روز در حال گسترش می باشند از آن جمله قوانین انجمنی ، ردهبندی و خوشه بندی مهمترین آنها می باشند ،زمانی که انسان دو شیءمتفاوت( همانند میوه) را تشخیص می دهد و آنها را از یکدیگر متمایز می سازد نوعی رده بندی صورت گرفته است، از این رو تکنیک ردهبندی رویکردی با ناظر است درحالیکه خوشه بندی با وجود شباهت بسیار با رده بندی ،تفاوت اندکی در رویکرد آنها را از یکدیگر متمایز ساخته است .خوشه بندی رویکردی بدون ناظر است
در سالهای اخیر مباحث ترکیبی بسیار مورد توجه واقع شده اند به طوریکه محققان موفق به ترکیب شماری از نتایج گروه بندی شدند که منجر به نتایج نهایی با کیفیت تری نسبت به نتایج حاصل از تنها یک روش گروه بندی می شود و در نهایت همین امر موجب شده است که ترکیب خوشه ها به موضوعی داغ در داده کاوی تبدیل شود.
خوشه بندی ترکیبی سعی می نماید تا افراز های گوناگون با تنوع بسیار را از روش های خوشه بندی مختلف ترکیب نماید.بدین ترتیب ضعف موجود در هر روش خوشه بندی پوشش داده می شود و کیفیت بالاتری با حداقل فاصله از برچسب صحیح تولید می شود.
از سوی دیگر دسته اي از الگوريتم هاي خوشه بندي بر اساس تئوري مجموعه هاي فازي پيشنهاد شده اند که به آنها الگوريتم هاي خوشه بندي فازي مي گويند و به سرعت در حال گسترش می باشند . در خوشه بندی کلاسیک بدلیل آنکه هر نمونه باید به یک و فقط یک خوشه تعلق داشته باشد ، باید تصمیم گرفت که این نمونه متعلق به کدام خوشه است. تفاوت اصلی خوشه بندی کلاسیک و خوشه بندی فازی در همین جاست که در خوشه بندی فازی یک نمونه می تواند متعلق به بیش از یک خوشه باشد. خوشبندی فازی ، نقاط داده ای را بر اساس میزان درجه عضویت شان گروه بندی می کند از این رو از دقت بیشتری نسبت به خوشبندی غیر فازی برخوردار می باشد.
تاکنون الگوریتم های بسیاری در خوشه بندی فازی ارائه شده است که همه ی آنها سعی در کسب نتایج بهتر به همراه دقت بیشتر دارند.
در مورد خوشه بندی فازی ترکیبی روش های کمتری ارائه شده است و اکثر آنها بوسیله تغییر در الگوریتم های ترکیبی اصلی ارائه شده اند. در این فصل قصد داریم رویکردی ارائه دهیم که افراز های فازی را که دارای کمترین میزان خطا در برچسب گذاری واقعی می باشند و قابل رقابت با سایر روش های خوشه بندی ترکیبی هستند ترکیب نماییم. نمایی کلی از این رویکرد در شکل 3-1 آورده شده است .
شکل 3-1 فرایند کلی خوشه بندی ترکیبی فازی
3-2 فرضیات روش پیشنهادی
روش پیشنهادی ، رویکردی بدون ناظر می باشد و قصد دارد مجموعه ای از داده ها را گرفته و بدون اینکه هیچ گروه و یا کلاس های از پیش تعیین شده ای وجود داشته باشد آنها را خوشه بندی نماید . همانطور که پیش تر ذکر شد روش های خوشه بندی پایه بسیاری موجود است که هر یک ضعف ها و قوت هایی دارد ، به همین جهت خوشه بندی ترکیبی شکل گرفت تا بر پایه قوت های هر یک از روش ها بهترین خوشه بندی را انجام دهد .با ظهور روش های فازی نیز توانستیم به دقت بیشتری دست یابیم و ممکن است نمونه ها یی داشته باشیم که متعلق به چند خوشه بوده و نسبت عضویت هر نمونه در هر خوشه را با درجه عضویت تعیین می کنیم.
در روش پیشنهادی قصد داریم تا نتیجه ی چندین روش خوشه بندی فازی را ترکیب نموده و به نتیجه ی نهایی قابل اطمینان و معتبرتری دست یابیم .
این روش از 4 مرحله تشکیل شده است که کلیات آن در این بخش آورده شده است :
مرحله 1 : تولید افراز های فازی اولیه بر روی مجموعه داده x با بهره گرفتن از روش ها و الگوریتم های گوناگون فازی و تشکیل ماتریس های عضویت هر الگوریتم .
مرحله 2 : تولید ماتریس های همبستگی فازی از روی ماتریس های عضویتی که در مرحله قبل ایجاد شدند . بدین ترتیب برای هر الگوریتم فازی و ماتریس عضویت آن یک ماتریس همبستگی فازی خواهیم داشت . این ماتریس بیانگر میزان شباهت دو نمونه از لحاظ توانایی هم خوشه بودن می باشد .
مرحله 3 :جمع ماتریس های همبستگی فازی ایجاد شده در مرحله دوم و تشکیل یک ماتریس به نام ماتریس استحکام (S) که بیانگر میزان استحکام و پایداری اتصالات میان نمونه ها می باشد . در این مرحله در واقع نتایج افرازبندی های گوناگون با یکدیگر ترکیب می شوند .
مرحله 4 : تولید افراز بندی بهینه توسط فرایند تکراری مبتنی بر گراف که بر ماتریس استحکام اعمال می شود و در هر تکرار عناصر ماتریس را به مقدار x کاهش می دهد تا بدین طریق اتصالات سست شکسته شده و اتصالات پایدار و قوی تر باقی بمانند .
تعریف 1 : ماتریس همبستگی فازی(FC) :
ماتریسی n*n می باشد که بوسیله ی ماتریس های عضویت حاصل از اجرای الگوریتم های مختلف فازی بر روی مجموعه داده با c خوشه ایجاد می شود . هر درایه ماتریس همبستگی فازی fc_ij نشان دهنده آن است که نقاط داده ای متناظر با آن با چه درجه ای با یکدیگر هم خوشه می باشند و یا به عبارتی رفتار آنها در قبال خوشه های مختلف چقدر با هم شباهت دارد .
تعریف 2 : ماتریس استحکام (S) :
این ماتریس مجموع همه ی ماتریس های همبستگی فازی حاصل از اجرای الگوریتم ها و متد های مختلف فازی می باشد و هرچه درجه ی هر یک از درایه های آن بیشتر باشد نقاط داده ای متناظر با آن از پایداری و استحکام بیشتری برخوردار می باشد و برعکس هرچه درجه ی یک درایه کمتر باشد اتصال بین نقاط داده ای متناظر با آن ضعیف تر خواهد بود .

موضوعات: بدون موضوع لینک ثابت

فرم در حال بارگذاری ...

فید نظر برای این مطلب