دانلود پایان نامه

– روش تحلیل خوشه­ای

تجزیه و تحلیل خوشه­ای، یک روش آماری برای گروه­بندی داده­ها یا مشاهدات، با توجه به شباهت یا درجه نزدیکی آن­ها است. از طریق تجزیه و تحلیل خوشه­ای داده­ها یا مشاهدات به دسته­های همگن و متمایز از هم تقسیم می­شوند. از این روش برای بخش­بندی کردن مشتریان بر مبنای شباهت­هایشان استفاده می-شود. غالباً در تحلیل خوشه­ای، تصمیم-گیری درباره تعداد خوشه­ها بر مبنای ملاک بیزی و ملاک آکائیکه گرفته می­شود. جوابی در سطح حد اقل ملاک بیزی و ملاک آکائیکه به دست می­آید، می­تواند معرف بهترین تعادل موجود بین دقت و پیچیدگی باشد که مهم­ترین تاثیرات را در نظر بگیرد و اهمیت آن-ها را کم نشان ندهد. همچنین، راه دیگر برای تصمیم-گیری در زمینه تعداد خوشه­ها، استفاده از نسبت فاصله می-باشد. بهینه­ترین تعداد خوشه­ها هنگامی است که تغییری بزرگ در نسبت فاصله مشاهده می-گردد.

اصطلاح تحلیل خوشه­ای اولین بار توسط Tryon در سال ۱۹۳۹ برای روش­های گروه­بندی اشیائی که شبیه بودند مورد استفاده قرار گرفت. تجزیه خوشه­ای ابزار میانبر تحلیل داده­ها­ست که هدف آن نظم دادن به اشیا مختلف به گروه­هایی که درجه ارتباط بین دو شی اگر آن­ها به یک گروه تعلق داشته باشند حداکثر و در غیر این صورت حداقل است. به عبارت دیگر تحلیل خوشه­ای ساختار داده­ها را بدون توضیح اینکه چه وجود دارد را نشان می­دهد.

تحلیل خوشه­ای یک ابزار اکتشاف است و نتایج آن ممکن است:

  • در تعریف یک طرح طبقه­بندی مانند رده­بندی حیوانات، حشرات یا گیاهان مفید باشد.
  • قواعدی برای اختصاص موارد جدید به طبقه­ها به منظور شناسایی و تشخیص به دست دهد.
  • حدود تعریف، اندازه و تنوغ و تعریف برای آنچه قبلا به شکل مفاهیم وسیعی بوده است، فراهم آورد.
  • نمونه­هایی برای معرفی طبقه­ها بیاید.
  • مدل آماری برای توصیف جامعه ارائه دهد.

مفاهیم فاصله و تشابه از مفاهیم اساسی تحلیل خوشه­ای است. فاصله اندازه‌ای است که نشان می­دهد دو مشاهده تا چه حد جدا از یکدیگرند. در حالی­که تشابه شاخص نزدیکی آن­ها با یکدیگر است. پژوهشگر قبل از تحلیل، نخست باید یک مقیاس کمی را که بر پایه همخوانی(تشابه) بین مشاهده­‌ها اندازه گرفته می­شود را انتخاب کند. این شاخص­ها با توجه به الگوریتم تشکیل خوشه، ماهیت متغیر ها(پیوسته، گسسته یا دو ارزشی) و مقیاس اندازه­گیری انتخاب می­شوند. در این پژوهش طبقه­بندی شرکت­های بورس اوراق بهادار تهران از لحاظ شاخص-های دهگانه پژوهش مورد تحلیل قرار می­گیرد. خوشه‌بندي را مي‌توان به عنوان مهم­ترين مسئله در يادگيري بدون نظارت در نظر گرفت. خوشه‌بندي با يافتن يک ساختار درون يک مجموعه از داده‌­هاي بدون برچسب درگير است. خوشه‌ به مجموعه‌اي از داده‌ها گفته مي‌شود که به هم شباهت داشته باشند. در خوشه­‌بندي سعي مي‌شود تا داده­ها به خوشه‌هايي تقسيم شوند که شباهت بين داده­هاي درون هر خوشه حداکثر و شباهت بين داده‌هاي درون خوشه‌هاي متفاوت حداقل شود. درون خوشه­بندی هیچ دسته­ای از قبل وجود ندارد و در واقع متغیرها به صورت مستقل و وابسته تقسیم نمی­شوند. بلکه ما در اینجا بدنبال گروه­هایی از داده­ها هستیم که به هم شباهت دارند و با کشف این شباهت­ها می توان رفتارها را بهتر شناسایی کرد و بر مبنای آن­ها طوری عمل کرد که نتیجه بهتری حاصل شود.

دانلود پایان نامه