از هر دسته یک میانگین می گیریم (مثل حساب کردن معدل دانش اموزان)
واینبار نقاط قرمز و سبز را به نقطه میانگین جابجا میکنیم
حالا باید دوباره فاصله همه اعداد از دو رنگ قرمز و سبز را دوباره محاسبه کنیم
و دوباره اطلاعات را دسته بندی کنیم
مثلا ماشین شماره ۱ اینبار از گروه سبز خارج می شود و به گروه قرمز می پیوندد
حالا دوباره باید میانگین گیری برای هر دسته انجام شود و دوباره دسته بندی جدید صورت گیرد
نکته
کار میانگین گیری و جابجایی نقاط را تا زمانی باید تکرار کرد که دیگه اعضای هر دسته هیچ تغییر نکند.
انچه که در این مثال به عنوان علمی که ماشین یا گرفته در نظر گرفته می شود
اطلاعات دونقطه قرمز و سبز هست
یعنی هر ماشین جدیدی که داشته باشیم با این دوتا نقطه مقایسه می شود و به هرکدوم نزدیک تر بود جزو همان گروه قرار می گیره
و این بود کل مفهوم الگوریتم kmeans
تعداد نقاط که باید یادگرفته شود را k
می گویند و چون دائم میانگین گیری صورت میگیرد به ان means هم اضافه شده
خوب برای اینکه مطالب فراموشتان نشود
یه خلاصه از مطالب امروز جمع بندی کنیم
یادگیری بدون نظارت 👈 الگوریتم kmeans
الگوریتم kmeans نیاز به یک ورودی دارد تعداد دسته ها ( k )
انچه که باید یاد بگیرد 👈 میانگین های نهایی هر دسته هست ( means )
روش پیش بینی 👈 فاصله داده جدید را با میانگین ها بدست میاورد
📕نکته:
داده های مثال ما ۲ بُعدی بودند
یعنی طول و ارتفاع هر ماشین، یک داده بود.
اما می توان تعداد ابعاد را زیاد کرد مثلا
عرض، وزن، تعداد چرخ، رنگ ، شکل قسمت بار، صندوق، کاپوت و...