؛༻♡﷽♡༻ 🛠اگر آخرین پست مربوط به متن کاوی را مشاهده کرده باشید حتما به خاطر دارید که گفتیم آشنایی با متن کاوی چه ضرورتی برای یک پژوهشگر دارد! 👌 ⚙️در این پست و در ادامه، تعدادی از تکنیک هایی که در متن کاوی مورد استفاده قرار می گیرند را بررسی می کنیم. 🔋دسته بندی متون 🛠یکی از تکنیک‌های متن کاوی، دسته‌ بندی متن ها هستند. در این فرایند متن های به دست آمده از تحقیقات اولیه، به دسته های از پیش مشخص شده اختصاص داده می شوند. فرض کنید تعدادی متن دارید که موضوع هر یک مشخص است. حال متن جدیدی به این متن ها اضافه می شود. با استفاده از الگوریتم های دسته بندی و همچنین داشتن متن های با موضوع مشخص می توان، موضوع متن جدید را پیدا کرد. مثلا تعدادی نظر در مورد فضای مجازی داریم. برخی نظرات نسبت به این فضا مثبت هستند و برخی دیگر منفی.🔞 با استفاده از تکنیک های دسته بندی می توانید، این نظرات را در دسته های مثبت و منفی دسته بندی نمایید. 🔋استخراج اطلاعات 🛠این تکنیک، به فرایند استخراج اطلاعات معنی دار از مقادیر زیاد داده های متنی اشاره دارد. این روش بر روی استخراج اسامی، ویژگی ها و ارتباط آن ها تمرکز دارد. اطلاعات استخراج شده برای دسترسی و بازیابی در آینده، در یک پایگاه داده ذخیره می شود. اثر بخشی و کارایی نتایج بر اساس دقت و صحت آن ها مورد ارزیابی قرار می گیرد. فرض کنید برای یک تحقیق، نیاز باشد اسامی دسته ای از انسان های مرتبط با فضای مجازی، صفات و دیگر ویژگی های این فضا استخراج شود،🚸 با این تکنیک می توان این موارد را استخراج کرد. موتور جستجوی گوگل و یاهو دو تا از مشهورترین سیستم های استخراج اطلاعات هستند. 🔋خوشه بندی 🛠یکی از مهم ترین تکنیک های متن کاوی خوشه بندی است که به دنبال شناسایی ساختارهای درونی در اطلاعات متنی و سازماندهی آن ها در گروه ها یا همان خوشه هاست🍇 تا بتوان آن ها را تجزیه و تحلیل کرد. یکی از چالش های مهم در خوشه بندی، تشکیل خوشه های معنی دار از داده های متنی بدون برچسب و داشتن اطلاعات قبلی در مورد آن هاست. 🔋خلاصه سازی 🛠خلاصه سازی متن اشاره به پردازش خودکار داده ها برای تولید یک متن خلاصه دارد که شامل اطلاعات ارزشمند برای کاربر است.✂️ هدف از این کار، دریافت اطلاعات متنی از چند منبع و خلاصه سازی آن بگونه ای است که مفهوم کلی و منظور متن حفظ شود. 🔋فرکانس کلمات 🛠این تکنیک برای یافتن کلمات پر تکرار در یک متن به کار می رود. این تکنیک می تواند برای موارد متعددی مفید باشد. یک مثال از این کاربرد وقتی است که بیشترین تعداد تکرار کلمات در متن مورد نظر مورد جستجو قرار می گیرد.🗂 مثلا محقق می خواهد بداند واژه "هدایت" چند بار در قرآن به کار رفته است. 💯ادامه دارد... ┏━━ °•🛠⚙️🛠•°━━┓ 🔋@pajohesh_esfahan ┗━━ °•🛠⚙️🛠•°━━┛