؛༻♡﷽♡༻ 🖍 چرا باید با اصطلاح متن کاوی آشنا باشیم!؟ ✂️ در چند پست توضیح دادیم که داده کاوی چیست و به چه کار یک پژوهشگر می آید و در پست بعد، خدمت شما بزرگواران کمی از متن کاوی گفتیم که زیر شاخه ای از داده کاوی ست! 🖍 خوب است بدانید ما چند نوع داده یا اطلاعات داریم؛ داده ها 👇 ♧ یا به صورت ساخت یافته (structured) ♧ یا نیمه ساخت یافته (semi-unstructured) ♧ و یا غیر ساخت یافته (unstructured) هستند. ✂️ داده های ساختار یافته همان داده هایی هستند که داخل فایل های اکسل یا دیگر فایل ها به صورت فیلدهای مختلف در سطرها و ستون های جدول می نویسید و قرار می دهید. 🖍 داده ی نیمه ساخت یافته در فايل جدولی مشخص نشده، اما به هر حال دارای ساختاری است که با برچسب هایی از یکدیگر جدا شده اند. ✂️ اما داده های بدون ساخت یافته فرمت مشخصی ندارند. شما نمی توانید آن ها به عنوان یک فیلد اطلاعاتی در سطرها و ستون های جداول جای دهید. متن یک نامه یا یک صفحه از روزنامه یا کتاب، از این نوع داده است. ⛔️ 🖍حتما تا اینجا حدس اید که داده های متنی از چه نوع داده هایی هستند. متن ها از نوع داده های بدون ساختار یافته اند. 🛎 حال...متن کاوی چگونه کار می کند و چرا یک پژوهشگر باید با این شیوه آشنا باشد؟ ✂️ «متن کاوی یا همان پردازش داده های متنی، در واقع فرایند استخراج اطلاعاتِ با کیفیت، از هر گونه متن است». دقت کنید در این تعریف به این نکته اشاره شده است که: “یک پژوهشگر با پردازش داده های بدون ساختار، اطلاعات معنی داری را از متون استخراج می کند.” 🖍 یک پژوهشگر برای متن کاوی 👈 ابزارهای بازیابی اطلاعات، داده کاوی، یادگیری ماشین، آمار و زبان شناسی محاسباتی و ... را بکار می گیرد تا اطلاعات موجود در متن ها را استخراج کرده و در تحقیق و پژوهش خود استفاده کند.  💢💯 ادامه دارد... ┏━━ °•🖌🏷🖍•°━━┓ ✂️ @pajohesh_esfahan ┗━━ °•🖍🏷🖌•°━━┛