کاوش داده روی وب :
کاوش داده روی وب یک چالش اصلی در مواجه با مدیریت داده و همچنین مدیریت اطلاعات وب و Machine learning میباشد.
داده ها و اطلاعات زیادی در وب وجود دارد ،که استخراج داده ی مفید و مناسب برای کاربران یک چالش واقعی است. هنگامی که کاربران در حال جستجو در وب هستند وب میتواند کاملا رام باشد و کاربران داده ی مورد نیاز خود را خیلی زود به دست آورند.
سوال اینجاست که چگونه این داده به اطلاعات تبدیل میشود؟ و آیا اطلاعاتی که کاربران بدست میآورند همان چیزی است که آنها میخواهند؟ به علاوه راه استخراج اطلاعات ناشناخته گذشته از داده در وب چیست؟ در این قسمت ما به توضیح انواع مختلف web mining ميپردازیم.
یکی از راه حلهای ساده کامل کردن ابزار داده کاوی با خود داده است. این موضوع را توسط شکل شماره 2 روشن تر میسازیم. این راه حل خوبی است مخصوصا اگر داده درون یک پایگاه داده رابطهای باشد. بنابراین یکی از احتیاجات استخراج داده از پایگاه دادههای رابطهای ،ابزارهای داده کاوی میباشد. این ابزارها باید واسط وب را توسعه دهند. برای مثال اگر یک interface رابطهای آماده شود، ابزارهای کاوش SQL-based میتوانند به پایگاه دادههای رابطه ای متصل شوند.