فهرست مطالب
مقدمه
مشکلات کاربران در استفاده ازوب
Web Mining
مراحل وب کاوی
وب کاوی و زمینه های تحقیقاتی مرتبط
وب کاوی و داده کاوی
تفاوت وب کاوی و داده کاوی
وب کاوی و یادگیری ماشین
انواع وب کاوی
چالش های وب کاوی
انواع الگوریتم های وب کاوی
درخت تصمیم
شبکه عصبی
HITS
Page Rank
کاربردهای وب کاوی
Googleو وب و کاوی
Ebay و وب و کاوی
نتیجه گیری
فهرست منابع
مقدمه
وب، محیطی وسیع، متنوع و پویا است که کاربران متعدد اسناد خود را در آن منتشر می کنند. در حال حاضر بیش از دو بیلیون صفحه در وب موجود است و این تعداد با نرخ 7.3 میلیون صفحه در روز افزایش می یابد.
با توجه به حجم وسیع اطلاعات در وب، مدیریت آن با ابزارهای سنتی تقریبا غیر ممکن است و ابزارها و روش هایی نو برای مدیریت آن مورد نیاز است.
با توسعه سیستم های اطلاعاتی، داده به یکی از منابع پراهمیت سازمان ها مبدل گشته است. بنابراین روش ها و تکنیک هایی برای دستیابی کارا به داده، اشتراک داده، استخراج اطلاعات از داده و استفاده از این اطلاعات، مورد نیاز می باشد.
مشکلات کاربران در استفاده ازوب
یافتن اطلاعات مورد نیاز در وب دشوار می باشد و کاربران معمولا از موتورهای جستجو که مهمترین و رایج ترین ابزار برای یافتن اطلاعات در وب می باشند، استفاده میکنند.
اما موتورهای جستجو دارای دو مشکل اصلی هستند.
دقت موتورهای جستجو پایین است، چراکه این موتورها در پاسخ به یک پرس و جوی کاربر صدها یا هزاران سند را بازیابی می کنند .
میزان فراخوان این موتورها کم می باشد، به آن معنی که قادر به بازیابی کلیه اسناد مرتبط با نیاز اطلاعاتی کاربر نیستند. چرا که حجم اسناد در وب بسیار زیاد است و موتورهای جستجو قادر به نگهداری اطلاعات کلیه اسناد وب، در پایگاه داده های خود نمی باشند .
ایجاد دانش جدید با استفاده از اطلاعات موجود در وب
بتوان داده های فراوان موجود در وب را به دانشی قابل استفاده تبدیل کرد، به طوری که یافتن اطلاعات مورد نیاز در آن به سادگی صورت بگیرد .
خصوصی سازی اطلاعات
برای این منظور با توجه به خواسته ها و تمایلات کاربران متفاوت، نحوه ارائه اطلاعات به آنها باید سفارشی گردد.
تکنیک های وب کاوی قادر به حل این مشکلات می باشند.
و..............
فایل پاورپوینت 28 اسلاید