عنوان انگلیسی مقاله: Integration of the extracted data to produce a consistent and coherent database
عنوان فارسی مقاله: یکپارچه سازی داده های استخراجی به منظور ایجاد پایگاه داده منسجم و پایدار.
دسته: فناوری اطلاعات و کامپیوتر
فرمت فایل ترجمه شده: ورد قابل ویرایش word 2003 یا 2007 یا بالاتر (doc یا docx)
تعداد صفحات فایل ترجمه شده: 40
ترجمه سلیس و روان مقاله آماده خرید می باشد.
_______________________________________
چکیده ترجمه:
ما
به بررسی استخراج داده از صفحات وب می پردازیم. داده های استخراج شده در
جداول قرار داده می شود. برای کاربرد، به هر حال، برای کاربرد آن، کافی
نیست تا داده ها را تنها از یک سایت خاص استخراج کنیم. درعوض داده های حاصل
شده از تعداد زیادی از سایت ها به منظور ایجاد خدمات ارزش افزوده گرداوری
می گردد. در چنین مواردی استخراج تنها بخشی از داستان می باشد. بخش دیگر
یکپارچه سازی داده استخراج شده به منظور ایجاد پایگاه داده منسجم و پایدار
می باشد، زیرا سایت های مختلف معمولا از فرمت های داده ای متفاوتی استفاده
می کند. به طور تجربی، یکپارچه سازی به معنی انطباق ستون ها در جداول داده
مختلف می باشد که حاوی انواع مشابهی از اطلاعات می باشند (به عنوان مثال
نام محصول) و منطبق با ارزش هایی می باشند که از نقطه نظر معنایی مشابه
بوده اما در وب سایت های مختلف به طور متفاوتی نشان داده می شوند (برای
نمونه کوک و کوکاکولا).
ادامه مطلب ...