تبیان، دستیار زندگی
با توجه به گسترش روز افزون اطلاعات در وب و نیازهای جدید به وجود آمده، محققان به این نتیجه رسیده اند که با استفاده از تکنیک های کنونی مورد استفاده در وب، نیازهای انسان ها به طور کامل پاسخ داده نمی شود.
عکس نویسنده
عکس نویسنده
بازدید :
زمان تقریبی مطالعه :

سرآغازی بر وب معنایی


با توجه به گسترش روز‌افزون اطلاعات در وب و نیازهای جدید به وجود آمده، محققان به این نتیجه رسیده‌اند که با استفاده از تکنیک‌های کنونی مورد استفاده در وب، نیازهای انسان به‌طور کامل پاسخ داده نمی‌شود.

در وب کنونی ذخیره سازی و انتشار اطلاعات با سهولت انجام می شود اما این نوع ذخیره سازی مشکلات زیادی را برای بازیابی و استفاده های بعدی از اطلاعات به وجود آورده است. وب معنایی به عنوان یک راه حل برای این مشکلات به وجود آمده است که هدف از آن به اشتراک گذاشتن اطلاعات در وب به صورتی هوشمندتر است به صورتی که نه تنها قابل برای انسان باشند، بلکه ماشین ها نیز توانایی فهم آن را داشته باشند.

سرآغازی بر وب معنایی

آقای Tim Berners Lee که معروف به پدر وب است، آینده وب را به صورتی بیان کرده که بر خلاف وب کنونی فقط توسط انسان ها قابل فهم نباشد بلکه توسط ماشین ها نیز قابل درک و پردازش است. ایده وب معنایی نیز از همین نکته منشا می گیرد.

زبان نشانه گذاری HTML یک زبان آزاد و بدون ساختار است. بدین معنی که در HTML محتوای متنی صفحه ی وب و بر چسب های وب در هم مخلوط هستند و دست طراح وب برای استفاده از برچسب های وب و درج هرگونه متن دلخواه در هر کجای صفحه باز است. به عنوان مثال فرض کنید در یک صفحه وب، قیمت، شماره و نام تعدادی کالا درج شده باشد. فقط کاربر می تواند با مشاهده لیست حدس بزند که کدام قسمت منظور نام کالاست و کدام قسمت قیمت کالا. این درحالیست که از دیدگاه یک برنامه نرم افزاری تمام این فیلدها یک رشته در هم تنیده متنی هستند و تفکیک آنها از یکدیگر چندان ساده نیست. به عبارتی ماهیت و نوع اطلاعات جاسازی شده در یک صفحه ی وب مشخص نیست و همه از نوع متن ساده هستند.

در وب کنونی ذخیره‌سازی و انتشار اطلاعات با سهولت انجام می‌شود اما این نوع ذخیره‌سازی مشکلات زیادی را برای بازیابی و استفاده‌های بعدی از اطلاعات به‌وجود آورده است. وب معنایی به عنوان یک راه‌حل برای این مشکلات به‌وجود آمده است

این قضیه کار را برای موتورهای جستجو دشوار می کند. چرا که وقتی کاربر دنبال یک نام کالا می گردد موتور جستجو مجبور است محتوای سرتاسر صفحات وب را بگردد و هر کلمه ای که با نام مورد نظر کاربر مطابقت داشت را به عنوان نتیجه برگرداند. در ضمن مطمئن نیست که آیا کلمه ای که با نام مورد نظر کاربر تطبیق دارد واقعا نام کالاست یا کلمه ای مشابه است که در خصوص موضوعی دیگر در جایی از صفحه ی وب ظاهر شده است.

در یک جمله مختصر؛ در صفحات html رشته های متنی صرفا متنی هستند و ماهیت آنها مشخص نیست.

کنسرسیوم جهانی وب، w3c، برای ساختار دادن به صفحات html استاندارد جدیدی وضع کرد که به کمک آن می توان ماهیت داده های متنی یک صفحه ی وب را مشخص کرد تا کار پردازش خودکار صفحات وب ساده تر شود.

کنسرسیوم وب در استاندارد جدید دو زبان مکمل و همراه تعریف کرده است. زبان اول XML است که محتویات صفحه وب را به صورت ساختاریافته توصیف می کند. زبان دوم XSL است که در حقیقت شیوه نمایش محتویات یک فایل XML را مشخص می کند.

سرآغازی بر وب معنایی

XHTML یا HTML توسعه یافته

بر اساس اظهارات کنسرسیوم جهانی وب، HTML 4  آخرین نسخه ی فراگیر و جهانی HTML خواهد بود در عوض نسخه پنجم زبان HTML با عنوان XHTML معرفی شده است که در حقیقت بازنویسی و فرموله سازی HTML طبق قواعد XML است.

مثلا در این زبان تگ


که در HTML وجود داشت، هیچ معنایی ندارد مگر آنکه در یک فایل XSL به درستی توصیف شده باشد.

XHTML برخلاف HTML سختگیر و دقیق است و انعطاف زیادی از خود نشان نمی دهد چرا که قرار بوده XHTML به معنای واقعی کلمه قابلیت جا به جایی PORTABILITY و عدم وابستگی به نرم افزار یا سخت افزار داشته باشد تا بتوان از آن در دستگاه هایی مثل تلفن های همراه و PDA نیز استفاده کرد و اگر قرار باشد این زبان از خود انعطاف نشان بدهد کار مرورگر را در تفسیر و نمایش چنین فایل هایی مشکل می کند و منجر به حجیم و پیچیده تر شدن نرم افزار مرورگر و بروز اشکالات ناخواسته می شود.

فاطمه مجدآبادی

بخش دانش و زندگی تبیان


منابع:

An introduction to semantic web / a.aleahmad

Internet engineering / E.Malekian

Computer network

A top-down approach / Kurose & Ross