You are here:

صحبتی با توسعه دهندگان وب و تولید کنندگان محتوای فارسی

فرستادن به ایمیل چاپ

Tags: تجربیات | تخصصی | وب

برای یکی از سایتهایی که در حال طراحی آن هستیم نیاز به خواندن اخبار از سایتهای معروف خبری دنیا داریم . سوال اصلی که هنگام بررسی یک آدرس وب برای برنامه نویسان پیش می آید این است که چگونه عکس یک خبر را تشخیص دهیم ؟ چگونه توصیف خلاصه آنرا به دست آوریم ؟ نویسنده اصلی مطلب کیست ؟ و سوالاتی از این دست که خیلی اوقات از روشهای مکاشفه ای برای پاسخ دادن به آنها استفاده می کنیم . برای توضیح اینکه ممکن است در آن صفحه عکسهای مختلفی وجود داشته باشد از لوگوی سایت گرفته تا عکس های تبلیغی و غیر مرتبط .  حال برای عکس خبر تصمیم می گیریم  عکسی که بین خود خبر قرار گرفته است را ملاک قرار دهیم به عنوان یک روش مکاشفه ای . به شرطی که بتوان ابتدا و انتهای خبر را درست تشخیص داد و عکس هم بین خبر باشد اگر غیر این باشد باز کار مشکل می شود.یا اینکه برای به دست آوردن خلاصه خبر روش مکاشفه ای می تواند لحاظ کردن یک یا دو پاراگراف اول خبر باشد  اما یک روش بهینه و درست نخواهد بود .

با بررسی هایی که انجام دادیم دیدیم چند سالیست که که قراردادی به نام «گراف باز» در بین تولیدکنندگان محتوی و اخبار در دنیا به کار می رود. ایده اصلی این پروتکل را گوگل ارایه داده است با این توصیف که به هر صفحه وب به شکل یک شی نگاه می کنیم در دنیایی از گراف های به هم مرتبط (صفحات وب) . با این ترتیب هر صفحه وب باید حداقل چهار خصوصیت اصلی را برای توصیف خود داشته باشد :

og:title

og:type

og:image

og:url

نحوه استفاده و تعریف آنرا می توانید با این مثال ببینید :

<html prefix="og: http://ogp.me/ns#">
<head>
<title>The Rock (1996)</title>
<meta property="og:title" content="The Rock" />
<meta property="og:type" content="video.movie" />
<meta property="og:url" content="http://www.imdb.com/title/tt0117500/" />
<meta property="og:image" content="http://ia.media-imdb.com/images/rock.jpg" />
...
</head>
...
</html>

با این ترتیب هنگام بررسی یک صفحه کافیست اگر نیاز به عنوان یا عکس یا نوع صفحه و محتوای آن داریم به این برچسب ها دقت کنیم و اینکار دقت کاوشهای ما را و همچنین دقت خزنده وب یا همان کراولر را بسیار بالا خواهد برد. لیست برچسب هایی «گراف باز» بسیار بیشتر ازاین هاست و می توانید با مراجعه به سایت اصلی آن محتوای غنی تری را در اختیار موتورهای جستجو و خزندگان وب قرار دهید .

دیشب بسیاری از سایتهای خبری فارسی را بررسی کردم و متاسفانه تمام آنها از این رهیافت استفاده نمی کنند رهیافتی که سود اصلی آنرا خود آنها خواهند برد . در بین سایتهای فارسی حوزه فناوری اطلاعات هم فقط سایت نردبان و نارنجی را دیدم که این برچسب ها در اخبار خود گنجانده اند .

به امید روزی که طراحان ما و تولیدکنندگان محتوی علاوه بر ظاهر و خود محتوی به نحوه تعامل سایتهای جستجوگر و داده کاوی هم دقت کنند.

نظرات (1)Add Comment
0
بسیار ساده در عین حال بسیار کاربردی
نویسنده سید محمد مهدی احمدیان زاده, اوت 16, 2013
این تکنولوژی ساده کمک بسیار زیادی به کسانی می کنه که براشون مهمه تا به کلیه ایتم های مرتبط به یک خبر دسترسی پیدا کنن.. در واقع نگاه کردن به یک خبر به عنوان یک ابجکت که کلیه عناصر مرتبط با اون به عنوان خصوصیات اون ابجکت هستند به راحتی این امکان رو فراهم می کنه تا از میان انبوه ایتم های موجود در هر صفحه، ایتمهای مرتبط با هم رو به خوبی تشخیص دهیم ...

نظرتان را بنویسید
کوچکتر | بزرگتر

busy
آخرین بروزرسانی ( پنجشنبه ، 24 مرداد 1392 ، 15:24 )