صحبتی با توسعه دهندگان وب و تولید کنندگان محتوای فارسی

by مجتبی بنائی - پنجشنبه 24 مرداد 1392 - گروه : تخصصی - مشاهده : 5
برچسب‌ها: #تخصصی‌نرم‌افزار #تجربیات #تخصصی #وب

s: تجربیات | تخصصی | وب برای یکی از سایتهایی که در حال طراحی آن هستیم نیاز به خواندن اخبار از سایتهای معروف خبری دنیا داریم . سوال اصلی که هنگام بررسی یک آدرس وب برای برنامه نویسان پیش می آید این است که چگونه عکس یک خبر را تشخیص دهیم ؟ چگونه توصیف خلاصه آنرا به دست آوریم ؟ نویسنده اصلی مطلب کیست ؟ و سوالاتی از این دست که خیلی اوقات از روشهای مکاشفه ای برای پاسخ دادن به آنها استفاده می کنیم . برای توضیح اینکه ممکن است در آن صفحه عکسهای مختلفی وجود داشته باشد از لوگوی سایت گرفته تا عکس های تبلیغی و غیر مرتبط .  حال برای عکس خبر تصمیم می گیریم  عکسی که بین خود خبر قرار گرفته است را ملاک قرار دهیم به عنوان یک روش مکاشفه ای . به شرطی که بتوان ابتدا و انتهای خبر را درست تشخیص داد و عکس هم بین خبر باشد اگر غیر این باشد باز کار مشکل می شود. یا اینکه برای به دست آوردن خلاصه خبر روش مکاشفه ای می تواند لحاظ کردن یک یا دو پاراگراف اول خبر باشد  اما یک روش بهینه و درست نخواهد بود . با بررسی هایی که انجام دادیم دیدیم چند سالیست که که قراردادی به نام « گراف باز » در بین تولیدکنندگان محتوی و اخبار در دنیا به کار می رود. ایده اصلی این پروتکل را گوگل ارایه داده است با این توصیف که به هر صفحه وب به شکل یک شی نگاه می کنیم در دنیایی از گراف های به هم مرتبط (صفحات وب) . با این ترتیب هر صفحه وب باید حداقل چهار خصوصیت اصلی را برای توصیف خود داشته باشد : og:title og:type og:image og:url نحوه استفاده و تعریف آنرا می توانید با این مثال ببینید : The Rock (1996) ... ... با این ترتیب هنگام بررسی یک صفحه کافیست اگر نیاز به عنوان یا عکس یا نوع صفحه و محتوای آن داریم به این برچسب ها دقت کنیم و اینکار دقت کاوشهای ما را و همچنین دقت خزنده وب یا همان کراولر را بسیار بالا خواهد برد. لیست برچسب هایی «گراف باز» بسیار بیشتر ازاین هاست و می توانید با مراجعه به سایت اصلی آن محتوای غنی تری را در اختیار موتورهای جستجو و خزندگان وب قرار دهید . دیشب بسیاری از سایتهای خبری فارسی را بررسی کردم و متاسفانه تمام آنها از این رهیافت استفاده نمی کنند رهیافتی که سود اصلی آنرا خود آنها خواهند برد . در بین سایتهای فارسی حوزه فناوری اطلاعات هم فقط سایت نردبان و نارنجی را دیدم که این برچسب ها در اخبار خود گنجانده اند . به امید روزی که طراحان ما و تولیدکنندگان محتوی علاوه بر ظاهر و خود محتوی به نحوه تعامل سایتهای جستجوگر و داده کاوی هم دقت کنند.

Comments