شهرام رهبری
سازوکار گوگل در ارزیابی کیفیت و ارتباط محتوا

سازوکار گوگل در ارزیابی کیفیت و ارتباط محتوا

اصل ماجرا چیه؟  (خلاصه)


گوگل چطور تصمیم میگیره کدوم صفحه رو اول نشون بده؟


گوگل از دو فرآیند جدا اما مرتبط استفاده میکنه:

  • امتیازدهی به ارتباط محتوا با کوئری (Scoring Relevance) 
  • بررسی میکنه که محتوای صفحه چقدر به درخواست کاربر (query) مرتبطه.
  • خروجی: یک عدد (Score) که میزان ارتباط رو نشون میده.
  • این عدد پیوسته (Continuous) هست. مثالً 0.87 یا .0.52

طبقه‌بندی کیفیت محتوا (Quality Classification)

  • بررسی میکنه که کیفیت صفحه چطوره.
  • آیا صفحه اسپم، بیکیفیت یا قابلاعتماد و معتبره؟
  • خروجی: یک برچسب (Label) مثل Quality“ ”High یا Quality“ .”Low
  • این طبقه‌بندی گسسته (Discrete) هست.

چرا گوگل به هر دو نیاز دارد؟
امتیاز مرتبط بودن (Relevance Scoring): صفحه‌هایی را پیدا می‌کند که دقیقاً به موضوع مربوط هستند.
طبقه‌بندی کیفیت محتوا (Quality Classification): قبل از اینکه صفحه به کاربر نشان داده شود، مطمئن می‌شود محتوای اسپم یا بی‌کیفیت حذف شده است.

مثال:

  • یک صفحه کامل درباره‌ی «دیجیتال مارکتینگ» که محتوای اسپم دارد، حتی اگر مرتبط باشد، به خاطر کیفیت پایین حذف می‌شود.
  • یک مقاله عالی و باکیفیت درباره‌ی «دیجیتال مارکتینگ» امتیاز بالایی برای کیفیت می‌گیرد، اما اگر دقیقاً درباره‌ی درخواست کاربر نباشد، امتیاز ارتباطش پایین می‌آید.

خلاصه تفاوت‌ها

 

طبقه بندی کیفیت (Classifier)امتیازدهی ارتباط (Scorer)ویژگی
برچسب دسته‌بندی (ﮔﺴﺴﺘه)امتیاز ارتباط (پیوسته)خروجی (output)
دسته‌بندی کوئری‌ها یا اسنادرتبه‌بندی اسناد بر اساس میزان ارتباطهدف (Purpose)
مدل‌های مورد استفاده (Models Used)BM25، LTR، مدل‌های رتبه‌بندی عصبی (Neural Rankers)SVM، درخت تصمیم (Decision Trees)، BERT
کاربرد (Use Case)رتبه‌بندی نتایج جستجوتشخیص اسپم، طبقه‌بندی موضوعی

 

الگوریتمهای اصلی

الف) الگوریتم‌های Relevance Scoring

  • TF-IDF: هرچه کلمات مهم‌تر باشند، امتیاز بالاتر است.
  • BM25: وزن‌دهی آماری بر اساس فراوانی کلمات.
  • Neural Ranking Models: مانند BERT که به معنی و مفهوم کلمات نیز توجه می‌کند.

 

ب) الگوریتم‌های Quality Classification

  • SVM (Support Vector Machine): جدا کردن صفحات خوب از بد با پیدا کردن «مرز».
  • Decision Trees: دسته‌بندی با استفاده از سؤال و جواب.
  • Deep Learning: شبکه‌های عمیق‌تر برای تحلیل الگوهای پیچیده‌ی کیفیت.

 

مفهوم Learning To Rank (LTR)

 

LTR تکنیکی ترکیبیه که گوگل به شدت ازش استفاده میکنه.
چطور؟

  • از Scoring برای تولید ویژگی (feature) استفاده میکنه.
  • از Classification برای بهینهسازی ترتیب نتایج.
  • از تکنیکهای Pairwise ،Pointwise یا Listwise برای رتبهبندی کل لیست نتایج.

یعنی: LTR همزمان هم به ارتباط و هم به کیفیت توجه میکنه.


معماری چندمرحل‌های (Multi-Stage Pepline)

گوگل برای سرعت و دقت، نتایج جستجو رو طی چند مرحله پاالیش میکنه:

  1. بازیابی اولیه: با الگوریتم‌های ساده مثل .BM25
  2. رنکینگ ثانویه: با مدل‌های سنگین مثل .BERT
  3. فیلتراسیون کیفیت: با Classification .Quality
  4. شخصیسازی: با توجه به تاریخچه و رفتار کاربر.


چه سیگنالهایی برای Classification Quality استفاده میشه؟

چند مثال واقعی از چیزهایی که گوگل بررسی میکنه:

محتوای صفحه:

  • خوانایی :(Readability) منت روانه؟
  • سازگاری گرامری: غلط داره؟
  • کیفیت کلی منت: محتوای ارزشمند داره یا پر از پرکنندهست؟

اعتبار منبع:

  • آیا دامنه معتبره؟
  • آیا نویسنده شناختهشدهست؟
  •  آیا سایت تاریخچه خوبی داره؟

سیگنالهای رفتار کاربر:

  • نرخ کلیک (CTR): آیا کاربران روی این لینک کلیک می‌کنند؟
  • مدت ماندگاری در صفحه (Dwell Time): آیا کاربران مدت طولانی در صفحه می‌مانند؟
  • نرخ خروج سریع (Bounce Rate): آیا کاربران خیلی زود از صفحه خارج می‌شوند؟

سیگنال‌های خارجی:

  1. بکلینک‌های معتبر.


مثال کاربردی

فرض کن دو صفحه برای کوئری “بهترین روش یادگیری سئو:”

 

فاکتورصفحه Aصفحه B
ارتباط با کوئری0.920.80
اعتباربالامتوسط
محتوا صفحهعمیق و تخصصیسطحی و کوتاه
سیگنال‌های کاربرعالی (زمان ماندگاری بالا)متوسط
کیفیت نهاییکیفیت بالاکیفیت متوسط

 

 

نتیجه:

  • گوگل صفحه A رو بالاتر نشون میده، حتی اگر صفحه B هم مرتبط باشه.
  • چرا؟ چون A هم مرتبط‌تره و هم کیفیت بالاتری داره.

جمع‌بندی نهایی

موتورهای جستجو مثل گوگل از دو فرآیند مکمل استفاده میکنن:

  • ارتباط :(Relevance) چقدر محتوا به کوئری نزدیکه.
  • کیفیت :(Quality) چقدر محتوا ارزشمند و قابل اعتماده.

این دو با هم باعث میشن:

  • هم اسپم حذف بشه.
  • هم مرتبطترین نتایج باکیفیت باال بیان اول.


۱. نمودار تصویری: فرآیند Classification Quality + Scoring Relevance در گوگل

 

+-----------------------------------------------------------+
|  User Query: "بهترین روش یادگیری سئو"                     |
+-----------------------------------------------------------+
                           |
                           v
+-----------------------------------------------------------+
|  مرحله 1: بازیابی اولیه (Initial Retrieval)              |
|  مثلاً با BM25                                            |
+-----------------------------------------------------------+
                           |
                           v
+-----------------------------------------------------------+
|  مرحله 2: سنجش ارتباط (Relevance Scoring)                |
|  مثلاً با BERT یا Neural Models                           |
+-----------------------------------------------------------+
                           |
                           v
+-----------------------------------------------------------+
|  مرحله 3: سنجش کیفیت (Quality Classification)            |
|  مثلاً با مدل‌های SVM، درخت تصمیم، شبکه عصبی             |
|  معیارها: E-E-A-T، اعتبار دامنه، تجربه کاربر             |
+-----------------------------------------------------------+
                           |
                           v
+-----------------------------------------------------------+
|  مرحله 4: رتبه‌بندی نهایی                                 |
|  ترکیب کیفیت + ارتباط با مدل‌های LTR                      |
+-----------------------------------------------------------+
                           |
                           v
+-----------------------------------------------------------+
|  نتایج نهایی برای کاربر شخصی‌سازی‌شده هم هستند             |
+-----------------------------------------------------------+

 

 

۲. مثالهای واقعی از دنیای سئو مثال ۱: 

مقایسه دو مقاله درباره Core Web Vitals

فاکتورمقاله A (وبلاگ Moz)مقاله B (وبلاگ ناشناخته)
ارتباط با کوئریCore Web Vitals (بالا)Core Web Vitals (بالا)
کیفیت محتواعمیق و تحقیقاتیکپی از منابع دیگر
اعتبار نویسندهمتخصص شناسخته شدهنویسنده ناشناخته
سیگنال‌های کاربرزمان ماندگاری بالابونس ریت بالا
کیفیت نهاییکیفیت بالاکیفیت پایین

 

 

نتیجه: مقاله Moz باالتر نمایش داده میشه. مثال ۲: مقایسه فروشگاههای آنالین

 

فاکتورفروشگاه A (دیجی‌کالا)فروشگاه B (تازه کار)
ارتباط محصولدقیقا همون محصولدقیقا همون محصول
کیفیت صفحه محصولتوضیحات کامل ، تصاویر اختصاصیتوضیحات معمولی ، تصاویر کپی
اعتبار دامنهبسیار معتبرتازه کار
سیگنال کاربرنرخ کلیک بالابازدید کم
کیفیت نهاییکیفیت بالاکیفیت متوسط

نتیجه: محصول دیجیکاال باالتر میاد حتی اگر قیمتش کمی باالتر باشه.


مثال ۳: مقاله پزشکی

 

فاکتور مقاله A سایت (Medline)مقاله B (بلاگ شخصی)
ارتباطبالابالا
کیفیت علمیمنابع معتبر ، پزشکان متخصصنظر شخصی نویسنده
اعتبار نویسندهپزشک معتبرنویسنده آماتور
کیفیت نهاییکیفیت عالیکیفیت پایین

 

نتیجه: مقاله‌ی Medline بالاتر از بلاگ شخصی نمایش داده می‌شود، چون E-E-A-T قوی‌تری دارد.

 

ابزارهای مفید برای بررسی کیفیت محتوا (Quality Classification)
Google Search Console

بخش Performance: بررسی رفتار کاربران (CTR، Position)

بخش Page Experience: معیارهای Core Web Vitals و تجربه‌ی کاربر

Screaming Frog

بررسی محتوای صفحه (H1، H2، طول متن)

بررسی کیفیت لینک‌های داخلی و خارجی

Semrush / Ahrefs

آنالیز اعتبار دامنه (Domain Authority)

بررسی بک‌لینک‌های معتبر و اسپم

Surfer SEO

بررسی کیفیت محتوای صفحه نسبت به رقبا

پیشنهاد بهبود کیفیت متن (کلمات کلیدی، تعداد کلمات)

Grammarly

بررسی خوانایی و گرامر محتوا

PageSpeed Insights

بررسی تجربه‌ی کاربر از نظر سرعت

ابزارهای Behavioral Analytics (مانند Microsoft Clarity و Hotjar)

ردیابی رفتار کاربر (کلیک، اسکرول، Rage Click)

۴. چطور Quality Classification را بهبود دهیم؟ (چک‌لیست)

 

کارتو.ضیحات
محتوا را تخصصی کنیدنویسنده متخصص، ذکر منابع علمی
تجربه کاربریسریع لود شدن، خوانایی بالا، طراحی خوب
سیگنال‌های کاربربهبود (Ctr) ، کاهش بونس ریت
اعتبار سازی دامنهگرفتن لینک از منابع معتبر
بروز بودن محتوابروزرسانی مرتب اطلاعات محتوا

 

نکته نهایی: ترکیب کیفیت و ارتباط = برد سئو

  • فقط ارتباط محتوا با کوئری کافی نیست.
  • فقط کیفیت محتوا هم کافی نیست.
  • باید هر دو را هم‌زمان بهینه کنی.

گوگل همیشه به دنبال این است که هم مرتبط‌ترین و هم با‌کیفیت‌ترین نتیجه را نشان دهد.

 

چک‌لیست بهینه‌سازی E-E-A-T و Quality Classification
۱. تخصص (Expertise) – تخصص نویسنده و سایت

  • استفاده از نویسنده متخصص در حوزه‌ی مرتبط.
  • نمایش بیوگرافی نویسنده با جزئیات (تحصیلات، سوابق).
  • لینک به پروفایل لینکدین یا منابع معتبر دیگر.
  • نمایش تاریخ انتشار و به‌روزرسانی مقاله.
  • استفاده از منابع و رفرنس‌های معتبر در محتوا (Journal، Research، سایت‌های رسمی).

ابزار کمکی:
Structured Data Markup (Author Schema, Article Schema)

۲.تجربه (Experience) – تجربه‌ی عملی نویسنده

  • اشاره به تجربه‌ی عملی نویسنده (مثلاً «۱۰ سال سابقه‌ی سئو»).
  • آوردن مثال‌های واقعی از پروژه‌های انجام‌شده در محتوا.

تولید محتوای دست‌اول (First-hand Content) مانند:

  • گزارش‌های تحقیقی (Case Study)
  • تحلیل داده‌های واقعی (Data Analysis)

ابزار کمکی:
Google Search Console (برای اثبات تجربه‌ی موفق در پروژه‌های گذشته)

۳. اعتبار (Authoritativeness) – اعتبار سایت و برند

  • ساخت صفحه‌ی «درباره ما» (About Us) با جزئیات کامل.
  • نمایش جوایز، گواهینامه‌ها و افتخارات.
  • لینک گرفتن از سایت‌های معتبر و مرتبط (Backlink Building).
  • ذکر نام برند در مقالات تخصصی، اخبار و منابع معتبر.

ابزار کمکی:
Ahrefs یا Semrush (برای تحلیل اعتبار دامنه و بک‌لینک)

۴. قابل‌اعتماد بودن (Trustworthiness)

  • استفاده از HTTPS و امنیت کامل سایت.
  • شفافیت کامل در تولید محتوا (بدون کلیک‌بیت و فریب).
  • ارائه‌ی اطلاعات تماس شفاف (آدرس، تلفن، ایمیل).
  • نمایش سیاست حفظ حریم خصوصی و شرایط استفاده (Privacy Policy & Terms).

ابزار کمکی:
Security Headers Checker – Google Transparency Report

۵. کیفیت محتوایی (Content Quality)

  • محتوای کامل و عمیق (Comprehensive Content)؛ ۱۰۰٪ پاسخ‌گوی نیاز کاربر.
  • ساختار مناسب (H1، H2، Bullet Points).
  • استفاده از تصاویر، نمودارها و ویدیوهای اختصاصی.
  • بهینه‌سازی خوانایی (Readability) – جملات ساده و روان.
  • بررسی و رفع غلط‌های املایی و نگارشی.

ابزار کمکی:
Surfer SEO (تحلیل کیفیت محتوا)، Grammarly (بررسی غلط‌های املایی)

۶. تعامل کاربر (User Engagement)

  • بررسی نرخ کلیک (CTR) از طریق Google Search Console.
  • تحلیل رفتار کاربر (Scroll Depth، Time on Page).

تشویق کاربران به ماندن در صفحه با:

  • محتوای مرتبط داخلی
  • لینک‌دهی داخلی اصولی
  • بهبود نرخ بازگشت (Bounce Rate).

ابزار کمکی:
Microsoft Clarity یا Hotjar (تحلیل رفتار کاربر)

۷. اعتبار و سیگنال‌های خارجی (Off-Page Signals)

  • لینک گرفتن از منابع معتبر (Edu، Gov، Media).
  • برند منشن بدون لینک (Brand Mentions).
  • فعالیت مستمر در شبکه‌های اجتماعی معتبر.
  • نظرات مثبت کاربران در پلتفرم‌های خارجی (Trustpilot، Google Reviews).

ابزار کمکی:
Ahrefs (تحلیل بک‌لینک‌ها و منشن‌ها)

۸. به‌روز بودن محتوا (Content Freshness)

  • به‌روزرسانی منظم مقالات قدیمی.
  • افزودن داده‌های جدید (آمار ۲۰۲۵، ترندهای جدید).
  • نمایش تاریخ آخرین به‌روزرسانی مقاله.

ابزار کمکی:
Screaming Frog (برای شناسایی صفحات قدیمی)

۹. سیگنال‌های تکنیکال مؤثر در Quality Classification

  • سرعت بالای لود (Core Web Vitals).
  • سازگاری کامل با موبایل (Mobile-Friendly Test).
  • دسترسی آسان برای خزنده‌های گوگل (Crawlability).
  • ساختار URL تمیز و ساده.
  • استفاده از اسکیماهای ساختاریافته (Structured Data).

ابزار کمکی:
PageSpeed Insights – Google Mobile-Friendly Test – Rich Results Test

۱۰. تجربه‌ی نویسنده و برند در خارج از سایت

  • آیا نویسنده در کنفرانس‌های مرتبط حضور داشته است؟
  • آیا مقالاتش در رسانه‌های معتبر منتشر شده‌اند؟
  • آیا برند در رسانه‌های خبری یا علمی حضور دارد؟
  • این موارد تأثیر غیرمستقیم ولی مهمی در اعتبار دارند.

جمع‌بندی نهایی چک‌لیست

 

فاکتوروضعیت
تخصص نویسندهبررسی شود
تجربه علمیبررسی شود
اعتبار برندبررسی شود
اعتماد پذیریبررسی شود
کیفیت محتوابررسی شود
تعامل کاربربررسی شود
اعتبار خارجیبررسی شود
به‌روز بودنبررسی شود
سیگنال‌های فنیبررسی شود
فعالیت خارجی نویسندهبررسی شود

 

ﻣﻘﺎﯾﺴ‌ه‌ی Classification Quality ﺑﺎ Scoring Relevance در ﺳﯿﺴﺘﻢھﺎی ﺑﺎزﯾﺎﺑﯽ اطﻼﻋﺎت

 

ویژگیطبقه‌بندی کیفیتامتیازدهی ارتباط
هدفاطمینان از اینکه اسناد معتبر، غیر اسپم و با کیفیت بالاهستند.تعیین می‌کند که یک سند چقدر با کوئری تطابق دارد. 
خروجیبرچسب‌ها: مثل «کیفیت بالا»، «اسپم» یا «اطلاعات نادرست»امتیاز (Score): در مدل BM25 مقدار امتیاز 8.9 است و در مدل Neural Ranker مقدار 0.76 
نوع مدلمدل‌های طبقه‌بندی (Classifiers): مثل Logistic Regression، SVM و BERTمدل‌های امتیازدهی (Scorers): مانند BM25، TF-IDF، Learning-to-Rank و BERT Rankers
ویژگی‌های کلیدیخوانایی (Readability)، اعتبار (Credibility)، متریک‌های تعامل (Engagement Metrics)، و سیگنال‌های اسپم (Spam Signals)تطابق کلمات (Term Matching)، شباهت کوئری و سند (Query-Document Similarity)،
و سیگنال‌های رفتار کاربر (User Behavior Signals)
کاربردتشخیص اسپم، فیلتر کردن اطلاعات نادرست (Misinformation Filtering)،
و بررسی صحت اخبار (Fact-checking)
رتبه‌بندی جستجو (Search Ranking)،
رتبه‌بندی توصیه‌ها (Recommendation Ranking)،
و نتایج شخصی‌سازی‌شده (Personalized Results)
تاثیر روی بازیابیحذف نتایج بی‌کیفیت قبل از رتبه‌بندی نهایی.تعیین ترتیب نهایی نتایح
نمونه‌های صعنتیتشخیص اسپم در گوگل (Google Spam Detection)،
فیلتر کردن نقدهای جعلی در آمازون (Amazon Fake Review Filtering)،
و بررسی صحت اخبار (News Fact-checking)
رتبه‌بندی جستجوی گوگل و بینگ (Google/Bing Search Ranking)،
رتبه‌بندی توصیه‌ها در یوتیوب (YouTube Recommendations)،
و رتبه‌بندی محصولات در فروشگاه‌های اینترنتی (E-commerce Product Ranking)
یکپارچه‌سازی در سیستمپیش از رتبه‌بندی، برای حذف محتوای بی‌کیفیت استفاده می‌شود.بعد از فیلتر کردن، برای بهینه‌سازی رتبه‌بندی بر اساس ارتباط استفاده می‌شود.