انفجار ابزار هوش مصنوعی در سال گذشته به طور چشمگیری بر بازاریابان دیجیتال، به ویژه آنهایی که در سئو هستند، تأثیر گذاشته است . با توجه به ماهیت زمان‌بر و پرهزینه تولید محتوا، بازاریابان برای کمک به هوش مصنوعی روی آورده‌اند که نتایج متفاوتی را به همراه داشته است.

با وجود مسائل اخلاقی، یک سوال که بارها و بارها مطرح می شود این است که “آیا موتورهای جستجو می توانند محتوای هوش مصنوعی من را شناسایی کنند؟” این سوال بسیار مهم تلقی می شود زیرا اگر پاسخ “خیر” باشد، بسیاری از سوالات دیگر در مورد اینکه آیا و چگونه باید از هوش مصنوعی استفاده شود بی اعتبار می شود.

در حالی که فراوانی ایجاد محتوای تولید شده توسط ماشین یا به کمک آن بی سابقه است، اما کاملاً جدید نیست و همیشه منفی نیست. برای وب‌سایت‌های خبری، ابتدا انتشار اخبار ضروری است و آنها مدت‌هاست که از داده‌های منابع مختلف مانند بازارهای سهام و لرزه‌سنج‌ها برای سرعت بخشیدن به تولید محتوا استفاده می‌کنند.

گوگل استفاده از زنجیره‌های مارکوف را برای تولید متن به محتوای کم تلاش برای سال‌ها تحت عنوان «صفحاتی که به‌طور خودکار تولید می‌شوند که ارزش افزوده‌ای ارائه نمی‌دهند» محکوم کرده است . چیزی که به ویژه جالب است و برای برخی بیشتر یک نقطه سردرگمی یا یک منطقه خاکستری است، معنای “بدون ارزش افزوده” است.

چگونه LLM ها می توانند ارزش اضافه کنند؟

محبوبیت محتوای هوش مصنوعی به دلیل توجهی که توسط مدل‌های زبان بزرگ GPTx (LLM) و چت ربات هوش مصنوعی به‌خوبی تنظیم شده، ChatGPT  که تعامل مکالمه را بهبود بخشید، افزایش یافت. بدون پرداختن به جزئیات فنی، چند نکته مهم در مورد این ابزار وجود دارد:

ChatGPT  نوعی هوش مصنوعی مولد است

این بدان معنی است که خروجی قابل پیش بینی نیست. یک عنصر تصادفی وجود دارد، و ممکن است به همان درخواست متفاوت پاسخ دهد. وقتی به این دو نکته توجه کنید، مشخص می‌شود که ابزارهایی مانند ChatGPT هیچ دانش سنتی ندارند یا چیزی «دانستند». این کاستی اساس همه خطاها یا به اصطلاح آنها “توهم” است. خروجی های مستند متعدد نشان می دهد که چگونه این رویکرد می تواند نتایج نادرستی ایجاد کند و باعث شود که ChatGPT به طور مکرر با خود تناقض داشته باشد.

این امر با توجه به احتمال توهمات مکرر، تردیدهای جدی را در مورد سازگاری «افزایش ارزش» با متن نوشته شده با هوش مصنوعی ایجاد می کند.  علت اصلی در نحوه تولید متن در LLM نهفته است که بدون رویکرد جدید به راحتی قابل حل نخواهد بود. این یک ملاحظات حیاتی است، به‌ویژه برای موضوعات پول، زندگی شما (YMYL)، که در صورت نادرست بودن می‌تواند به مالی یا زندگی افراد آسیب برساند.

نشریات بزرگی مانند Men’s Health و CNET در حال انتشار اطلاعات واقعی نادرست تولید شده توسط هوش مصنوعی در سال جاری دستگیر شدند که این نگرانی را برجسته می کند. ناشران با این مشکل تنها نیستند، زیرا Google در مهار محتوای جستجوی مولد تجربه (SGE) خود با محتوای YMYL مشکل داشته است.

علی‌رغم اینکه گوگل اعلام کرده است که در پاسخ‌های تولید شده مراقب خواهد بود و تا آنجا پیش می‌رود که به طور خاص مثالی ارائه می‌کند که «پاسخی به سؤالی در مورد دادن Tylenol به کودک نشان نمی‌دهد زیرا در فضای پزشکی است»، SGE  به وضوح این کار را انجام می‌دهد .

SGE  و MUM گوگل

واضح است که گوگل معتقد است مکانی برای محتوای تولید شده توسط ماشین برای پاسخگویی به سوالات کاربران وجود دارد. گوگل از ماه می ۲۰۲۱ به این موضوع اشاره کرده است، زمانی که MUM، مدل یکپارچه چند وظیفه ای خود را معرفی کرد. یکی از چالش‌هایی که MUM قرار بود با آن مقابله کند، بر اساس داده‌هایی بود که افراد به‌طور میانگین برای کارهای پیچیده هشت درخواست ارسال می‌کنند .

در یک پرس و جو اولیه، جستجوگر برخی اطلاعات اضافی را یاد می گیرد، که جستجوهای مرتبط را تحریک می کند و صفحات وب جدیدی را برای پاسخ به این سؤالات ظاهر می کند. گوگل پیشنهاد داد: اگر آنها بتوانند پرس و جو اولیه را انجام دهند، سؤالات بعدی کاربران را پیش بینی کنند و با استفاده از دانش فهرست خود پاسخ کامل را ایجاد کنند، چه؟

اگر کارساز بود، در حالی که این رویکرد ممکن است برای کاربر فوق العاده باشد، اساسا بسیاری از استراتژی های کلیدواژه «دم بلند» یا با حجم صفر را که SEO ها برای به دست آوردن جای پایی در SERP به آنها متکی هستند، از بین می برد. با فرض اینکه گوگل بتواند پرس و جوهای مناسب برای پاسخ های تولید شده توسط هوش مصنوعی را شناسایی کند، بسیاری از سوالات را می توان “حل شده” در نظر گرفت.  این سوال را ایجاد می کند… چرا گوگل صفحه وب شما را با یک پاسخ از پیش تولید شده به جستجوگر نشان می دهد در حالی که می تواند کاربر را در اکوسیستم جستجوی خود نگه دارد و خودش پاسخ را ایجاد کند؟

گوگل انگیزه مالی برای نگه داشتن کاربران در اکوسیستم خود دارد. ما رویکردهای مختلفی را برای رسیدن به این هدف دیده‌ایم، از قطعه‌های برجسته گرفته تا اجازه دادن به مردم برای جستجوی پروازها در SERP . فرض کنید گوگل فکر می کند متن تولید شده شما ارزشی بیش از آنچه که قبلا می تواند ارائه دهد، ارائه نمی دهد. در آن صورت، این موضوع صرفاً به یک موضوع هزینه در مقابل سود برای موتور جستجو تبدیل می‌شود. آیا آنها می توانند در دراز مدت با جذب هزینه تولید و منتظر ماندن کاربر برای پاسخ در مقابل ارسال سریع و ارزان کاربر به صفحه ای که می دانند قبلاً وجود دارد، درآمد بیشتری ایجاد کنند؟

تشخیص محتوای هوش مصنوعی

همراه با افزایش استفاده از  ChatGPT، ده‌ها « ردیاب محتوای هوش مصنوعی » به وجود آمد که به شما امکان می‌دهد محتوای متنی را وارد کنید و امتیاز درصدی را دریافت کنید مشکل در اینجاست. اگرچه تفاوت هایی در نحوه برچسب گذاری این درصد درصد توسط آشکارسازهای مختلف وجود دارد، اما تقریباً همیشه خروجی یکسانی را ارائه می دهند: درصد اطمینان از اینکه کل متن ارائه شده توسط هوش مصنوعی تولید شده است.

این منجر به سردرگمی زمانی می‌شود که بر این درصد برچسب زده شود، به عنوان مثال، “۷۵٪ هوش مصنوعی / ۲۵٪ انسان”. بسیاری از مردم این را به اشتباه متوجه می شوند که «متن ۷۵ درصد توسط هوش مصنوعی و ۲۵ درصد توسط یک انسان نوشته شده است»، در حالی که به این معنی است که «۷۵ درصد مطمئن هستم که یک هوش مصنوعی ۱۰۰ درصد این متن را نوشته است».

این سوء تفاهم باعث شده است که برخی توصیه هایی در مورد نحوه تغییر ورودی متن به منظور عبور از یک آشکارساز هوش مصنوعی ارائه دهند.  به عنوان مثال، استفاده از یک علامت تعجب دوتایی (!!) یک ویژگی بسیار انسانی است، بنابراین افزودن آن به برخی از متن‌های تولید شده توسط هوش مصنوعی باعث می‌شود که یک آشکارساز هوش مصنوعی امتیاز «۹۹%+ انسان» را بدهد.  سپس این به اشتباه تعبیر می شود که شما آشکارساز را “فریب داده اید”.

اما این نمونه ای از کارکرد کامل آشکارساز است زیرا مسیر ارائه شده دیگر ۱۰۰٪ توسط هوش مصنوعی ایجاد نمی شود. متأسفانه، این نتیجه‌گیری گمراه‌کننده مبنی بر «فریب دادن» آشکارسازهای هوش مصنوعی معمولاً با موتورهای جستجو مانند گوگل که محتوای هوش مصنوعی را شناسایی نمی‌کنند، به صاحبان وب‌سایت‌ها احساس امنیت کاذب می‌دهد.

سیاست ها و اقدامات گوگل در مورد محتوای هوش مصنوعی

اظهارات گوگل در مورد محتوای هوش مصنوعی از لحاظ تاریخی به اندازه کافی مبهم بوده است که به آنها اجازه می دهد تا در مورد اجرای آن فکر کنند. با این حال، راهنمای به‌روزرسانی‌شده امسال در Google Search Central منتشر شد که به صراحت می‌گوید:  تمرکز ما بر کیفیت محتواست، نه اینکه چگونه محتوا تولید می شود.

مبارزه با دستکاری SERP چیزی است که گوگل سال‌ها در آن تجربه دارد و ادعا می‌کند که پیشرفت‌های سیستم‌های آن‌ها، مانند SpamBrain، ۹۹٪ جستجوها را بدون هرزنامه تبدیل کرده است ، که شامل هرزنامه  UGC، scraping، cloaking و تمام اشکال مختلف محتوا می‌شود. بسیاری از مردم تست هایی را انجام داده اند تا ببینند گوگل چگونه به محتوای هوش مصنوعی واکنش نشان می دهد و کیفیت را در کجا ترسیم می کنند.

قبل از راه‌اندازی ChatGPT، من یک وب‌سایت با ۱۰۰۰۰ صفحه محتوا ایجاد کردم که عمدتاً توسط یک مدل GPT3 بدون نظارت تولید می‌شد و به مردم نیز درباره بازی‌های ویدیویی سؤال می‌کردم. با کمترین لینک، سایت به سرعت ایندکس شد و به طور پیوسته رشد کرد و هزاران بازدید کننده ماهانه ارائه داد. طی دو به‌روزرسانی سیستم Google در سال ۲۰۲۲، به‌روزرسانی محتوای مفید و به‌روزرسانی بعدی هرزنامه ، Google  به طور ناگهانی و تقریباً به طور کامل سایت را سرکوب کرد. با این حال، این به من نشان داد که در آن زمان خاص، گوگل:

  • محتوای GPT-3 بدون نظارت را به عنوان «کیفیت» طبقه‌بندی نمی‌کرد.
  • می تواند چنین نتایجی را با تعداد زیادی سیگنال دیگر شناسایی و حذف کند.

برای دریافت پاسخ نهایی، به یک سوال بهتر نیاز دارید. بر اساس دستورالعمل های گوگل، آنچه ما در مورد سیستم های جستجو، آزمایش های سئو و عقل سلیم می دانیم، “آیا موتورهای جستجو می توانند محتوای هوش مصنوعی را شناسایی کنند؟” احتمالا سوال اشتباهی است. در بهترین حالت، این یک دیدگاه بسیار کوتاه مدت است.

در اکثر موضوعات، LLM ها برای تولید مداوم محتوای “با کیفیت بالا” از نظر دقت واقعی و رعایت معیارهای EEAT گوگل ، با وجود داشتن دسترسی زنده به وب برای اطلاعات فراتر از داده های آموزشی، تلاش می کنند. هوش مصنوعی گام‌های مهمی در ایجاد پاسخ‌هایی برای پرسش‌هایی که قبلاً محتوای کمی داشتند، برداشته است. اما از آنجایی که گوگل به دنبال اهداف بلندمدت بلندتری با SGE است، این روند ممکن است کمرنگ شود.  انتظار می‌رود که تمرکز به محتوای تخصصی با فرم طولانی‌تر بازگردد و سیستم‌های دانش Google به جای هدایت کاربران به سایت‌های کوچک متعدد، پاسخ‌هایی را برای پاسخگویی به بسیاری از سوالات طولانی ارائه می‌دهند.

انتهای مطلب/ منبع