انفجار ابزار هوش مصنوعی در سال گذشته به طور چشمگیری بر بازاریابان دیجیتال، به ویژه آنهایی که در سئو هستند، تأثیر گذاشته است . با توجه به ماهیت زمانبر و پرهزینه تولید محتوا، بازاریابان برای کمک به هوش مصنوعی روی آوردهاند که نتایج متفاوتی را به همراه داشته است.
با وجود مسائل اخلاقی، یک سوال که بارها و بارها مطرح می شود این است که “آیا موتورهای جستجو می توانند محتوای هوش مصنوعی من را شناسایی کنند؟” این سوال بسیار مهم تلقی می شود زیرا اگر پاسخ “خیر” باشد، بسیاری از سوالات دیگر در مورد اینکه آیا و چگونه باید از هوش مصنوعی استفاده شود بی اعتبار می شود.
در حالی که فراوانی ایجاد محتوای تولید شده توسط ماشین یا به کمک آن بی سابقه است، اما کاملاً جدید نیست و همیشه منفی نیست. برای وبسایتهای خبری، ابتدا انتشار اخبار ضروری است و آنها مدتهاست که از دادههای منابع مختلف مانند بازارهای سهام و لرزهسنجها برای سرعت بخشیدن به تولید محتوا استفاده میکنند.
گوگل استفاده از زنجیرههای مارکوف را برای تولید متن به محتوای کم تلاش برای سالها تحت عنوان «صفحاتی که بهطور خودکار تولید میشوند که ارزش افزودهای ارائه نمیدهند» محکوم کرده است . چیزی که به ویژه جالب است و برای برخی بیشتر یک نقطه سردرگمی یا یک منطقه خاکستری است، معنای “بدون ارزش افزوده” است.
چگونه LLM ها می توانند ارزش اضافه کنند؟
محبوبیت محتوای هوش مصنوعی به دلیل توجهی که توسط مدلهای زبان بزرگ GPTx (LLM) و چت ربات هوش مصنوعی بهخوبی تنظیم شده، ChatGPT که تعامل مکالمه را بهبود بخشید، افزایش یافت. بدون پرداختن به جزئیات فنی، چند نکته مهم در مورد این ابزار وجود دارد:
ChatGPT نوعی هوش مصنوعی مولد است
این بدان معنی است که خروجی قابل پیش بینی نیست. یک عنصر تصادفی وجود دارد، و ممکن است به همان درخواست متفاوت پاسخ دهد. وقتی به این دو نکته توجه کنید، مشخص میشود که ابزارهایی مانند ChatGPT هیچ دانش سنتی ندارند یا چیزی «دانستند». این کاستی اساس همه خطاها یا به اصطلاح آنها “توهم” است. خروجی های مستند متعدد نشان می دهد که چگونه این رویکرد می تواند نتایج نادرستی ایجاد کند و باعث شود که ChatGPT به طور مکرر با خود تناقض داشته باشد.
این امر با توجه به احتمال توهمات مکرر، تردیدهای جدی را در مورد سازگاری «افزایش ارزش» با متن نوشته شده با هوش مصنوعی ایجاد می کند. علت اصلی در نحوه تولید متن در LLM نهفته است که بدون رویکرد جدید به راحتی قابل حل نخواهد بود. این یک ملاحظات حیاتی است، بهویژه برای موضوعات پول، زندگی شما (YMYL)، که در صورت نادرست بودن میتواند به مالی یا زندگی افراد آسیب برساند.
نشریات بزرگی مانند Men’s Health و CNET در حال انتشار اطلاعات واقعی نادرست تولید شده توسط هوش مصنوعی در سال جاری دستگیر شدند که این نگرانی را برجسته می کند. ناشران با این مشکل تنها نیستند، زیرا Google در مهار محتوای جستجوی مولد تجربه (SGE) خود با محتوای YMYL مشکل داشته است.
علیرغم اینکه گوگل اعلام کرده است که در پاسخهای تولید شده مراقب خواهد بود و تا آنجا پیش میرود که به طور خاص مثالی ارائه میکند که «پاسخی به سؤالی در مورد دادن Tylenol به کودک نشان نمیدهد زیرا در فضای پزشکی است»، SGE به وضوح این کار را انجام میدهد .
SGE و MUM گوگل
واضح است که گوگل معتقد است مکانی برای محتوای تولید شده توسط ماشین برای پاسخگویی به سوالات کاربران وجود دارد. گوگل از ماه می ۲۰۲۱ به این موضوع اشاره کرده است، زمانی که MUM، مدل یکپارچه چند وظیفه ای خود را معرفی کرد. یکی از چالشهایی که MUM قرار بود با آن مقابله کند، بر اساس دادههایی بود که افراد بهطور میانگین برای کارهای پیچیده هشت درخواست ارسال میکنند .
در یک پرس و جو اولیه، جستجوگر برخی اطلاعات اضافی را یاد می گیرد، که جستجوهای مرتبط را تحریک می کند و صفحات وب جدیدی را برای پاسخ به این سؤالات ظاهر می کند. گوگل پیشنهاد داد: اگر آنها بتوانند پرس و جو اولیه را انجام دهند، سؤالات بعدی کاربران را پیش بینی کنند و با استفاده از دانش فهرست خود پاسخ کامل را ایجاد کنند، چه؟
اگر کارساز بود، در حالی که این رویکرد ممکن است برای کاربر فوق العاده باشد، اساسا بسیاری از استراتژی های کلیدواژه «دم بلند» یا با حجم صفر را که SEO ها برای به دست آوردن جای پایی در SERP به آنها متکی هستند، از بین می برد. با فرض اینکه گوگل بتواند پرس و جوهای مناسب برای پاسخ های تولید شده توسط هوش مصنوعی را شناسایی کند، بسیاری از سوالات را می توان “حل شده” در نظر گرفت. این سوال را ایجاد می کند… چرا گوگل صفحه وب شما را با یک پاسخ از پیش تولید شده به جستجوگر نشان می دهد در حالی که می تواند کاربر را در اکوسیستم جستجوی خود نگه دارد و خودش پاسخ را ایجاد کند؟
گوگل انگیزه مالی برای نگه داشتن کاربران در اکوسیستم خود دارد. ما رویکردهای مختلفی را برای رسیدن به این هدف دیدهایم، از قطعههای برجسته گرفته تا اجازه دادن به مردم برای جستجوی پروازها در SERP . فرض کنید گوگل فکر می کند متن تولید شده شما ارزشی بیش از آنچه که قبلا می تواند ارائه دهد، ارائه نمی دهد. در آن صورت، این موضوع صرفاً به یک موضوع هزینه در مقابل سود برای موتور جستجو تبدیل میشود. آیا آنها می توانند در دراز مدت با جذب هزینه تولید و منتظر ماندن کاربر برای پاسخ در مقابل ارسال سریع و ارزان کاربر به صفحه ای که می دانند قبلاً وجود دارد، درآمد بیشتری ایجاد کنند؟
تشخیص محتوای هوش مصنوعی
همراه با افزایش استفاده از ChatGPT، دهها « ردیاب محتوای هوش مصنوعی » به وجود آمد که به شما امکان میدهد محتوای متنی را وارد کنید و امتیاز درصدی را دریافت کنید مشکل در اینجاست. اگرچه تفاوت هایی در نحوه برچسب گذاری این درصد درصد توسط آشکارسازهای مختلف وجود دارد، اما تقریباً همیشه خروجی یکسانی را ارائه می دهند: درصد اطمینان از اینکه کل متن ارائه شده توسط هوش مصنوعی تولید شده است.
این منجر به سردرگمی زمانی میشود که بر این درصد برچسب زده شود، به عنوان مثال، “۷۵٪ هوش مصنوعی / ۲۵٪ انسان”. بسیاری از مردم این را به اشتباه متوجه می شوند که «متن ۷۵ درصد توسط هوش مصنوعی و ۲۵ درصد توسط یک انسان نوشته شده است»، در حالی که به این معنی است که «۷۵ درصد مطمئن هستم که یک هوش مصنوعی ۱۰۰ درصد این متن را نوشته است».
این سوء تفاهم باعث شده است که برخی توصیه هایی در مورد نحوه تغییر ورودی متن به منظور عبور از یک آشکارساز هوش مصنوعی ارائه دهند. به عنوان مثال، استفاده از یک علامت تعجب دوتایی (!!) یک ویژگی بسیار انسانی است، بنابراین افزودن آن به برخی از متنهای تولید شده توسط هوش مصنوعی باعث میشود که یک آشکارساز هوش مصنوعی امتیاز «۹۹%+ انسان» را بدهد. سپس این به اشتباه تعبیر می شود که شما آشکارساز را “فریب داده اید”.
اما این نمونه ای از کارکرد کامل آشکارساز است زیرا مسیر ارائه شده دیگر ۱۰۰٪ توسط هوش مصنوعی ایجاد نمی شود. متأسفانه، این نتیجهگیری گمراهکننده مبنی بر «فریب دادن» آشکارسازهای هوش مصنوعی معمولاً با موتورهای جستجو مانند گوگل که محتوای هوش مصنوعی را شناسایی نمیکنند، به صاحبان وبسایتها احساس امنیت کاذب میدهد.
سیاست ها و اقدامات گوگل در مورد محتوای هوش مصنوعی
اظهارات گوگل در مورد محتوای هوش مصنوعی از لحاظ تاریخی به اندازه کافی مبهم بوده است که به آنها اجازه می دهد تا در مورد اجرای آن فکر کنند. با این حال، راهنمای بهروزرسانیشده امسال در Google Search Central منتشر شد که به صراحت میگوید: تمرکز ما بر کیفیت محتواست، نه اینکه چگونه محتوا تولید می شود.
مبارزه با دستکاری SERP چیزی است که گوگل سالها در آن تجربه دارد و ادعا میکند که پیشرفتهای سیستمهای آنها، مانند SpamBrain، ۹۹٪ جستجوها را بدون هرزنامه تبدیل کرده است ، که شامل هرزنامه UGC، scraping، cloaking و تمام اشکال مختلف محتوا میشود. بسیاری از مردم تست هایی را انجام داده اند تا ببینند گوگل چگونه به محتوای هوش مصنوعی واکنش نشان می دهد و کیفیت را در کجا ترسیم می کنند.
قبل از راهاندازی ChatGPT، من یک وبسایت با ۱۰۰۰۰ صفحه محتوا ایجاد کردم که عمدتاً توسط یک مدل GPT3 بدون نظارت تولید میشد و به مردم نیز درباره بازیهای ویدیویی سؤال میکردم. با کمترین لینک، سایت به سرعت ایندکس شد و به طور پیوسته رشد کرد و هزاران بازدید کننده ماهانه ارائه داد. طی دو بهروزرسانی سیستم Google در سال ۲۰۲۲، بهروزرسانی محتوای مفید و بهروزرسانی بعدی هرزنامه ، Google به طور ناگهانی و تقریباً به طور کامل سایت را سرکوب کرد. با این حال، این به من نشان داد که در آن زمان خاص، گوگل:
- محتوای GPT-3 بدون نظارت را به عنوان «کیفیت» طبقهبندی نمیکرد.
- می تواند چنین نتایجی را با تعداد زیادی سیگنال دیگر شناسایی و حذف کند.
برای دریافت پاسخ نهایی، به یک سوال بهتر نیاز دارید. بر اساس دستورالعمل های گوگل، آنچه ما در مورد سیستم های جستجو، آزمایش های سئو و عقل سلیم می دانیم، “آیا موتورهای جستجو می توانند محتوای هوش مصنوعی را شناسایی کنند؟” احتمالا سوال اشتباهی است. در بهترین حالت، این یک دیدگاه بسیار کوتاه مدت است.
در اکثر موضوعات، LLM ها برای تولید مداوم محتوای “با کیفیت بالا” از نظر دقت واقعی و رعایت معیارهای EEAT گوگل ، با وجود داشتن دسترسی زنده به وب برای اطلاعات فراتر از داده های آموزشی، تلاش می کنند. هوش مصنوعی گامهای مهمی در ایجاد پاسخهایی برای پرسشهایی که قبلاً محتوای کمی داشتند، برداشته است. اما از آنجایی که گوگل به دنبال اهداف بلندمدت بلندتری با SGE است، این روند ممکن است کمرنگ شود. انتظار میرود که تمرکز به محتوای تخصصی با فرم طولانیتر بازگردد و سیستمهای دانش Google به جای هدایت کاربران به سایتهای کوچک متعدد، پاسخهایی را برای پاسخگویی به بسیاری از سوالات طولانی ارائه میدهند.
انتهای مطلب/ منبع