德国研究人员进行的一项为期一年的最新研究表明,谷歌搜索确实已经被低质量的SEO垃圾内容所占领。
来自莱比锡大学、魏玛包豪斯大学以及可扩展数据分析与人工智能中心的研究人员们,希望共同破解“谷歌搜索是不是质量下滑了?”的问题。为此,他们在过去一年间观察了谷歌、必应和DuckDuckGo上关于7392条产品评论的搜索结果。
调查发现,总体而言,“排名较高的页面一般搜索优化度更高,往往属于软文营销范畴,而且呈现出文本质量较低的迹象……我们发现,软文营销虽然只占网络总信息量的一小部分,但在搜索结果中的比例却明显更高。”
他们还发现,垃圾网站也一直在努力在谷歌搜索中夺取更高的排名。垃圾网站会想方设法揣摩排名规则,登上谷歌搜索的优先显示条目,之后再被官方清理。研究人员们写道,“SEO已经成为一场旷日持久的拉锯战,随着搜索引擎和SEO工程师不断调整己方参数,垃圾评论也表现出快速崛起、又被快速清理的重复循环。”
他们指出,谷歌、必应和DuckDuckGo一直在定期调整搜索算法以删除彻头彻尾的垃圾内容。但在这场对抗中,此类举措只能带来“暂时性的积极效果”。
在研究人员们看来,“搜索引擎似乎渐渐在这场猫鼠游戏中不敌SEO垃圾内容。”而且值得注意的是,谷歌、必应和DuckDuckGo都没能解决这个问题。另外根据研究人员的统计,多数情况下谷歌搜索的表现仍好于必应和DuckDuckGo。
研究人员们警告称,随着AI生成垃圾内容的出现,这场搜索排名之争可能会进一步白热化,甚至威胁到搜索引擎的未来命运。“随着生成式AI的出现,内容和链接农场形式的良性内容与垃圾软广之间的界线正变得愈发模糊。我们的结论是,必须要对这种依托于AI技术的低质量、大规模商业内容产出行为抱有足够的重视,否则与垃圾内容的对抗将以失败告终。”
过去几个月来,搜索引擎优化在网络和搜索中造成的破坏性作用一直是个备受争议的话题。此前The Verge曾经多次开展调查,并指定搜索引擎优化正在摧毁互联网生态。去年12月底,Search Engine Land发现谷歌“连续数天被大规模垃圾发布攻击所吞没。”与此同时,搜索引擎优化行业也在整体尝试、或者正在使用生成式AI进一步增强自身内容产出能力,希望在人类撰写的公式化垃圾之外探索新的“创造力”空间。必应和谷歌目前也在推出AI生成搜索结果。纵观整个行业动向,最终结果很可能是由SEO机器人编写大量文章来博取审核机器人的优待,届时搜索服务的可用性则将进一步恶化。
研究人员们写道:“相当一部分社交媒体用户分享了自己的观察结果,发现搜索引擎越来越无法用真实有用的内容满足他们的信息需求。根据报告,大量低质量内容、特别是产品搜索内容,已经在软文营销等垃圾信息的冲击下几乎不再可见。”
这也印证了研究人员们的调查结论。确实有相当一部分搜索词条被低质量、毫无营养的SEO内容所占据,其中相当一部分似乎正是由AI辅助或者纯AI所生成。
研究人员最后总结道:“我们发现商业搜索引擎结果页面中的大多数高级产品评论都属于软文营销,其中很大一部分甚至是彻头彻尾的SEO垃圾内容。我们还发现,搜索引擎排名与软文营销之间存在很强的关联性,搜索结果也出现了简陋化、重复化和AI生成化的总体趋势。”
好文章,需要你的鼓励
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。