德国研究人员进行的一项为期一年的最新研究表明,谷歌搜索确实已经被低质量的SEO垃圾内容所占领。
来自莱比锡大学、魏玛包豪斯大学以及可扩展数据分析与人工智能中心的研究人员们,希望共同破解“谷歌搜索是不是质量下滑了?”的问题。为此,他们在过去一年间观察了谷歌、必应和DuckDuckGo上关于7392条产品评论的搜索结果。
调查发现,总体而言,“排名较高的页面一般搜索优化度更高,往往属于软文营销范畴,而且呈现出文本质量较低的迹象……我们发现,软文营销虽然只占网络总信息量的一小部分,但在搜索结果中的比例却明显更高。”
他们还发现,垃圾网站也一直在努力在谷歌搜索中夺取更高的排名。垃圾网站会想方设法揣摩排名规则,登上谷歌搜索的优先显示条目,之后再被官方清理。研究人员们写道,“SEO已经成为一场旷日持久的拉锯战,随着搜索引擎和SEO工程师不断调整己方参数,垃圾评论也表现出快速崛起、又被快速清理的重复循环。”
他们指出,谷歌、必应和DuckDuckGo一直在定期调整搜索算法以删除彻头彻尾的垃圾内容。但在这场对抗中,此类举措只能带来“暂时性的积极效果”。
在研究人员们看来,“搜索引擎似乎渐渐在这场猫鼠游戏中不敌SEO垃圾内容。”而且值得注意的是,谷歌、必应和DuckDuckGo都没能解决这个问题。另外根据研究人员的统计,多数情况下谷歌搜索的表现仍好于必应和DuckDuckGo。
研究人员们警告称,随着AI生成垃圾内容的出现,这场搜索排名之争可能会进一步白热化,甚至威胁到搜索引擎的未来命运。“随着生成式AI的出现,内容和链接农场形式的良性内容与垃圾软广之间的界线正变得愈发模糊。我们的结论是,必须要对这种依托于AI技术的低质量、大规模商业内容产出行为抱有足够的重视,否则与垃圾内容的对抗将以失败告终。”
过去几个月来,搜索引擎优化在网络和搜索中造成的破坏性作用一直是个备受争议的话题。此前The Verge曾经多次开展调查,并指定搜索引擎优化正在摧毁互联网生态。去年12月底,Search Engine Land发现谷歌“连续数天被大规模垃圾发布攻击所吞没。”与此同时,搜索引擎优化行业也在整体尝试、或者正在使用生成式AI进一步增强自身内容产出能力,希望在人类撰写的公式化垃圾之外探索新的“创造力”空间。必应和谷歌目前也在推出AI生成搜索结果。纵观整个行业动向,最终结果很可能是由SEO机器人编写大量文章来博取审核机器人的优待,届时搜索服务的可用性则将进一步恶化。
研究人员们写道:“相当一部分社交媒体用户分享了自己的观察结果,发现搜索引擎越来越无法用真实有用的内容满足他们的信息需求。根据报告,大量低质量内容、特别是产品搜索内容,已经在软文营销等垃圾信息的冲击下几乎不再可见。”
这也印证了研究人员们的调查结论。确实有相当一部分搜索词条被低质量、毫无营养的SEO内容所占据,其中相当一部分似乎正是由AI辅助或者纯AI所生成。
研究人员最后总结道:“我们发现商业搜索引擎结果页面中的大多数高级产品评论都属于软文营销,其中很大一部分甚至是彻头彻尾的SEO垃圾内容。我们还发现,搜索引擎排名与软文营销之间存在很强的关联性,搜索结果也出现了简陋化、重复化和AI生成化的总体趋势。”
好文章,需要你的鼓励
两家公司在OverdriveAI峰会上分享了AI应用经验。Verizon拥有超过1000个AI模型,用于预测客户呼叫原因和提供个性化服务,将AI推向边缘计算。Collectors则利用AI识别收藏品真伪,将每张卡片的鉴定时间从7分钟缩短至7秒,估值从8.5亿美元增长至43亿美元。
阿布扎比科技创新研究院团队首次发现大语言模型生成的JavaScript代码具有独特"指纹"特征,开发出能够准确识别代码AI来源的系统。研究创建了包含25万代码样本的大规模数据集,涵盖20个不同AI模型,识别准确率在5类任务中达到95.8%,即使代码经过混淆处理仍保持85%以上准确率,为网络安全、教育评估和软件取证提供重要技术支持。
Hammerspace发布v5.2数据平台软件,通过更快的元数据读取、更好的数据放置和扩展性优化提升AI数据访问性能。新版本IO500总分提升33.7%,总带宽翻倍,IOR-Hard-Read测试提升超800%。增加了Tier 0亲和性功能,支持GPU服务器本地存储访问,减少集群内网络流量。新增Oracle云支持、Kerberos认证和标签化NFS,提供更细粒度的访问控制。该软件将于12月正式发布。
斯坦福大学研究团队首次系统比较了人类与AI在文本理解任务中的表现。通过HUME评估框架测试16个任务发现:人类平均77.6%,最佳AI为80.1%,排名第4。人类在非英语文化理解任务中显著优于AI,而AI在信息处理任务中更出色。研究揭示了当前AI评估体系的缺陷,指出AI的高分往往出现在任务标准模糊的情况下。