一位研究人员因在未经导师同意的情况下收集课程材料来训练一个聊天机器人而受到批评,他声称这个机器人可以解决麻省理工学院计算机科学学位的作业和考试问题。
这篇备受争议的论文描述了在一个由这所精英大学设定的不同课程中获得的4500个问题数据集上对GPT-4进行训练和测试。
论文的摘要声称:“我们评估了大型语言模型在数学和电气工程与计算机科学等麻省理工学院设置的学科专业的毕业要求上的能力。我们的研究结果表明,GPT-3.5成功学习了麻省理工学院三分之一的课程并达到毕业要求,而GPT-4在排除由于图像导致的一些问题后,通过适当的提示工程完美地实现了所有课程达到毕业要求。”
这篇论文因备受争议的研究方法在随后受到批评,例如,在测试之前,GPT-4已经可以访问课程学习过程中所有问题的答案,并且对答案进行了评分。而在论文上列为共同作者的Armando Solar-Lezama教授,以及第一作者Iddo Drori可能并未事先获得收集这些数据集的许可。
一些在校老师向The Register表示,他们没有与Drori分享他们的课程资料。与此同时,Solar-Lezema告诉我们,他只写了这篇论文的引言,并不知道Drori正在使用这些数据集来训练GPT-4,甚至声称GPT-4已经可以从麻省理工学院获得计算机科学学位。
该论文已经从arXiv撤回,而Drori今天不在麻省理工学院。
美国联邦贸易委员会(FTC)表示,生成式人工智能引发了反垄断担忧。该委员会正在密切关注生成式人工智能的炒作,以确保在这项技术日益渗透社会的过程中,主导者不会扼杀竞争。
美国联邦贸易委员警告称,随着市场不断成熟,企业可能会试图找到控制开发模型所需资源(如数据、硬件和人才)的方法。 他们正在密切关注可能试图通过以更低的价格提供自己的人工智能服务或将客户锁定在自己平台上来打击竞争对手的云服务提供商。与此同时,大型科技公司可能通过收购初创企业来巩固自己的权力,以利用新技术和专业知识。
联邦贸易委员会指出,尽管开源运动可以通过使开发者更容易构建自己的系统来抵消一些这些担忧,但如果软件在没有安全保障措施的情况下普遍提供,该技术仍可能被滥用。
好文章,需要你的鼓励
多伦多大学研究团队提出Squeeze3D压缩框架,巧妙利用3D生成模型的隐含压缩能力,通过训练映射网络桥接编码器与生成器的潜在空间,实现了极致的3D数据压缩。该技术对纹理网格、点云和辐射场分别达到2187倍、55倍和619倍的压缩比,同时保持高视觉质量,且无需针对特定对象训练网络,为3D内容传输和存储提供了革命性解决方案。
浙江大学与腾讯联合研究团队提出MoA异构适配器混合方法,通过整合不同类型的参数高效微调技术,解决了传统同质化专家混合方法中的表征坍塌和负载不均衡问题。该方法在数学和常识推理任务上显著优于现有方法,同时大幅降低训练参数和计算成本,为大模型高效微调提供了新的技术路径。
耶鲁、哥大等四校联合研发的RKEFino1模型,通过在Fino1基础上注入XBRL、CDM、MOF三大监管框架知识,显著提升了AI在数字监管报告任务中的表现。该模型在知识问答准确率提升超过一倍,数学推理能力从56.87%提升至70.69%,并在新颖的数值实体识别任务中展现良好潜力,为金融AI合规应用开辟新路径。
加州大学圣巴巴拉分校研究团队开发出能够自我进化的AI智能体,通过《卡坦岛拓荒者》桌游测试,这些AI能在游戏过程中自主修改策略和代码。实验显示,具备自我进化能力的AI显著超越静态版本,其中Claude 3.7模型性能提升达95%。研究验证了AI从被动工具向主动伙伴转变的可能性,为复杂决策场景中的AI应用开辟新路径。