至顶网个人商用频道 09月18日 北京消息 9月11-9月13日,首届北京国际语言文化博览会(以下简称语博会)在京举行,作为本次大会的首席战略合作伙伴,中译语通科技(北京)有限公司(以下简称中译语通(GTCOM))全程深度参与。9月12日举行的语博会“语言科技与人类福祉”国际语言文化论坛上,中译语通(GTCOM)CEO于洋发表题为“人工智能时代的语言科技创新”的主旨演讲。回顾中译语通(GTCOM)五年来的发展进程,以及对如何构建语言科技、语言服务新生态的思考,并解读中译语通(GTCOM)在人工智能时代契机下的语言科技创新之力。
传承历史到砥砺前行
语言是文化的象征,而文化则离不开传承,关于语言的话题从来没有像今天这样如此丰富。从文化到经济、从政治到军事、从现实到虚拟,在科技领域作为人工智能核心的语言智能引领潮流。中译语通(GTCOM)则在这样的契机下,运势而生。于洋用数据解读了这5年来中译语通(GTCOM)的发展轨迹。
2014年中译语通(GTCOM)发布了机器翻译,随着技术的跃升,目前中译语通(GTCOM)在机器翻译领域已扩展到32种语言,992种语言方向,每天访问量超过了1.5亿次,而通过机器翻译进行大数据的运算,一天超过200亿次,也就是说机器翻译每天要翻译4000亿次,这些数字的背后是依托亿万级语料库、强大的技术研发实力及40余年的优秀管理运营经验的积淀。2015年,中译语通(GTCOM)首创跨语言大数据概念,发起语言大数据联盟(LBDA),当前联盟在全球已经拥有167所高校和语言研究院所的加入。
随着互联网的深入,大数据、人工智能时代的到来,则让中译语通(GTCOM)拥有更大的展现舞台,并在短时间内完成从语言服务企业到跨语言大数据提供商的华丽战略转型,打造出译云语言科技生态、译见大数据技术生态两大核心生态,当人们还沉浸于大数据、人工智能带来的思维颠覆时,中译语通(GTCOM)已站在了“巨人的肩膀上”。
构建语言科技、语言服务新生态
随后于洋侧重讲述了对语言科技、语言服务新生态构建的思考。在新生态下,机器翻译将起到“连接器”的作用。目前中译语通(GTCOM)可以承载每天3000万+篇网页数据,5亿+的社交数据日更新,多达65+种语言,以及EB级全球互联网开放性文本及多媒体数据。于洋提出,如果能把所有的语言符号去除“语言”的外壳,“化身”为可分析的结构化数据后,经过分析和解构,我们能清晰的看到这些数据点绘制出的一幅数据地图,挖掘数据背后的奥秘,将会爆发出更大价值。
正如于洋所谈到的那样,未来跨越语言、跨越时间的海量数据,将成为人工智能纵深发展的驱动力。在今天,我们讲的人工智能,它只是一种算法、一种技术,而数据则会贯穿始终。一年前人们的认知停留在算法秒杀一切,在今年,人们更多看到的是数据升级下的巨大潜能。当我们拥有了海量的、高质量的数据时,数据就足以秒杀算法。
未来,中译语通(GTCOM)将继续深耕大数据应用领域,致力于推动语言科技、语言创新服务的融合发展,通过跨语言大数据和AI认知技术的发展,打破语言壁垒,大大提升科研能力和认知范畴,这无疑将对语言服务行业带来巨大影响力。同时机器学习技术在机器翻译上的应用也赋予冰冷的机器思考的能力,正如本次论坛主题所阐述的那样,以语言科技之名,创新人类福祉,最终让AI+大数据+语言科技认知智能的场景化应用变得触手可及。
好文章,需要你的鼓励
施耐德电气以“新质服务+产业向‘新’行”为主题,第六次参会,展示全新升级的“新质服务体系”,围绕创新驱动、生态协同和行业赋能三大核心领域,以全新升级的“新质服务体系”,助力中国产业向高端化、智能化、绿色化迈进。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
甲骨文正在成为大规模基础设施供应商的可靠选择。该公司通过AI技术推动应用开发,构建GenAI模型并将智能代理集成到应用套件中。CEO萨弗拉·卡茨透露,公司剩余履约义务达4553亿美元,同比增长4.6倍,并预测OCI收入将从2026财年的180亿美元增长至2030财年的1440亿美元。甲骨文正积极布局AI推理市场,凭借其作为全球最大企业私有数据托管方的优势地位,有望在云计算领域实现重大突破。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。