DeepL发展史：一家初创公司与机器翻译巨头的抗争

机器翻译越来越好用，但外语学习还是不能停。

AI翻译颠覆了我们的沟通方式，也以前所未有的方式打破了语言沟通障碍。预计到2026年，该行业的全球市场规模将增长至123亿美元，而无数参与者都希望能从中分得一杯羹。

而总部位于德国科隆的DeepL，却凭借着初创身份与谷歌、微软等科技巨头一路竞逐，不断提高着机器翻译的行业标准。

这家年轻企业的首款产品是在线词典Linguee，自计算机科学家Jarek Kutylowski兼公司CEO于2017年创立以来始终保持高速发展。

Kutylowski出生于波兰，12岁时移居德国，刚转学时甚至一句德语都不会说。这让年少的他第一次认识到语言的重要性，以及跨语言交流的巨大难度。

时间快进到2017年，他创立DeepL的初衷，是意识到神经网络这项突破性技术有望以前所未有的方式彻底攻克难题。他表示：“我们猜测机器翻译应该会朝着这个方向发展，也相信这项技术将发挥巨大作用。看准了这个机会，我们鼓起勇气想要创造一些伟大的成果。”

神经机器翻译（NMT）就是基于神经网络的翻译技术，已经成为迄今为止最为成功的机器翻译方法。与之前的版本相比，这项技术更快、更准确、资源占用更少也更易于扩展。

DeepL使用该技术提供免费的高质量翻译服务，且主要面向B2B市场。自公司成立以来，他们已经服务了10亿以上的用户，目前拥有超过2万家企业客户，其中不乏爱思唯尔、富士通和Mastodon等知名公司。

Kutylowski解释道：“翻译对企业来说至关重要。现如今，越来越多的企业开始走向全球以开拓海外市场，希望能在更广大的疆土上吸引客户、创造价值。”

而对翻译的主要需求，集中在那些涉及大量许可证的行业，比如法律服务。“通过观察，我们发现这也是客群需求最强烈的领域。”

截至目前，DeepL已经支持横跨欧亚大陆的31种语言。2023年，公司推出AI写作助手，也成功跻身独角兽行列。尽管融资环境严峻，该公司还是在1月筹集到一笔数额不明的资金（估计为1亿美元），目前市场估值达到10亿欧元。

“世界上最好的”机器翻译服务

DeepL自信地宣称，能够提供“世界上最好的”AI翻译服务。而且与竞争对手的产品相比，该公司的方案质量更高，平均准确率高达3倍。

自信满满的口号源自“盲测”结果，即由专业翻译人员在不知文本来源的前提下挑选准确率最高的翻译结果。

通过一系列测试和实验，我发现DeepL的表现确实名列前茅。我首先输入了加缪《局外人》小说中的一段话，并分别用DeepL和谷歌翻译将其从法语翻译成英语。

尽管文学类文本并不属于这些工具的主要设计用途，但我还是决定从这个角度入手，毕竟纯文学对AI系统来说肯定更有难度。

可以想见，文学翻译相当复杂，依靠的不止有对语言的熟悉程度。其中还涉及更高水平的创造力，对于作者观点、文风和社会历史背景的深刻理解，同时要能在不同文化间实现语义转换。

从续订来看，DeepL的表现远远优于谷歌。虽然它还是遗漏了一些隐喻性表达，在某些意指和常识上也犯了错误，但最终文本读起来确实更接近原文的表述。

我用自己的一篇文章进行了重复测试，希望复查翻译工具是否确切表达了我说的意思。这一次，任务是把英语文章翻译成希腊语。

下面来看DeepL的翻译结果：

再看看谷歌的翻译结果：

这次DeepL的表现仍然更好。尽管仍在几处纰漏，但它的希腊语翻译结果更细致、更自然，也更符合原文的含义。我知道很多朋友可能看不懂希腊语，所以大家可以随便找点文字自己测试一下，看我说的对不对。

Kutylowski认为，在不“阉割”的前提下用目标语言表达正确的含义，首先得在准确性和流畅性之间找到适当的平衡。而这在很大程度上要视语境而定。比如说，技术文档对于准确性要求更高，而营销文本则更多强调流畅性。

尽管面临挑战，但他坚信AI有能力掌握哪怕最复杂的语言。他补充道：“如果突然出现某种需要我们学习的外星语言，那么只要有足够的翻译材料作为支撑，我们没准同样能训练出相应的翻译模型。”

DeepL的优势是什么？

Kutylowski对于市场竞争似乎毫不担心。他强调，“我们一直都在跟大厂竞争”，还提到谷歌翻译仍是DeepL目前最大的竞争对手。

在他看来，这家初创公司的优势可以归结为三大要素的结合：努力工作、优秀团队还有专心一意。

“专心一意非常非常重要。翻译并不是谷歌的核心业务，只能算他们上百种服务中的一种。同样的标准放在大语言模型和OpenAI方面也是一样，翻译只是他们关注的一个方向，他们必须把GPU分散在各种各样不同的任务上。但我们只专注单一特定领域。”

从技术角度来看，DeepL的成功则源自其神经网络架构、人类编辑的输入还有训练数据。

这家初创公司根据大量数据（主要来自互联网）进行模型训练，并使用特殊的网络爬虫来自动查找翻译并评估内容质量。他们还使用强化学习等方法向AI提供积极反馈，引导其不断提升翻译水平。

Kutylowski还补充道，另一个重点是在模型的翻译能力和用目标语言构成句子之间寻找适当的平衡。“为此，我们在单语数据模型训练和目标翻译模型训练方面投入了大量精力，数学团队则负责处理大量细节。”

机器翻译：新挑战，也是新机遇

Kutylowski承认，近期对于AI热潮的广泛关注主要源自大语言模型（LLM），这也让整体环境变得更具挑战、节奏更快。

DeepL团队现在必须跟上发展的脚步：新模型层出不穷，开源项目所在多有，学术研究和其他公司的成果都需要关注。

“如今的机器翻译已经掀起一波竞赛”，那要靠怎样的策略才能在这场比赛中胜出？

在Kutylowski看来，一方面当然是不断创新，确保采取正确的步骤来实现高质量翻译目标。另外就是适当投资，确保找到合适的资本和技术团队。

但与此同时，人们对于AI的关注和呈指数级增长的发展速度也带来了新的技术机遇。“有些事情我们在两、三年前就考虑过，但当时的技术还不够成熟。”

比如说贴合企业风格的个性化翻译和更具交互性的翻译体验。DeepL还开始研究票据翻译，并从头开始训练自己的大语言模型。这在一定程度上要归功于他们新的超级计算机集群DeepL Mercury。

这些大模型有望进一步提高翻译质量，并为用户带来新的交互工作流程。更多功能和应用选项将在2024年内陆续推出。

我们还需要学外语吗？

机器翻译既帮助更多人克服了跨语种沟通障碍，同时也提出了新的问题：既然AI翻译这么出色，未来我们是不是就没必要学习外语了？

Kutylowski的回答是：“随着AI的普遍进步，我觉得全人类都需要认真思考一个问题：我们需要学什么，我们想要学什么？”

他认为如果单纯是为了在异国他乡工作和生活，那随着科技的发展演进，学习语言的必要性确实会逐渐降低，但这并不代表学习外语的价值也将随之下降。

他以数学为例，提到虽然在现实生活中我们根本用不到在学校里接触过的大部分复杂方程，但学习数学的过程仍然非常重要，甚至可以说是培养理性思考能力的根基。

语言学习也是如此。在学习一门语言的过程中，我们实际也是在学习如何形成思维和表达观点——这对每个人的发展都至关重要。学习外语、特别是掌握跨语种思维能力，对于个人乃至整个社会都有着深远的积极意义。

研究表明，学习第二语言实际会改变大脑结构。具体来讲，它增加了灰质密度（对应大脑中的神经元数量）和白质完整性（即连接大脑中不同区域的神经纤维系统）。也就是说，学习外语不仅可以增强大脑整体功能，还有助于提高记忆力、注意力、集中力和其他关键认知能力。

此外，大量研究已经把语言学习跟良好的考试成绩、就业能力、创造力、沟通技巧乃至跨文化认知联系了起来。
Kutylowski总结道：“因此，无论是出于个人兴趣，还是大脑与性格的培养与发展，都应该重视学习语言。哪怕手机上就有最好的翻译工具，如果要结交来自不同国家的朋友、发展一段跨国恋情，至少得能做到直接交流。至少我不希望大家坐在一起，还在各自摆弄手机。”

来源：The Next Web

0赞

好文章，需要你的鼓励

DeepL发展史：一家初创公司与机器翻译巨头的抗争

来源：The Next Web

2024

01/25

09:54

分享

点赞

中国分布式数据库最新报告：OceanBase居本地部署市场两项第一

阿里团队突破多角色动画难题：FantasyPortrait让静态照片开口说话更自然

差异化为杠杆，Akamai如何撬动电商云服务市场？

Chrome iOS版简化工作与个人谷歌账户切换功能

戴尔科技数据分层策略，现代化存储的智胜之道

解锁商用办公的“效率密码” Ryzen 5 PRO 8600G交出“全场景”答卷

为什么机器不具备智能

巧用心理学技巧让AI按你的意愿工作

人工智能从聊天机器人向浏览器转移的原因

一位创始人能否借助AI打造百万美元产品品牌？

斯坦福研究揭示员工对AI工具的真实需求偏好

Cursor AI的YOLO模式让编程助手失控，安全公司发出警告

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

德勤2025技术趋势报告，AI与企业未来的交汇

思科在Cisco Live阿姆斯特丹大会上展示简洁、安全和AI就绪的创新技术

区分“模型”和“应用”是对AI最大的误解

终端侧AI，如何从DeepSeek的连锁反应中受益？

Gartner发布2025年及未来中国企业实现AI价值的重要预测

专访DeepMind CEO：我们距离实现AGI只需5-10年

企业AI是确定性的长期主义

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

生成式AI催生新物种，SaaS CRM掀起下半场变革战

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: