青年创业帮是一个专业为创业者提供学习交流的创业网站,主要为网民提供创业项目、创业信息、创业商学院、创业辅导等商机资讯、助您时刻掌握最热行业动态。

当前位置:主页 > 科技创业 > 全球首个翻译引擎进化归来,“细节狂魔”搞定方言

全球首个翻译引擎进化归来,“细节狂魔”搞定方言

来源:青年创业帮作者:简万贵更新时间:2020-10-04 15:53:21阅读:

本篇文章3871字,读完约10分钟

最近,一个在线机器翻译软件在日本着火了。Deepl官方还公布了日英翻译和汉译英的盲测结果,这简直是存在着压倒性的水平。资料来源:大数据文摘(id:bigdatadigest),刘俊焕主编。

最近,一个在线机器翻译软件在日本着火了。

这款翻译软件叫做deepl,之所以失火是因为它对自己的工作过于负责,翻译也过于准确,这在日本引起了热烈的讨论。

从日本网民的民间评价来看,不仅日本方言的翻译效果极佳,文言文也是如此。你知道,这是连谷歌翻译都做不到的。

但是它有多准确呢?作为一个严谨的科技软件,我们还是要用数据说话。deepl官员还公布了日英翻译和汉译英的盲测结果,这简直是存在着压倒性的水平。

盲测是指当专业翻译判断不知道哪个网站翻译了哪个翻译版本时,对翻译文本进行评估,这一直是deepl的测试方法之一。

Deepl也引爆了reddit,因为它的出色准确性。一些网民指出,deepl不翻译像谷歌翻译这样的词。从文本选择器的设置来看,deepl也支持使用以前的翻译作为上下文来提高翻译结果。

也有很多网友称之为“酷毙了”!

三年前,当deepl第一次出现在公众的视野中时,它引起了很多关注。deepl的首席执行官gereon frahling曾经说过,deepl的目标不仅仅是翻译任务,而是神经网络将从理解文本开始,开辟更多的可能性。

至于还有更多的可能被开发出来,抽象细菌做了一个小小的评估,然后一起观察了迪普的家族史。小板凳已经放好了,欢迎坐下~

方言,文言文,学术论文,机器翻译,神仙打架!

无论是DEEP的民间评价还是官方盲测结果,都暗示DEEP可能是目前准确率最高的机器翻译,有必要亲自尝试一下。

由于本次更新也包括简体中文,带着一点疑问和好奇,消化器也对deepl做了简单的评价,并将其与目前主流的谷歌翻译、微软翻译、百度翻译和有道翻译进行了比较。

本次评估分为三轮:第一轮方言、第二轮文言文和第三轮学术论文。好了,现在我们有五名选手。

在第一轮,让我们看看方言。

众所周知,中国方言文化博大精深。如果我们不能正确翻译方言,准确性就会受到质疑。

我们用东北方言选了十年级的题目:“我一个人去,你太自大了。”这个话题有两个得分点,一个是“我一个人去”,另一个是“我敲门”。让我们来看看五位选手的表现。

在第一个得分点上,谷歌将其翻译为“我会去那里”,微软和百度认为这意味着“我会去”,而有一种方法可以给出“我不知道”的答案。deepl表现很好,用惊讶的语气正确地将其翻译为“哦,我的上帝”。

在第二个得分点上,五位参赛者给出了不同的答案,如谷歌的“害羞”、微软的“势利”、百度的“寒酸”、有道的“糟糕”和极深的“丑陋”。

从得分的角度来看,百度在第二个问题上的表现是公平的,有句话说……刚刚通过测试,而谷歌和微软就全军覆没了。让我们来看看deepl的完美乐谱:

这是第一个问题,别担心,还有翻身的机会。接下来,让我们来看看文言文。因为deepl可以翻译古代日语,如果它不能翻译古代汉语就错了。

第二轮,文言文。

在中国古典文学中,我们引用了唐代著名诗人张九龄的《望月》中的一句名言:“明月当空,明月当空”,意思是一轮明月从浩瀚无垠的大海中升起,让人想起远方的亲朋好友。此刻他应该在看同一个明月。

这个题目的评分点是看参赛者能否用英语表达整首诗的意境。好的,标准的中文答案已经公布了,那么五名选手表现如何?

首先,谷歌、微软和百度都直接放弃了后半句的翻译,而将后半句翻译成了“此时天涯”;在前半句的翻译中,微软和百度都使用了出生一词,但微软的翻译是“大海是生的”????

让我们看看deepl。前半句和谷歌的回答完全一样,但是后半句的翻译是否已经达到了信、达、雅的水平,抽象细菌不知道,但是读起来感觉很舒服,而且每个人也来尝一尝:

第三个问题,也是最后一个问题,是所有参赛者的学术论文的汉英翻译。

学术论文的关键不仅在于句子的流畅性,还在于专业词汇的准确性,这也是本次调查的重点。

在汉英翻译部分,我们选择了去年在国际出版社发表的一篇文章。研究者调查了社交媒体信任对隐私风险感知和自我披露的影响。

实证结果表明:1 .隐私风险感知与自我表露之间没有显著相关性;2.社交媒体信任负面影响用户对隐私风险的感知,其中网络人际信任起中介作用;3.社交媒体信任积极影响用户的自我表露,其中网络人际信任起着中介作用。

从翻译结果来看,五位参赛者给出的答案都是令人满意的,在句型和语法上没有问题,但是在一些具体的词语上他们有自己的优势。例如,“自我表露”,deepl和微软使用“自我表现”,其他三家公司使用“自我表露”;而“网络人际信任”被道、百度和微软翻译成“网络人际信任”,谷歌给出“在线人际信任”的答案,deepl翻译成“网络人际信任”。

全球首个翻译引擎进化归来,“细节狂魔”搞定方言

像往常一样,让我们看看deepl的答案。

在英文翻译部分,我们选择了上周《抽象细菌》报道的帝国理工学院论文的引言部分。从中文到英文再到英文的转换,只有百度、有道和迪普可以自动识别,而谷歌和微软仍然需要手动选择语言。

covid-19的全球影响已经被发现,它所代表的公共卫生威胁是自1918年h1n1流感大流行以来呼吸道病毒中最严重的。在这里,我们介绍了【/ h/】流行病学建模的结果,这些结果在最近几周为英国和【/h/】其他国家的政策制定提供了信息。在缺乏covid-19疫苗的情况下, 我们评估了一些公共卫生措施——所谓的非药物干预(npis)的潜在作用,这些措施旨在降低人群中的 接触率,从而减少 病毒的传播。在这里展示的结果中,我们将之前发表的 微观模拟模型应用于两个国家:英国(特别是英国)和美国。我们的结论是,任何一种单独的 干预措施的有效性都可能是有限的,需要将多种 干预措施结合起来才能对 传播产生实质性影响。

全球首个翻译引擎进化归来,“细节狂魔”搞定方言

从结果来看,五名参赛选手的学术素养都比较高,学术语言使用的规范化也没有太大的不同。然而,细节是真实的,只有一种方式保留了双破折号的使用,但这在汉语中实际上并不常见;除陶外,其他三位选手对“非药物干预措施”的表述并不完美。

全球首个翻译引擎进化归来,“细节狂魔”搞定方言

不过,迪普是最后一个被嘲笑的人。尽管仍有各种各样的小问题不能得满分,但它也是一份合适的高分试卷:

以上是本次评估的全部试题。可以看出,迪普是头号种子选手,在方言、文言文和学术话语方面都表现出色。看来迪普还是很诚实的。

看到deepl的出色表现后,接下来,我们将重点关注本次评估中表现最佳的顶级种子deepl。

我不知道,迪普?林贵应该听说过它,也就是已经运行了十多年的在线外语词典。迪普的前任是林吉。Linguee是一个已经出现多年的翻译工具。虽然它被广泛使用并拥有一批忠实用户,但其翻译质量无法与谷歌的翻译相比,尤其是考虑到其品牌和地位的巨大优势。

全球首个翻译引擎进化归来,“细节狂魔”搞定方言

但真正重要的是林吉的技术积累。linguee的联合创始人gereon frahling以前在谷歌研究院工作。2007年,他选择开始新的旅程。这个团队致力于机器翻译已经有几年了,直到2016年他们才开始全面开发一个全新的系统并建立一个新的公司,即deepl。

全球首个翻译引擎进化归来,“细节狂魔”搞定方言

Linguee的核心竞争优势是爬虫和机器学习系统。前者可以在互联网上抓取超过10亿句的翻译结果和查询的大型数据库,而后者搜索网页上相似片段的真实翻译方法并对其进行评估。两者的结合使linguee成为当时“世界上第一个翻译搜索引擎”。

全球首个翻译引擎进化归来,“细节狂魔”搞定方言

经过十年的积累,linguee在数据和算法研究方面不可低估,这直接成为deepl的绝对优势,为团队培训的新模式奠定了坚实的基础。

Deepl革命性的神经架构在冰岛的一台超级计算机上运行,该计算机的容量为5.1千兆次(每秒5100万亿次运算),可以在不到一秒钟的时间内翻译100万个单词。“冰岛拥有丰富的可再生能源,因此我们可以在这里以非常低的成本训练我们的神经网络。”我们将继续专注于高性能硬件。”

全球首个翻译引擎进化归来,“细节狂魔”搞定方言

“我们的神经网络体系结构已经取得了许多重大的改进,”格雷昂·弗莱林说。“通过以不同方式排列神经元及其连接,我们的网络比目前的其他神经网络更全面地映射自然语言。”

大学、研究机构和linguee的竞争对手发表的研究进展表明,卷积神经网络是机器翻译的正确方法,而不是deepl使用的循环神经网络,但现在不是讨论它们之间区别的时候。只要能控制长而复杂的相关词串的弱点,卷积神经网络就会有更好的效果。

全球首个翻译引擎进化归来,“细节狂魔”搞定方言

例如,美国有线电视新闻网一次处理一个单词,当一个句子末尾的单词决定了第一个单词的构成时,这就成了一个问题。搜索整个句子,找到句子的第一个单词。如果网络获得的第一个词是错误的,那就太浪费了,你必须用这些知识重新开始。因此,当美国有线电视新闻网转向下一个单词或短语时,deepl和机器学习领域的其他机构使用一种“注意机制”来监控这些潜在的问题。

全球首个翻译引擎进化归来,“细节狂魔”搞定方言

Deepl在最新版本中增加了对日文和中文(简体)的支持,包括日文汉字、平假名和片假名,以及数千个中文字符。目前,deepl支持的语言数量已经增加到11种。虽然语言支持不如其他翻译服务广泛,例如google translate和bing microsoft translator都支持100多种不同的语言,但翻译准确性也是一个不容忽视的关键点。

全球首个翻译引擎进化归来,“细节狂魔”搞定方言

精通多种语言的techcrunch编辑弗雷德里克(Frederic)曾这样评价deepl:“谷歌的翻译风格非常直接,但遗漏了一些细节和习惯用法(或者这些习惯用法翻译有误),deepl通常可以提供更自然的翻译效果,就像训练有素的人工翻译一样。”


标题:全球首个翻译引擎进化归来,“细节狂魔”搞定方言

地址:http://www.qdgzw.com/kjcy/32620.html

免责声明:京青年创业网是一个专业为创业者提供学习交流的创业资讯媒体,更新的资讯来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,京青年创业网编辑将予以删除。

上一篇:顺丰喜忧参半

下一篇:威频科技获得Pre

返回顶部