欢迎您访问志远翻译官方网站!
专注翻译20+年

挪开大数据,大内容就在这里

Date: 2019-06-29 19:34:55Source: 志远翻译

在过去十年的大部分时间里,大数据是一种技术现象,而不是其他任何一种技术现象,企业试图利用这种技术为自己谋利。人们在网络生活中每天采取的成千上万的行动可以被用来定位广告,识别趋势,甚至预测行为,这是一个诱人的想法。市场营销部门和整个公司都以数据作为“21 世纪的石油”为前提。

这些公司挖掘了我们的搜索历史,我们的浏览行为和我们的上网习惯,其中一些公司通过销售或使用它来瞄准他们的市场获得了巨大的利润。

现在又出现了一种新的现象。最近的数据滥用丑闻使大数据运动黯然失色,将行业重点转移到了一个更可持续的模式上:走进这些宏大的内容里。

想想互联网有多大。它真的很大。有 550 亿个网页。如果每一页都有 100字,那就是 5.5 万亿字。这可能是一个保守的估计。显然,并非所有这些内容对拥有这些内容的公司都有用。这些页面中有许多包含填充语、文本或法律术语。从大内容的角度来看,真正让营销人员感兴趣的页面是那些可以被收获并对数据分析人员有用的页面。那么,什么是“大内容”?让我们把电子商务的产品描述和评论作为最好的例子在这里,有数以百万计的产品在互联网上销售,他们每一个都需要一个良好的书面描述,以有效地销售。同样,这些产品中的绝大多数都在站点上提供了一个或多个客户评论。如果他们是信息和明确,他们可以帮助买家作出自己的决定,也可以帮助零售商采取任何反馈在船上。所有这些都是与特定产品相关的内容。

挪开大数据,大内容就在这里

因此,有许多有用的内容,但你如何处理这些信息,现在它是现成的?现在我们知道所有这些信息都存在,我们确定为一个 语言服务提供商,它很可能在某一点上需要多种语言,要在多个国家/地区销售产品,就需要本地化。然而,所涉及的庞大字数排除了传统的每天 2000 字的翻译方法,因为这太费时了。

这就是机器翻译译后编辑 (MTPE) 和众包的用武之地。有效处理如此大量内容的一种行之有效的方法是大规模机器翻译,并使用大量经过审查的语言学家对其进行后期编辑并优化其对读者的影响。在工业中,使用 NMT 正迅速成为一种普遍现象。然而,仍然有陷阱与机器转换和准确性仍然是问题。这就是我们引入人的元素以确保质量的地方。但是,由于“大内容”项目中的字数太多,采用众包策略是加快这一过程的一种快速而有效的方法。通过吸引多种语言,并为他们提供成为成功的后编辑所需的培训和知识,我们可以产生更快的、有质量保证的结果。

这就是为什么众包仍然是 Joncker 和整个行业的一个重要焦点,在大内容时代,这种方法显然是唯一可持续的解决方案之一。

The End

在线询价

Get Quote

联系客服人员或致电400-811-9518告诉我们您的需求, 我们会在第一时间与您联系。

服务项目
姓名
称谓
Email
联系电话
源语言
目标语言
交付时间
留言
Top