欢迎您访问志远翻译官方网站!
专注翻译20+年
  • 在线咨询
  • 400-811-9518
  • 在线询价
  • info@ata.com.cn

翻译公司:在 eDiscovery 数据中查找外语的技巧

Date: 2020-06-09 11:13:15Source: 志远翻译

Relativity 博客上发表了一篇新的 ATA 翻译文章。
Relativity 是最受律师和法律专业人士欢迎的电子发现平台。我们最近在 Relativity 网站上发表了一篇博客,强调了快速识别关键外语信息的三个重要技巧。请看下文。
 
您是一家大律师事务所的 eDiscovery 专家。坐在办公桌前,登录 Relativity 网站,开始筛选文件。您一直浏览着,寻找需要的东西,甚至在截止日期之前就找到了。于是您开始思考午餐吃什么。我要在街对面的那家店买一份 15 美元的沙拉吗?那我要买披萨吗?买披萨吧,超值。一整块披萨,太棒了。
然后,您会看到一个巨大的、看起来像外国文件的缓存。您以为是罗马尼亚语,但实际上您不懂罗马尼亚语。您也不懂拉脱维亚语、立陶宛语或波兰语。可能是其中之一吗?您的额头上冒出一粒汗珠,您开始恐慌,在脑海中浏览您的选项:

翻译公司

  • 要问其中一个伙伴该做什么,请翻到第 17 页
  • 要进入一个 13 小时的网络兔子洞,请翻到第 25 页
  • 要跑到停车场在车里哭,请翻到第 33 页
不喜欢这些选项吗?幸运的是,当您在浏览到一半无意中发现一些外语文档后,有一些有用的技巧可以帮您节省大量的时间,或者更好的是,从一开始就找到这些外语文档,从而避免出现这一令人心碎的时刻。
在审阅过程中尽早识别出外语,对于实现清晰、可预测的成本、防止不必要的延迟和构建有意义的工作流至关重要。这里有一些简单的技巧可以帮助您在国外的 eDiscovery 领域畅行。
1.使用外语停止词
如果您没有 Relativity Analytics,或者您正在寻找一种快速、简单的方法来扫描您的数据集以寻找某种外语,那么在 dtSearch 中创造性地使用停止词可能会有所帮助。
停止词,也称为噪音词,是给定语言中使用频率最高的单词(例如,在英语中:and、the、my、all、for)。它们通常会从 dtSearch 或关键字搜索中被过滤掉,因为它们非常常见,不会返回有价值的搜索结果。然而,这些词频繁出现也使它们成为查找外语文档的好方法。
因为可以安全地假设在任何文本中都可以找到停止词,所以对停止词列表的 dtSearch 可能会返回任何外语文档。例如,如果您认为您的数据集可能包含德语,那么搜索德语停止词将有希望返回任何带有德语文本的文档。
请注意,每种语言都有自己独特的停止词集,因此与其翻译英语单词列表,不如从法律语言服务专家那里获得所需外语的停止词列表。
2.运行语言标识
虽然有了停止词技巧能找到外语文档,但是这要求您预先知道数据集中有哪些语言,并且如果您搜索的语言不止一种,那么您会感到单调乏味。对于可能包含多种语言的数据集,或者如果您只是想在对任何一种外语进行双重检查之后,继续您的评审,那么,最好使用完整的语言识别分析。
语言识别运用机器学习,自动检测文本中的语言。Realativity Analytics 中的一个特性,它能返回文档中的主语言和最多两种次要语言,以及每种语言的百分比。
因此,您可以利用语言识别输出来指导下一步。构建鸟瞰图面板,以能够纵观文档数量、管理员数量和语言控制数量;按语言批量处理文档,高效地发送给外语审校员;然后将外文文本发送给机器翻译,这样您就可以得到英文版要点。无论采用哪种方法,语言识别结果都将为接下来的审阅工作流程打下基础。
3.认识到互联网是您的朋友——除非它不是
互联网的美妙之处在于,您只需点击一个按钮就能找到您想要的任何东西。仅利用谷歌搜索可能有的语言中的停止词,将为您带来一些快速而可靠的回报。例如,搜索“西班牙语停止词”,您会看到一个包含 40 多种语言的完整的停止词列表。互联网很棒吧?但不要让它给您一种虚假的安全感。
我们都知道有免费的翻译工具。您可能认为,简单地将文档复制并粘贴到这些免费引擎之一中,就可以解决语言识别混乱的问题,但在继续之前,有几个重要的问题需要考虑:
  • 当您考虑到可能要处理的文档数量时,复制和粘贴是非常单调乏味的。“Ctrl+C,Ctrl+V”在面对成百上千个文档时并不是一个切实可行的选项。
  • 免费的在线翻译工具并不安全。一旦您将文本输入其中一个工具,该文本也归这些工具所有了。在大多数情况下,您处理的是不应该向第三方公开的敏感性文档。但当然,您早已明白这一点。
选择上述方法之一而不是使用免费的在线翻译工具,可以确保您的数据安全,并让您的团队有时间专注于构建一个复杂案例。
所以您找到了外语文档。现在怎么办呢?
现在是时候确定这些外文文档是否相关,是否要优先处理或需要其他的处理——换句话说,是时候弄清楚这些文档的所要表达的意思了。为此,您可能希望与受信任的语言服务供应方合作。选择一个可靠的供应方是另一个话题,但是这里有一些快速的技巧可以帮助您开始:
  • 确保他们具备 ISO 认证的质量——糟糕的翻译会造成混乱,浪费您的时间和金钱。保护自己别出现这种情况。选择一个经过 ISO 认证的供应方是一个好的开始。
  • 确保他们具备丰富的 eDiscovery 经验——多数情况下是结合各种工具,如机器翻译、外语审校、和关键字搜索词翻译——这将会优化您的时间和成本,所以确保您的供应方熟悉于此,以及如何将其适用于这些类型的项目。
  • 确保他们熟悉您所选择的技术——选择一个已经熟悉您的 eDiscovery 软件的合作伙伴可以节省时间,提高安全性,并防止头痛。有些甚至可能为您的平台提供专用的应用程序,比如 ATA 的 Relativity 插件,为您已知的工具提供专用的支持。
通过这些简单的工作流技巧,您可以更好地选择自己的 eDiscovery 翻译经历。您以前用过吗?请在评论中告诉我们。

The End

在线询价

Get Quote

联系客服人员或致电175-1160-1970告诉我们您的需求, 我们会在第一时间与您联系。

服务项目
姓名
称谓
Email
联系电话
源语言
目标语言
交付时间
留言