应用语言学论文

您当前的位置:学术堂 > 语言学论文 > 应用语言学论文 >

国内外云翻译平台的分类定位及展望

来源:中国科技翻译 作者:闫欣,陈瑞哲,张井
发布于:2019-03-13 共5666字

  摘    要: 云计算技术以提供计算能力、数据储存空间和软件应用, 为各行业打造了更为友好便捷的业务运行模式。本文旨在论述计算机辅助翻译 (CAT) 和机器翻译的发展和特点, 阐释人工智能机器翻译和在线CAT等翻译技术云平台运用先进云计算技术, 大幅增强翻译产出效率, 革新了翻译界的现状, 指明不同翻译技术云平台的特征、趋势与方向, 为翻译技术的深入研究打下基础。

  关键词: 翻译技术; 云平台; 计算机辅助翻译;

  Abstract: Cloud computing technology provides computing power, data storage space and software applications, creating a more friendly and convenient business operation modes for different industries. This paper aims to discuss the development and characteristics of computer-aided translation ( CAT) and machine translation, explain machine translation using artificial intelligence, and online CAT cloud platforms, among other translation technologies, so as to greatly enhance the efficiency of translation and revolutionize the current development of the translation industry. This study also identifies the characteristics, trends and directions of different translation cloud platforms, and lays the foundation for the in-depth study of translation technology.

  Keyword: translation technology; cloud platform; computer-aided translation;

  引言

  翻译作为双语转换的实践活动, 承担着促进不同国家和民族之间文化融合、思想交流和共同发展的重任。在大数据背景下, 各个领域都发生着翻天覆地的变化, 无不与互联网、人工智能、云计算等紧密相连, 翻译的研究和实践也不例外, 人工翻译的规模和数量在不断减少, 而机器翻译 (Machine Translation) 和机器辅助翻译 (Computer Aided Translation, CAT) 不断增加。[1]新兴翻译业态在过去十多年不断涌现并迅速推广, 从在线自动翻译到众包翻译 (Crowd-sourced Translation) , 从网络翻译到智能手机中的翻译工具, 翻译变革无处不在。[2]技术已成为翻译的要素, 它提高翻译效率, 改变传统翻译模式, 造就多元化翻译产业, 促进翻译产业发展。

  1 翻译技术云平台缘起

  计算机技术和网络环境的飞速发展引发了信息的快速更新和传播, 翻译需求的井喷式增长, 要求翻译方式在应对大批量、多语种翻译任务时必须有更快的翻译速度和更高的翻译质量。[3]随着信息技术的发展, 尤其是近年来在云计算和大数据技术的推动之下, 语音识别、翻译技术和翻译平台技术都得到了不断发展, 翻译工具也从本地转向了网络化。[4]一些语言服务机构和本地化服务公司, 开始将云计算技术应用于翻译行业, 构建能满足用户需求日渐增长的服务翻译云平台。

  云平台, 不言而喻, 即允许开发者将写好的程序放在“云”里运行, 或使用“云”里提供的服务, 或二者皆是。这种平台不止一种称呼, 比如:按需平台 (on-demand platform) 和平台即服务 (platform as a service, PaaS) , 这种新的支持应用的方式有着巨大的潜力。将云平台与具体的翻译技术融合在一起, 就是翻译技术云平台, 其最大优势是将分散在各地的翻译服务人才资源整合起来, 形成大规模、正规化的翻译项目管理, 为各地商业贸易发展和文化交流提供全面的服务。[2]

国内外云翻译平台的分类定位及展望

  随着全球化和信息化的快速推进, 很多西方国家的医学翻译市场, 基本已经实现了CAT技术的全覆盖。我们应该顺应信息化潮流, 借鉴发达国家的成功做法, 大力开发推广和应用CAT技术系统。[5]CAT软件的核心是翻译记忆库 (Translation Memory, TM) , 其实质是利用了翻译记忆技术, 将翻译过程中的术语匹配、译名统一、高度相似的句子再现等记忆工作由电脑完成。[6]

  2 翻译技术云平台的特点

  云计算技术迅速应用于现代翻译技术, 从而形成了一个新的概念———云翻译 (Cloud Translation) 。翻译技术云平台是基于语料库系统和翻译的云存储, 各种语料库资源, 各种存储介质及服务器共同储存在云端, 实现翻译资源共享, 形成一个相互促进的翻译生态系统。云翻译平台作为本文探究的核心概念, 其特点主要体现在以下几个方面[7]:

  第一, 云平台通常是将项目、人员、语料等进行模块化管理, 每个模块都有相应的权限控制。

  第二, 云平台依托云计算模式, 所有数据存储在云端数据中心, 用户可随时随地登录平台访问数据, 无需担心内存太小或数据丢失等问题。

  第三, 云平台适合团队协作, 可实现客户、项目经理、语言服务商之间的跨地区、跨时区交流。例如, 项目经理分发任务后, 可对项目进行实时监管, 查看进程;合作翻译同篇稿件的译员可以在同一窗口实时查看翻译, 共享记忆库和术语库, 确保译文风格和术语的一致性。

  3 国内外云翻译平台的分类与定位

  按照各平台背后争夺的资源来看, 国内外翻译技术云平台可分为四大类, 即翻译交易平台、翻译生产平台、翻译语料数据平台和人工智能机器翻译平台。

  3.1 翻译交易平台

  翻译交易平台是连接语言服务人才和客户的在线第三方交易安全保障平台, 保障双方在交易时的安全和诚信。客户通过翻译交易平台找到所需的译者, 交付给对方, 译者按照客户要求和双方的协议完成翻译任务。

  国际上最着名的翻译交易平台是ProZ, 它是全球最大的翻译社区, 为翻译人员、翻译公司和语言行业的其他人员提供翻译资源和就业机会, 减少语言服务人才和客户之间获取资源的成本。ProZ还拥有TM-Town平台, 可按照客户需求、译员资历和翻译题材等筛选条件, 将客户与专业翻译人员智能匹配, 选择最优结果, 帮助客户更快地找到译员。

  国内着名的翻译交易平台有:我译网, 虫洞翻翻和全球翻译公司交易所等。以虫洞翻翻为例, 它是全语种互联网+翻译交易平台, 连接语言人才和翻译需求者, 量化评价体系, 打造共享语言经济。项目立足跨境电商、国内互联网企业出海 (如阿里、小米、京东和猎豹等企业) 的翻译需求市场, 由海外留学生、国内高校师生、社会语言人才组成的数千名翻译者已先后帮助上千家跨境电商、互联网巨头和大使馆等客户完成多语种翻译。

  3.2 翻译生产平台

  在传统的翻译作业模式下, 翻译公司经常遇到语料复用难、周期紧、软件操作复杂、翻译风格不一致等问题, 而译员也会遇到术语查询繁琐、数据丢失、排版耗时长等问题。基于此, 在线辅助翻译生产平台应运而生。互联网+语言服务的翻译生产平台将在线翻译、语料管理、团队管理、项目管理、协同翻译等功能有效结合, 帮助翻译企业和翻译团队提高翻译效率, 降低翻译成本。

  国外着名的翻译生产平台有:Memsource和MateCat。以Memsource为例, 它是捷克的一家技术公司, 提供云端翻译管理系统、CAT工具等技术解决方案, 因向客户、翻译公司和语言服务人员提供易于使用和功能全面的翻译工具及管理系统获得国际认可, 现已成为云端翻译技术的领导者。Memsource Cloud是Memsource公司旗下的一款在线翻译管理系统, 内嵌CAT功能, 支持项目经理实时查看工作进度, 及多人合作翻译。

  国内着名的翻译生产平台有:Tmxmall YiCAT、译马网和云译客。以Tmxmall Yi CAT为例, 它是在线翻译管理平台, 为自由译员、翻译公司和企业翻译部门建立起全面自动化、科学化和流程化的翻译管理模式。Yi CAT内嵌CAT工具, 支持46种语言, 27种文件格式、27种QA检测规则, 具备实时项目监管、自定义工作流程、团队管理、译审同步和智能QA检查等功能。Yi CAT集成了Tmxmall平台的上亿句对语料数据, 用户在翻译时可实时检索调用其公有云语料分享平台的总记忆库及本地TM ROBOT的记忆库, 储存在私有云语料管理平台的个人记忆库, 可帮助译员节省时间, 提高翻译质量。

  3.3 语料数据平台

  语料是指文本的大量集合, 经过数据清洗、对齐等加工处理后的语料是语言研究和应用的珍贵资源, 是存放语料的仓库, 运用计算机技术, 按照一定的语言学原则, 根据特定的语言研究目的而大规模收集并储存在计算机中。[8]

  国内外均有云端语料数据平台。国外较着名的是TAUS Data Cloud。TAUS是翻译自动化用户协会 (Translation Automation User Society) 的简称, 总部位于荷兰阿姆斯特丹, 是一个为全球语言和翻译行业提供数据分享和翻译前沿知识的平台, 旨在为语言服务行业提供策略性建议, 助力行业标准的制定。国内的语料数据平台主要有:Tmxmall和UTH国际。其中, Tmxmall提供语料在线对齐, 专注于云端语料大数据产品和技术的研发与应用, 实时监控系统集成技术, 私有云语料管理以及语料商城交易平台等服务, 翻译工作者利用其在线对齐和私有云, 就能完成语料生产和语料管理利用。[9]语料对齐工具“在线对齐”交互界面人性化, 对齐结果准确率高, 其智能对齐算法可以自动对齐原文和译文语料中“一对多、多对一、多对多”的句子, 大幅降低人工工作量。截至目前, 该平台已积累了上亿句对优质语料, 涵盖新闻、政治、法律、金融、机械、医学、专利、建筑等垂直领域。UTH国际主要从事语料大数据基础设施建设和语言应用技术创新, 其平行语料库涉及33种语言, 涵盖跨境电商、国际工程、装备制造、影视传媒、文化旅游、社交媒体、高校教育等领域。

  3.4 机器翻译平台

  机器翻译亦称自动翻译, 是计算机将文本或语音形式的自然语言通过加工, 从源语翻译成目标语的过程。自2015年起, 脱胎于深度学习技术的神经网络机器翻译 (Neural Machine Translation, NMT) 技术飞速发展并开始应用。NMT作为一种算法, 通过学习在网络中抓取的公开语料, 利用GPU服务器的算力展开翻译。

  在大数据+互联网飞速发展的今天, 机器翻译的应用场景不断拓宽, 谷歌翻译是国外着名人工智能机器翻译平台。谷歌翻译是由谷歌公司研发的多语种翻译平台, 支持103种语言, 用户只需输入要翻译的内容, 选择语言对即可生成目标语翻译, 界面友好, 操作简单。Facebook、亚马逊、eBay等企业巨头也在陆续研发机器翻译引擎。国内的机器翻译平台有百度翻译、有道翻译、搜狗翻译、“讯飞语音云”平台, 而腾讯、阿里等科技巨头也在加大机器翻译产品研发力度, 在机器翻译领域崭露头角。

  4 翻译技术云平台的发展方向

  翻译生产平台将翻译的语言资产、团队资源、客户信息等数据整合, 信息透明, 沟通方便, 自动化程度高。通过翻译生产平台产生的数据可进行复用, 生产平台的迭代升级, 智能化程度提升, 贯穿整个商业翻译价值链的项目流程管理、资源管理、质量管理、计算机辅助翻译、信用评价、翻译需求配对的高度自动化SaaS平台 (Software-as-a-Service) 不再是镜花水月。[10]

  机器翻译经历了从基于规则机器翻译 (Rule-based Machine Translation, RMT) , 到基于语料库机器翻译 (Statistical Machine Translation, SMT) , 再到今天基于神经网络机器翻译 (NMT) 的演变。不同于前两种机器翻译, 基于神经网络的机器翻译在对自然语言进行处理时, 既不是按照人工编制的语法规则进行翻译, 也不是按照大规模的双语语料库, 通过词汇和句子间工整的双语对齐来建立统计模型, 而是使用计算机神经网络技术, 模仿人类大脑神经元[10]。在执行翻译时, NMT脱离了单纯以词、短语和句子为基础的翻译模式, 借助深度学习算法, 将原文和译文的关系计算得更为细致, 词语的切分层级也更精细。因此, 翻译结果相较RMT和SMT来说更像是“人话”。

  在未来, 语言服务行业将逐步精细化, 随着大数据分析和人工智能技术在机器翻译领域持续发力, 在线机器翻译会朝着新闻媒体、IT通讯、专利产权、金融财经、生物医学、法律合同等垂直领域和小语种方向发展, 应用场景也会更多, 比如在会议中进行实时同传、跨境旅游实时翻译以及拍照翻译等。届时, 机器翻译技术壁垒降低, 真正的壁垒落在高质量精准的语料数据上。集成语料大数据和众多机器翻译引擎后的翻译生产平台, 能够帮助机器翻译引擎提升翻译质量, 促使未来翻译模式朝着TM+MT+PE方向转变, 即翻译记忆库 (Translation Memory) +机器翻译 (Machine Translation) +译后编辑 (Post-editing) 相结合的新型翻译模式。译者将原文本导入CAT工具后, 设置翻译记忆库匹配率并匹配结果, 达不到设定匹配率的句子借助机器翻译引擎调用结果。译者只需在两者的基础上, 对译文的术语、文化差异部分、句式结构、漏译错译等进行调整。若MT的效果足够好, 甚至无需TM, 翻译工作流程直接进入MT+PE模式。因此, 云平台和云计算在翻译领域的应用会更加广泛和普遍, 机器翻译与人工智能一定会紧密结合, 共同协作发挥作用, 其翻译水平能基本达到人工翻译水平。翻译生产平台和人工智能机器翻译平台将是今后翻译云平台发展的主要方向。

  5 结语

  机器翻译借助神经网络技术的发展使译文精度不断提升, 译者的角色主要转向译后编辑。机器翻译、机辅翻译和翻译管理系统都为人工翻译提供了更有效率的翻译环境, 熟练使用和掌握翻译软件逐渐成为高端翻译人才必须掌握的技能之一。[11]翻译技术云平台依靠其便捷性和大容量数据储存优势, 将为机器翻译和译后编辑提供载体。可以预见, 翻译生产平台将持续迭代升级, 不断智能化, 有望出现高度自动化的一体式商业翻译SaaS平台 (Softwareas-a-Service) 。一个能够整合翻译交易、生产和数据资源的云平台有助于形成一个相互促进的翻译生态系统, 进而推动翻译的垂直化、智能化和场景化, 高效地满足人类个性化翻译需求, 消除跨文化交流中的语言障碍。

  参考文献:

  [1] Bowker, L.Computer-Aided Translation Technology:A Practical Introduction.Ottawa:University of Ottawa Press, 2002
  [2]张旭东.翻译的技术化倾向述评.外语研究, 2016 (5) :88-91
  [3] Quah, C.K.Translation and Technology.New York:Palgrave Macmillan, 2006.
  [4]王华树.大数据时代的翻译技术发展及其启示.东方翻译, 2016 (4) :18-20
  [5]吴丽华.医学文本机辅翻译质量与效率实证研究.中国科技翻译, 2018 (1) :33-36, 52
  [6]傅敬民, 谢莎.翻译技术的发展与翻译教学.外语电化教学, 2015 (6) :37-41
  [7]张明玺.基于云服务翻译平台的翻译质量评估思考.探索前沿, 2016 (9) :20-21
  [8]王克非.语料库翻译学探索.上海:上海交通大学出版社, 2012
  [9]吴昊.翻译术语库的构建与术语构成.中国科技翻译, 2018 (2) :8, 21-23
  [10] 王华树.翻译技术教程.上海:上海外语音像出版社, 2017
  [11]秦颖.基于神经网络的机器翻译质量评析及对翻译教学的影响.外语电化教学, 2018 (2) :51-56

作者单位:西安邮电大学外国语学院 上海一者信息科技有限公司
原文出处:闫欣,陈瑞哲,张井.翻译技术云平台的发展现状与趋势[J].中国科技翻译,2019,32(01):22-25.
相关内容推荐
相关标签:
返回:应用语言学论文