译学文献|王华树、刘世界:大数据时代翻译数据伦理研究:概念、问题与建议

栏目:科技资讯  时间:2023-08-17
手机版

  原标题:译学文献|王华树、刘世界:大数据时代翻译数据伦理研究:概念、问题与建议

  随着大数据技术和人机交互技术的突飞猛进,数据呈现爆炸式增长,全球正在开启一个新的数据时代。大数据不断与翻译活动深度融合,传统语言服务行业正面临着全新的机遇与挑战。翻译与云计算、大数据、互联网、人工智能(Artificial Intelligence,以下简称AI)融合发展,推动着传统翻译模式进行一系列革新。翻译技术与工具发展势如破竹,迅速拓展到翻译行业的方方面面,引发语言服务行业颠覆性的变革,同时也引发学界对于其伦理性的思考(任文, 2019: 48-50;郝俊杰, 莫爱屏, 2019;蓝红军, 2019;王华树,刘世界, 2021: 89;王华树, 王鑫, 2021: 14)。当前技术驱动下的翻译数据相关活动成为翻译新常态,滋生出越来越多的数据伦理问题。如何确保翻译数据的正当处理和合理使用,加强个人数据隐私保护机制,开展翻译数据伦理的系统化研究,对大数据背景下的语言服务行业生态发展至关重要。因此,本文从归纳翻译数据伦理的基础概念入手,梳理存在的典型伦理问题,从多个视角提出翻译数据伦理的治理方式和可行性建议。

  要界定翻译数据伦理,首先要厘清数据伦理、翻译伦理及翻译数据三个概念间的关系。

  数据伦理来源于信息伦理,是一种扎根于信息伦理理论且适应于大数据时代的新范式(宋晶晶, 2020: 35),属于专门研究和评估数据生成、采集、拥有和使用的道德哲学。前人对于数据伦理的研究包括数据安全(Mayer-Sch?nberger & Cukier, 2013;冯登国等, 2014)、数据隐私(陈仕伟, 黄欣荣, 2016;颜世健, 2019)、数据滥用(杨洸, 2020)、数据权利(程啸, 2018;周永红, 赵维, 2019)、数据异化(陈万球, 石惠絮, 2015)、数据主义(李伦,黄关, 2019)等方面。

  “翻译伦理”这一概念由法国当代翻译理论家贝尔曼(Antoine Berman)于1984年在法国国际哲学学院(Collège International de Philosophie)以 “翻译与语言”(La Traduction et la Lettre) 为主题做系列讲座时首次提出。(吴术驰,2021:6)此后,翻译伦理这一领域得到越来越多学者的关注(如Venuti, 1995, 1998;Pym, 2001;Chesterman, 2001;刘亚猛, 2005;汤君, 2007;辛广勤, 2018 )。随着翻译伦理思想的发展和译介,其内涵和外延不断被深化和拓展,但仍未达成统一的定义。早期相对客观且为学界接受的是王大智、许宏两位学者所下的定义。王大智(2009: 63)提出:“翻译伦理就是翻译行为事实该如何规律以及翻译行为该如何规范,它既面向翻译行为也面向翻译行为主体。翻译伦理研究不仅包括翻译的规范性研究,而且还包括对翻译规律或翻译现象的描述性研究。”许宏(2012: 52)则认为翻译伦理是翻译的主动行为人在翻译活动中所遵循的道德准则。然而,在当前语言服务行业及翻译技术快速发展的背景下,翻译活动和翻译主体的内涵也已经发生改变。为此,有学者提到要重新思考翻译伦理,拓展其研究范畴。其中,任文(2020:14)基于广义的翻译活动和多元的活动主体,拓展了翻译伦理的深度。李晗佶、陈海庆(2020:116)认为技术时代有必要结合翻译技术的自身特性进对传统翻译伦理研究范畴进行拓展。但是前人尚未能关注到新时代新型翻译活动中的翻译数据现象。在新时代语境下,翻译行为多元主体在新的数字化、智能化环境下,使用新的翻译手段(如人机交互)开展多种形式的翻译活动,自然会产出与传统翻译方式不同的结果,其中最显著的输出结果就是翻译数据。

  综上,本文将翻译数据伦理定义为:在翻译数据的采集、加工、存储、传播和利用等各个环节中,用来规范其间产生的各种社会关系(翻译数据制造者、翻译数据服务提供者、翻译数据使用者等行为主体间的数据行为)的总和,涵盖数据伦理的多个范畴,如数据安全、数据滥用、数据权利、数据异化等,其中数据安全是翻译数据伦理研究的核心。这一定义是对动态化、多元化的翻译伦理框架的范畴拓展。翻译数据伦理以翻译伦理为指引,以数据伦理为抓手,侧重研究大数据时代背景下翻译活动中多元主体的数据行为规范,审视数据伦理在翻译领域的映射关系,是对现有翻译伦理的理论与应用的进一步丰富和拓展。

  伴随着大数据、AI的兴起,新型翻译技术日趋成熟,传统翻译模式面临重大挑战。翻译数据在传输和应用过程中的安全问题和用户的隐私保护问题日益突出,由此引发的数据权利、数据安全、数据滥用、数据异化等翻译数据伦理问题逐渐进入人们的视野。

  数据权利是大数据时代人类的一项基本权利,兼具人格权和财产权双重属性,数据人格权主要包括数据知情同意权、数据修改权、数据被遗忘权;数据财产权主要包括数据采集权、数据可携权、数据使用权和数据收益权。(肖冬梅, 文禹衡, 2015: 70)基于此,笔者拓展了数据权利在翻译领域中的应用范畴,主要体现在以下几方面:(1)语言服务企业无视客户数据知情同意权,将其数据视为企业的语言资产,从而获取资本利益,损害客户的数据收益权。(2)智能输入法工具可以记录译者的输入偏好,主动提示待输入的文字选项,导致“信息茧房”现象的发生,严重影响译者的选择权利。(3)译者对AI机器翻译平台的依赖,使得个体译者和机器的边界趋于模糊化,“从而可能导致译者的价值被低估,译者角色进一步隐身”(任文, 2019: 49),引发机器译作署名权的问题。(4)译者虽然是翻译记忆资源的创作者和所有者,但在实际过程中缺乏明显的控制权。(Moorkens & Lewis, 2019: 7;Bowker, 2020: 266)(5)在AI和大数据技术耦合共生的时代,数据获取权限的差异可能间接影响译者和企业的数据权利,导致语言服务行业走向不均衡发展,翻译生态遭到破坏。随着大数据技术的迅猛发展和翻译职业化进程的不断加快,数据权利受限的译者有可能会面临被行业淘汰的境遇,其主体性和自治性也会逐渐被削弱。

  数据安全的内涵比较广泛,常与隐私保护成对出现。考虑到数据安全与隐私保护的专项法律目前尚不健全,存在定义混乱,责任界限模糊等情况,尝试将数据安全界定为大数据时代数据在收集、存储、共享、处理等过程中出现的安全和隐私风险。AI与大数据技术的深度参与改变了传统翻译模式,提升了用户和企业的产出效率,同时2018年英美媒体报道的Facebook用户隐私信息泄露事件(Cadwalladr &Graham-Harrison, 2018;Confessore, 2018),也应引起我们对于数据安全问题的重视。翻译数据安全主要体现在以下两个层面:(1)数据泄露,“用户或客户将专有术语库或翻译记忆库通过翻译系统上传到服务器上,并在服务器系统中进行翻译编辑和维护操作,可能会导致隐私数据泄露、黑客或病毒攻击、服务器崩溃等多种风险”(王华树, 王鑫, 2021: 13)。(2)隐私风险,得益于AI技术与大数据的融合发展,机器翻译软件的发展达到了前所未有的高度,但免费在线机器翻译可能会给用户带来未知的隐私风险,机器翻译服务提供商也可能会利用这些风险。(Kamocki & O’Regan, 2016: 4461)此外,AI时代的机器深度学习与个性化训练依靠巨量化的真实数据,而真实的翻译语料则蕴含了大量的个人隐私、翻译劳动以及知识产权的归属问题。因此,从数据使用的安全角度考虑,用于机器学习与训练的数据可能导致用户和客户的个人隐私泄露。

  数据滥用指数据的不正当使用,在未征得数据主体知情同意的情况下,以其所不知的方式使用其个人信息或数据资产。互联网的高度发达为人们最大限度地共享数据资源提供了坚实的技术基础,同时也为非法获取数据资源提供了可能,数据获取手段的正当性和适宜性的底线不断被冲破,针对数据滥用的讨论日渐成为各界关注的焦点。伴随着网络数据访问量的激增,数据的获取和筛选已远非人力所能及,因此网络数据自动化爬取技术成为互联网信息交流中不可或缺的一环。网络爬虫作为一种数据获取工具,其介入可以提升使用者的数据收集效率,但是技术的无限制使用必然会导致网络秩序的混乱和崩溃。

  现实生活中,员工私自访问、滥用客户数据的案例并不少见。2018 年英国事故维修服务有限公司(NationwideAccident Repair Services Limited)的一名员工在未经授权的情况下私自访问了客户的数据,并以此勒索客户。(Ekran System, 2019)翻译云平台服务方与第三方应用开发商通常会声明需要收集一些信息来保障用户在使用产品或服务时的账号与系统安全,协助提升其产品或服务的安全性和可靠性。那么,译者和客户在使用产品或服务时,其个人信息(个人基本资料、个人身份信息、个人常用设备信息、个人位置信息等)以及个人敏感信息(财产信息、交易信息、网络身份识别信息、个人生物识别信息等)便会在互联网上留下痕迹,很有可能被他人借助网络爬虫工具访问与获取,实际“用途”远超用户的知情范围,这不仅涉及数据来源合法性、著作权权属等实体问题,也包括爬取行为、爬取对象、应用范围等过程问题。此外,译者所拥有的语料数据,包括其个人所译和客户所提供的语料,在没有明确知识产权的前提下被不正当分享,也是一种数据滥用。尽管相关法律在不断健全,但由于网络数据的开放性和共享性,侵犯知识产权的现象还是时有发生。

  数据异化是一种存在于数据的收集、储存、分析和使用等全过程之中的数据风险,包含“数据失真”“数据依赖”“数据独裁”“数据崇拜”等现象。(陈万球, 石惠絮, 2015)“大数据驱动下的翻译技术介入语言服务行业,对效益的追求使得翻译公司越来越注重流程化、模式化的生产,机器预翻译在翻译生产中所占比重越来越大,翻译从业人员对翻译策略、翻译技巧的把控性降低,对技术处理的标准化程度提高”(蓝红军, 2019: 10)。机器要求文本输入能轻松辨识,其意义或许越简单、越单一越好。一方面,“在技术的影响下,越来越多的文本内容,尤其是需要机器处理的内容,越来越远离个性化、情景化、具体化的语言实际,而向程式化、标准化及简单化发展”(郝俊杰, 莫爱屏, 2019: 62)。另一方面,AI和大数据联合驱动下的机器翻译停留于信息的传递性和准确性层面,无法顾及语言的创造性、诗意性、模糊性和不确定性。预翻译处理趋于简明化,译者不得不迁就于机器语言,不断以简明的句式输入机器翻译端口,使得机器翻译输出的译文逐渐侵蚀自然语言。“本质而言,这是一个使语言适应机器的过程,也是一个语言非人化和机器化的过程”(郝俊杰, 莫爱屏, 2019: 62)。此外,翻译记忆库的过度使用,导致译文出现同质化,“专业译者的身体技能优势被不断减弱”(蓝红军, 2019: 10),译者风格趋于单调化,缺乏创造性和多样性。

  大数据时代的翻译活动呼唤着新型翻译数据伦理的介入。如若忽视翻译伦理体系的建设,将会导致语言服务行业走向畸形发展,甚至会给整个行业生态带来巨大的影响。构建符合翻译技术时代特点的伦理体系,促进语言服务产业良性发展,积极应对新时代的翻译数据伦理问题势在必行。因此,基于上述问题,笔者从四个方面提出以下建议。

  大数据产生的新型伦理问题层出不穷,制定和完善相关法律法规,加强政府和行业协会的监管力度刻不容缓。政府层面,即国家层面应加快构建和完善国家数据治理体系,搭建具有时代特色的大数据法律框架,形成数据治理的中国原则、制度和法律框架,提供数据安全治理的中国方案,给予翻译行业协会宏观政策的指导。翻译行业协会层面,需要做到以下两点:(1)监控行业内多元主体的数据行为。协会层面必须准确识别数据多元主体,确保行业数据采集的合法性,明确行业数据使用者所承担的责任范围,避免数据滥用和数据权利等伦理问题。(2)促进翻译与伦理教育的融合。行业协会应号召语言服务提供商和翻译技术企业切实履行责任义务,与语言专业人才培养单位加强校企合作,共建数据伦理、技术伦理课程,促进二者的融合发展,提高语言专业人才的伦理意识,真正做到理论和实践相结合。

  近年来发生在语言服务提供商或翻译技术企业中的社会伦理事件并不少见,例如,微软亚洲研究院与雷德蒙研究院团队公开宣布,其中英机器翻译水平可“与人类媲美”(微软亚洲研究院, 2018);全球首本人工智能翻译图书“一本320页20万字的书籍,输入原文、翻译、输出中文,整个过程实际耗时不到半分钟”(孙阳, 2018);Translate.com被挪威广播公司(NRK)披露出存在大规模隐私违规行为(Tomteret al., 2017)等。以上事件反映出语言服务提供商和翻译技术企业在不同程度上存在夸大宣传AI机器翻译质量,唯数据论,忽视用户数据隐私的现象或行为。追根溯源,上述事件的发生多是由于相关方数据伦理意识淡薄,在把控翻译数据使用的正当性、适宜性和隐私性方面缺乏相应的原则指导。本文建议语言企业应从以下方面强化伦理意识:(1)根据企业特点开展伦理教育。语言服务提供商的服务环节涉及领导层、翻译部、本地化部、项目管理部等多部门人员,企业应通过制定内部伦理制度强化员工伦理意识;翻译技术企业应定期探讨技术开发和运营环节中的数据使用规范,提升相关人员的数据伦理素养,强化对数据伦理的认知深度。(2)规范宣传营销手段。企业是数据资源共享的主要获益者,应该在加强技术革新和数字化转型的同时,充分平衡商业利益与伦理道德之间的关系,注重相关产品服务的宣传原则,“不得夸大产品质量、偷换概念、掩盖产品缺陷,进行虚假宣传”(韩林涛, 2019: 56)。(3)制定企业内部跨部门数据共享的伦理原则。企业内部利用频繁的跨部门数据共享创造新的价值,改善技术的先进性,提升服务效率。但因伦理意识薄弱导致的数据不正当共享则会引发隐私泄露、数据异化等伦理风险的事件频频发生。因此,为企业内部跨部门之间的数据共享制定伦理原则可有效规避此类伦理风险。

  为了更好地保护利益相关者的数据权益和个人隐私,译者个体需要重构大数据伦理观念,明确其作为人类翻译主体在翻译数据活动中的主观地位,树立数据责任意识,提高自身大数据伦理素养。从语言专业人才角度来讲,应做到以下三点:(1)树立高度的数据责任意识。权利和责任是相辅相成的,译者应增强数据安全意识,自觉承担起自我数据保护的责任,同时也要自觉承担起监督他人合法获取和使用数据的义务。(2)提高个人数据权益和数据伦理意识。结合国家数据安全战略,增强自身对于翻译领域数据伦理问题的敏感性,主动去营造一种互相尊重个人隐私、维护数据权益的良好氛围。(3)提升个人数据素养。译者应当拓宽自身获取数据或信息的渠道,强化在数据的采集、处理、分析、共享、保护和利用等方面的能力。因数据具有不同的结构和类型,译者需要具备扎实和广泛的数据知识和牢固的数据防护底层思维,拒绝唯数据论,远离“数据崇拜”。

  随着学科和技术的不断发展,翻译领域的诸多伦理问题日益凸显。为寻求问题解决之道,笔者呼吁全社会共同推动翻译数据伦理体系建设,遵循可用、可靠、可知三个方面的原则:(1)可用。大数据时代的技术发展是普惠和可持续的,需要让尽可能多的人可以获取、使用其所应该知道的信息,避免因数据获取权限的差异导致其数据权利受损。(2)可靠。机器翻译和翻译生产平台的研发应当遵循安全可靠的基本伦理,能够防范用户隐私数据泄露、网络攻击等恶意干扰风险,确保用户的数据安全,通过不断的深度学习,避免数据异化现象发生。(3)可知。制定机制以及时公布数据的采集和使用情况,保持适当的透明性,避免数据“黑匣子”损害用户的数据权利。

  尽管有些学者开始重新审视新时代语境下的翻译伦理变化及其影响,并尝试拓展翻译伦理的研究范畴。然而,伦理是一个开放性的概念体系,其发展呈现动态的、历史的、多维的演化特征,目前学界尚未形成系统化的翻译技术伦理研究体系。建议高校和相关研究机构以发展、开放的视野,将翻译数据伦理与翻译技术伦理融入翻译伦理的总体框架之中,构建一个符合翻译技术时代特点的翻译伦理知识体系和研究范式,共同推动翻译伦理体系在新时代的协同发展。双方可从以下方面践行:(1)高校层面应设立专门的伦理课程模块,构建完整的数据伦理知识体系,加强翻译专业师生的数据伦理素养,平衡翻译技术的发展和技术异化的伦理关系,促进高校翻译伦理教育的发展。(2)研究机构层面应加大翻译伦理体系构建的研究力度,从跨学科、跨行业的视角研究数据伦理、技术伦理、职业伦理等热点话题在翻译学科中的产生、发展及影响,结合时代发展特色,不断完善翻译伦理体系。

  在《新一代人工智能发展规划》国家战略的有力推动之下,泛在化的算法和数据正在催生新型数据经济,构建新型数据社会。逐渐兴起的机器主义和数据主义正在挑战着翻译的生态环境,翻译生产关系也在发生结构性的变革。与此同时,数据权利、数据安全、数据滥用、数据异化等伦理问题以大数据副产物的形式阻碍着语言服务行业的长足发展,翻译数据的伦理规制愈发不可或缺。本文呼吁关注翻译活动中的数据伦理问题,加强翻译数据法律法规建设,坚守新时代契约精神,提高译者数据伦理素养,构建大数据时代的翻译伦理研究体系,更好地应对大数据技术给语言服务行业带来的机遇与挑战。期待学界同仁更多关注行业技术革新过程中出现的翻译数据伦理和技术伦理问题,共同促进业态的健康发展。

  [1] Bowker,L. TranslationTechnology and Ethics[A]. In Koskinen, K. &Pokorn, N. K. (Eds.). The Routledge Handbook of Translation andEthics [C]. London & NewYork: Routledge, 2020:262-278.

  [2] Cadwalladr,C. & Graham-Harrison,E. Revealed: 50 million Facebook profiles harvested for Cambridge Analytica inmajor data breach [EB/OL]. (2018-03-17).

  https://www.theguardian.com/news/2018/mar/17/cambridge-analytica-facebook-influence-us-election.2021-03-31.

  翻译学博士,副教授,北京外国语大学高级翻译学院硕士研究生导师,兼任世界翻译教育联盟翻译技术研究会会长,中国翻译协会本地化服务委员会副秘书长,中国英汉语比较研究会外语教育技术专业委员会副秘书长,《中国科技术语》编委等。多年来致力于推动翻译技术产学研的生态融合,在《中国翻译》《外国语》《外语电化教学》《上海翻译》等期刊发表论文六十余篇,主持国家级、省部级及校级科研项目十多项,出版《人工智能时代翻译技术研究》《计算机辅助翻译概论》《应用程序本地化》《翻译与本地化项目管理》等十多部著作。研究领域:翻译技术、外语教育技术、语言服务管理。

  上海海事大学外国语学院2019级硕士研究生,专业为英语笔译,曾在《外语教学》、《中国科技术语》、《中国ESP研究》等刊物上发表论文。研究方向:翻译技术、术语管理、机器翻译译后编辑。

  特别说明:

  责任编辑:

上一篇:原创“片”女星血泪史:舒淇拍六部赚10万、陈宝莲被母亲贱卖
下一篇:爱迪奥特曼和尤莉安也会玩“合体” 双修双重神力,这招可让杰特领盒饭