翻译服务在国际救援中是不可或缺的,早期国际救援中的翻译工作多依赖人工,尽管大语言模型在20世纪50年代就已经出现,其在国际救援翻译服务中的应用却是近几年随着人工智能技术的快速发展而兴起的。比如2016年的神经网络模型、2018年的GPT模型、2020年后的GPT-3与BERT、2022年的数据增强技术,这些经历过升级迭代的大语言模型的翻译性能大幅提升,一些组织开始将之应用于紧急情况的实时翻译。谷歌等科技公司将这一技术用于危机响应的尝试大约是从2020年开始的。比如,谷歌在新冠疫情期间提供的机器翻译服务是一种在线翻译工具,在新冠疫情的信息发布方面发挥了重要作用,使用户更好地了解疫情的发展情况、防护措施以及医疗建议。Facebook的M2M-100多语种机器翻译模型也被用于翻译新冠疫情相关信息。微软与联合国儿童基金会合作,利用机器翻译技术将新冠疫情防控知识资料翻译成不同语言。
中国的医疗外援队也开始小规模地使用大语言模型。根据当下在尼日尔的医学救援队译员的介绍,救援队译员开始使用DeepL和法语助手,但对当地的了解主要还是通过当地电视新闻台。现在国内的语言服务行业,比如翻译公司,可以共享与大语言模型互补的医学术语库,使译员有更好的知识储备,而他们派出的援外译员已经在使用ChatGPT。在国内大型体育赛事中,人工智能翻译已经开始被运用于日常翻译与突发事件,译员可选择独立的翻译设备、手机应用或在线翻译网站辅助翻译。在工作过程中,译员也可根据翻译内容和语言环境,决定人工智能翻译占比。
大语言模型对于突发事件语言服务的意义还在于舆情分析,从宏观与微观的视角对事件进行了解,从而能够在很大程度上避免断章取义的误读或误报。
大语言模型在翻译中的应用与局限
2023年,以ChatGPT为代表的新一代大语言模型受到全世界热捧。这是因为研究人员使用了更先进的神经网络技术,通过优化模型结构、增加训练数据、预先训练等方法,让翻译质量有了飞跃式提高。新模型能感知上下文环境、分析语义、处理长句子,其生成的译文更加流畅自然,而且可以通过自我学习不断改进,与人的互动效率更高。与人工翻译相比,大语言模型的优势在于响应迅速、可持续高效运转、不会出现疲劳问题。不同模型可以同时运行、互相对照和校验,以此获得更准确的译文。在突发事件场景下,所需翻译的沟通语言难度通常属于中低级别,例如一般口语对话、简单文书等,大语言模型的性能表现大体相当,可以满足需求。现在科技公司推出的机器翻译系统已经可以支持多达100多种语言的翻译,虽然尚未实现所有这些语言的互译。BERT、GPT-3、DeepL等知名的大语言模型还可提供个性化的翻译服务。欧盟委员会的eTranslation平台提供24种语言的机器翻译服务,以帮助移民群体获取信息。联合国则利用自有的语料库UNCorpus训练了翻译模型,用于内部文件等的多语种翻译工作。
先进的大语言模型和机器翻译系统的结合为突发事件的跨语言沟通开辟了新路径,尤其在应对疫情、灾难等紧急状况时发挥了不可或缺的作用。然而,目前这些技术的应用领域和深度仍有待进一步挖掘和拓展,同时我们也需谨慎评估其利弊。尽管这些系统已经取得了显著的成效,但为了更好地满足多样化语言和文化背景的需求,其应用仍需不断精进和完善。
大语言模型在实际应用中面临的挑战也显而易见。例如,在处理特殊领域术语、错别字、非正式语言等方面,模型的能力存在一定的局限性。此外,如何有效地整合多个模型的输出结果也是一个需要深入研究和实践探索的问题。因此,选择工具应视情况而定。例如,对于某些小语种和特定领域的数据,大语言模型可能缺乏训练数据,导致偏差。一方面,在事件初期,对于相对偏僻的地区情况,大语言模型可能并不完全了解;另一方面,对于专业领域较冷僻的术语或新术语,大语言模型也可能存在应对障碍。此外,大语言模型依赖于网络,如果网络中断或有人输入恶意信息,它也可能因为无法辨别输入来源而在工作中提供给使用者虚假信息。实际上,大语言模型应用过程中已经暴露出一些问题,引发了对其安全性的担忧。为此,欧盟提出了《人工智能法案》,旨在确保大语言模型的安全性得到有效保障。同时,在美国也有议员呼吁对大语言模型进行安全审查,以进一步保障其应用的可靠性和安全性。
为了突破大语言模型在处理专业术语方面的局限,我们可以考虑利用共享语料库。例如,联合国语料库覆盖联合国6种官方语言,而欧洲语料库则涵盖欧洲23种语言。此外,还有如语言资源与评估语料库、多语言laborers语料库、亚洲语言树库和TAUS多语言语料库等,它们提供了丰富的多语言平行语料和术语词库,为翻译工作提供了宝贵资源。在特定专业领域,共享专业领域语料库同样发挥着不可替代的作用。例如,医学信息检索语料库和医疗对话语料库等医学语料库为医学翻译提供了有力支持;FinNum等金融术语语料库则为金融领域的翻译提供了精准术语;Chinese Law Corpus中英对照法律语料库、Duolingo语料库等教育语料库以及航空语料库和科技论文语料库等,都为各自领域的翻译工作提供了重要支持。共享语料库可以帮助大语言模型更好地理解和处理专业术语。通过访问包含专业术语的大量文本数据,模型可以学习到这些术语的上下文用法和含义,从而提高在处理专业领域文本时的准确性和效果。然而,这仅仅是解决问题的一部分。除了语料库的质量和规模之外,还需要考虑模型本身的设计和训练方法,以及如何将学到的知识有效地整合到模型中。
尽管大语言模型在社交平台的自动音视频翻译等方面得到了广泛应用,但在处理突发事件时,它们仍然只能作为辅助工具,不能完全替代人工把控。对于专业译员而言,大语言模型可以作为一个强大的参考工具,提供有用的参考和指导。因此,我们应该继续深入探索和完善大语言模型的应用,以满足不同领域和场景的需求,同时充分发挥译员的专业优势,实现人机协同,共同推进翻译工作的进步。
人工智能视角下翻译教学的应对
随着教育改革的不断深化,我们需要跟进相应的翻译教学改革,以适应技术进步带来的挑战。近年来,我们的培养计划开始重视技术素质的培养。然而,ChatGPT的崭露头角预示着新的发展趋势,这迫使我们必须思考如何利用这一技术,以培育出更高水平的人才。ChatGPT是一个基于人工智能的语言模型,它在自然语言处理和对话系统方面的应用为教育领域带来了新的可能性。
我们的焦点已经从单纯的技术能否取代人工的问题,转向了如何更有效地利用技术来提升我们的服务质量和效率。科技公司的尖端技术在危机应对中已经登场,尽管这些系统已取得了显著的成效,但为更好地满足多样化语言和文化背景的需求,其应用仍需不断提升。为此,我们需要采取切实可行的措施,例如,利用共享语料库来改善大语言模型在处理专业术语方面的表现,这方面的教学应相应开展。
我们翻译学的培养目标正在发生深刻的变化,不再仅仅关注单一的语言知识,而是朝着培养复合型、应用型人才的方向迈进。为了实现这一目标,我们将“机器翻译+译后编辑”纳入教学内容。学生需要识别机器翻译的错误,理解不同系统的偏差,并针对性地进行编辑。这反映了生成式AI的未来趋势,即机器翻译的准确度虽然有所提高,但仍存在偏差,因此仍需要人工译员进行创造性、批判性的编辑。
同时,我们积极融合传统课程与ChatGPT等平台化、泛在化的先进技术,以提升学生的语言表达能力。随着技术能力逐渐成为译员职业素养的核心组成部分,我们的教学方式也正在经历深刻的变革。过去,教学主要依赖教材和教师的讲授;如今,借助各种工具使教学得到实时技术的支持,从而能够现场查询背景材料并分析案例,进而实现个性化、情境化的高效教学。未来,语言转换、技术运用、团队协作的综合性翻译服务将成为翻译教学的主体。
(作者系福建师范大学外国语学院教授;福建师范大学翻译与国际传播研究中心助理研究员)
