計(jì)算機(jī)輔助翻譯概述
計(jì)算機(jī)輔助翻譯(Computer-Aided/Assisted Translation, CAT)在廣義上涵蓋了所有能夠協(xié)助譯員完成翻譯工作的計(jì)算機(jī)工具,包括但不限于文字處理、格式轉(zhuǎn)換以及電子詞典等。在狹義上,計(jì)算機(jī)輔助翻譯特指那些專為提升翻譯效率、優(yōu)化翻譯流程而設(shè)計(jì)的專業(yè)計(jì)算機(jī)輔助翻譯軟件/系統(tǒng)。
計(jì)算機(jī)輔助翻譯的核心之一是翻譯記憶技術(shù)。與機(jī)器翻譯不同,計(jì)算機(jī)輔助翻譯并非直接將源語言轉(zhuǎn)換為目標(biāo)語言,而是輔助譯員開展翻譯工作。譯員可借助計(jì)算機(jī)輔助翻譯軟件/系統(tǒng)積累術(shù)語、建立和完善記憶庫等,從而在后續(xù)翻譯工作中提高翻譯質(zhì)量和效率。
(一)核心概念
計(jì)算機(jī)輔助翻譯技術(shù)涉及多個(gè)核心功能,這些功能模塊共同協(xié)作達(dá)到計(jì)算機(jī)輔助翻譯的效果。
翻譯記憶(Translation Memory):翻譯記憶是計(jì)算機(jī)輔助翻譯軟件/系統(tǒng)的關(guān)鍵組成部分,通過建立數(shù)據(jù)庫來存儲(chǔ)和檢索已翻譯過的句子或片段。當(dāng)譯員遇到相同或相似文本時(shí),翻譯記憶系統(tǒng)會(huì)自動(dòng)檢索并提供翻譯建議,從而避免重復(fù)工作,提高翻譯效率。
語料對(duì)齊(Alignment):語料對(duì)齊是將雙語或多語材料以詞句或段落為單位自動(dòng)切分為翻譯單位、并依序匹配源語和目標(biāo)語的人機(jī)交互半自動(dòng)過程,其本質(zhì)是建立源語與目標(biāo)語詞、短語、句、段等相同語言單位間的對(duì)應(yīng)關(guān)系。語料對(duì)齊是依據(jù)現(xiàn)有翻譯資源建立翻譯記憶庫的過程。
術(shù)語管理(Terminology Management):術(shù)語管理是計(jì)算機(jī)輔助翻譯的重要環(huán)節(jié),它允許譯員集中管理和維護(hù)專業(yè)術(shù)語。通過術(shù)語管理,譯員可確保整個(gè)翻譯項(xiàng)目中術(shù)語的一致性和準(zhǔn)確性,避免術(shù)語混淆或誤用。
機(jī)器翻譯(Machine Translation):機(jī)器翻譯是計(jì)算機(jī)輔助翻譯的一項(xiàng)重要功能,它可以利用先進(jìn)的自然語言處理算法和大量語料數(shù)據(jù)自動(dòng)將源語言文本翻譯成目標(biāo)語言。雖然機(jī)器翻譯無法完全替代人工翻譯,但它可以作為一個(gè)快速、初步的翻譯工具,為譯員提供參考和輔助。
譯后編輯(Post-editing):譯后編輯是機(jī)器翻譯后的重要步驟,包含審查和修改機(jī)器翻譯結(jié)果等步驟。譯員需要仔細(xì)檢查機(jī)器翻譯的輸出內(nèi)容,修正其中的錯(cuò)誤、不準(zhǔn)確或不符合目標(biāo)語言習(xí)慣的表達(dá),以確保最終譯文的準(zhǔn)確性和流暢性。
質(zhì)量保證(Quality Assurance):質(zhì)量保證是計(jì)算機(jī)輔助翻譯的一項(xiàng)重要功能,它能夠?qū)ψg文進(jìn)行自動(dòng)檢查,識(shí)別并指出可能存在的錯(cuò)誤或疏漏之處。檢查內(nèi)容包括數(shù)字、空格、標(biāo)記、術(shù)語一致性、漏譯句段等。通過檢查,譯員可以及時(shí)發(fā)現(xiàn)并糾正錯(cuò)誤,確保譯文質(zhì)量。
流程管理(Process Management):流程管理可以提升翻譯流程的自動(dòng)化和標(biāo)準(zhǔn)化水平。典型的計(jì)算機(jī)輔助翻譯流程包括文檔預(yù)處理、切分與分析、翻譯與編輯、質(zhì)量保證、審校、后處理與導(dǎo)出等。
項(xiàng)目管理(Project Management):項(xiàng)目管理是確保翻譯流程高效、有序進(jìn)行的關(guān)鍵環(huán)節(jié)。它涵蓋了從項(xiàng)目啟動(dòng)到交付的所有階段,包括需求分析、任務(wù)分配、進(jìn)度規(guī)劃、資源管理(如翻譯團(tuán)隊(duì)、翻譯記憶庫、術(shù)語庫等)、質(zhì)量控制和最終交付。計(jì)算機(jī)輔助翻譯軟件/系統(tǒng)通常會(huì)提供內(nèi)置或集成的項(xiàng)目管理模塊,幫助項(xiàng)目經(jīng)理跟蹤各個(gè)翻譯任務(wù)的狀態(tài)、監(jiān)控任務(wù)進(jìn)度,以及協(xié)調(diào)多語言、多譯員之間的工作。
(二)發(fā)展歷程
計(jì)算機(jī)輔助翻譯發(fā)展主要經(jīng)歷了萌芽期、穩(wěn)定發(fā)展期、迅猛發(fā)展期和蓬勃發(fā)展期四個(gè)階段。
1. 萌芽期(1967-1983)
1966 年,美國科學(xué)院自動(dòng)語言處理咨詢委員會(huì)(Automatic Language Processing Advisory Committee, ALPAC)發(fā)布的報(bào)告全面否定了機(jī)器翻譯的可行性,并建議停止對(duì)機(jī)器翻譯項(xiàng)目的資金支持,使得機(jī)器翻譯研究遭到重創(chuàng),人們轉(zhuǎn)而開始尋求以其他方式提升翻譯效率,研究可應(yīng)用于機(jī)器翻譯的語言和計(jì)算解決方案,這在一定程度上促進(jìn)了基于語料庫和統(tǒng)計(jì)學(xué)的翻譯技術(shù)研究,為計(jì)算機(jī)輔助翻譯奠定了基礎(chǔ)。翻譯記憶的概念最早出現(xiàn)于 1979 年,當(dāng)時(shí)被稱為文本檢索翻譯(Translation by Text Retrieval)。多層次的計(jì)算機(jī)輔助翻譯系統(tǒng)的設(shè)想出現(xiàn)于 1983 年,在這一設(shè)想下,計(jì)算機(jī)輔助翻譯系統(tǒng)具有三層意義,分別為基本文字處理與術(shù)語管理、術(shù)語檢索和參考譯文以及更加成熟的翻譯工具,其中包括全自動(dòng)機(jī)器翻譯。借助成熟的翻譯工具,譯員可以修訂機(jī)器翻譯譯文并反饋結(jié)果給系統(tǒng)。
2. 穩(wěn)定發(fā)展期(1984-1992)
20 世紀(jì) 80 年代中期出現(xiàn)的翻譯支持系統(tǒng)(TSS)通常被認(rèn)為是第一代計(jì)算機(jī)輔助翻譯系統(tǒng)。但當(dāng)時(shí)的市場(chǎng)尚未準(zhǔn)備好使用這類工具,國外的大多數(shù)譯者仍在使用打字機(jī)。1984 年,世界上最早的兩家計(jì)算機(jī)輔助翻譯公司——塔多思(TRADOS GmbH)和 STAR 集團(tuán)(STAR Group)成立。1990 年,塔多思發(fā)布了首版 MultiTerm,最初是用作 DOS 下的術(shù)語管理工具,也是塔多思的主要應(yīng)用程序之一。1991 年,STAR 集團(tuán)推出了供內(nèi)部使用的計(jì)算機(jī)輔助翻譯系統(tǒng) Star Transit。
3. 迅猛發(fā)展期(1993-2002)
經(jīng)歷了初步穩(wěn)定發(fā)展后,翻譯行業(yè)涉及的業(yè)務(wù)領(lǐng)域逐漸增多,翻譯技術(shù)和工具的應(yīng)用更加多樣化。1993 年,法國 Atril 公司發(fā)布了首款基于 Microsoft Windows 的計(jì)算機(jī)輔助翻譯系統(tǒng) Déjà Vu。1994 年,塔多思開發(fā)了可在 Microsoft Windows 中運(yùn)行的 Translator’s Workbench。此后,市場(chǎng)上計(jì)算機(jī)輔助翻譯軟件/系統(tǒng)數(shù)量越來越多,語料對(duì)齊、機(jī)器翻譯及項(xiàng)目管理等功能逐步完善,減少了譯員在非核心翻譯工作上的投入。
4. 蓬勃發(fā)展期(2003 年至今)
計(jì)算機(jī)輔助翻譯技術(shù)進(jìn)一步發(fā)展,各種新版工具相繼出現(xiàn),功能逐步完善,翻譯記憶系統(tǒng)也不斷升級(jí)并被廣泛接受。進(jìn)入 21 世紀(jì)后,計(jì)算機(jī)輔助翻譯軟件/系統(tǒng)的界面和功能進(jìn)一步完善。眾多軟件/系統(tǒng)開始采用獨(dú)立操作界面(不再作為文字處理軟件的插件),支持在 Microsoft Windows、macOS、Linux 等多種計(jì)算機(jī)操作系統(tǒng)中使用,可以兼容幾十種文件格式,并能在翻譯完成后保持文件版式不變
2006 年,計(jì)算機(jī)輔助翻譯取得巨大進(jìn)步,具備了自動(dòng)質(zhì)量檢查、譯文匹配、用戶界面本地化等新功能。此外,各種項(xiàng)目整合與翻譯管理解決方案相繼出現(xiàn)。2009 年國產(chǎn)計(jì)算機(jī)輔助翻譯軟件雪人 1.0 版本發(fā)布,同年 Lingotek 推出了軟件即服務(wù)協(xié)作翻譯技術(shù)。2010 年起,各種翻譯任務(wù)通過眾包、協(xié)作的形式進(jìn)行。期間出現(xiàn)了一些具有項(xiàng)目管理、項(xiàng)目實(shí)時(shí)分享等功能的新版計(jì)算機(jī)輔助翻譯軟件/系統(tǒng),如 Across Language Server Service Pack 5.1、memoQ 4.0、Atril TEAMserver 2.0、Wordfast Classic 6.0 等。
2012 年以后,大數(shù)據(jù)、云計(jì)算時(shí)代的到來催生了許多云翻譯平臺(tái),傳統(tǒng) C/S 架構(gòu)的計(jì)算機(jī)輔助翻譯軟件/系統(tǒng)移植到云端(B/S 架構(gòu)),在云端進(jìn)行協(xié)作翻譯并同步保存翻譯記憶庫和術(shù)語庫。隨著人工智能的迅猛發(fā)展,計(jì)算機(jī)輔助翻譯的智能提示、上下文信息搜索、實(shí)時(shí)錯(cuò)誤檢測(cè)與修正等功能不斷完善,術(shù)語管理和知識(shí)庫建設(shè)也更加便捷。
(三)系統(tǒng)架構(gòu)
系統(tǒng)通常包含以下關(guān)鍵層次(圖 1),以優(yōu)化翻譯流程、減少重復(fù)勞動(dòng)、提高翻譯質(zhì)量,并適應(yīng)不斷變化的技術(shù)需求和發(fā)展趨勢(shì)。

圖 1 系統(tǒng)架構(gòu)圖
1. 用戶交互層
用戶界面:提供直觀、易用的圖形化界面,使譯員能夠高效地進(jìn)行翻譯操作。界面通常包括文本編輯器、翻譯結(jié)果匹配/搜索窗口、術(shù)語匹配/查找窗口等。
導(dǎo)入/導(dǎo)出支持:兼容多種文件格式,如 docx、xlsx、pptx、pdf、html、xml 等。既可以導(dǎo)入單個(gè)文件,也可以導(dǎo)入多個(gè)文件。每種文件都可以自定義篩選條件,僅導(dǎo)入需要翻譯的內(nèi)容。支持譯中、譯后導(dǎo)出文件,也支持單個(gè)文件、多個(gè)文件、篩選內(nèi)容的導(dǎo)出等。
2. 功能服務(wù)層
項(xiàng)目管理:設(shè)置翻譯、審校、簽發(fā)等不同階段的工作流程和任務(wù)分配,跟蹤項(xiàng)目進(jìn)度。
翻譯記憶庫管理:創(chuàng)建和維護(hù)翻譯記憶庫,存儲(chǔ)已確認(rèn)譯文的句段,在新項(xiàng)目中自動(dòng)檢索相同或相似內(nèi)容以提高翻譯效率和一致性。
術(shù)語庫管理:創(chuàng)建和維護(hù)術(shù)語庫,確保術(shù)語翻譯的便捷性、準(zhǔn)確性和統(tǒng)一性。
機(jī)器翻譯: 為用戶提供初步翻譯建議或完成部分自動(dòng)化翻譯任務(wù)。
質(zhì)量保證:通過數(shù)字檢查、標(biāo)記檢查、術(shù)語檢查、 一致性檢查以及拼寫和語法檢查等,提升翻譯質(zhì)量。
資產(chǎn)管理:對(duì)翻譯記憶庫、語言處理規(guī)則和項(xiàng)目模板等關(guān)鍵資源的集中維護(hù)和管理,確保翻譯一致性、 提高工作效率,提升項(xiàng)目管理的便捷化和標(biāo)準(zhǔn)化水平。
用戶管理:對(duì)譯員、審校人員和其他參與者進(jìn)行角色賦權(quán)、身份認(rèn)證、工作量統(tǒng)計(jì)、績(jī)效評(píng)估及個(gè)性化設(shè)置等方面的集中控制和管理,以實(shí)現(xiàn)對(duì)項(xiàng)目成員的有效組織和激勵(lì),提升協(xié)作效率,確保翻譯過程順暢、可控。
3. 數(shù)據(jù)管理層
數(shù)據(jù)庫系統(tǒng):用于存儲(chǔ)和管理翻譯記憶庫、術(shù)語庫、用戶設(shè)置、項(xiàng)目信息等數(shù)據(jù),實(shí)現(xiàn)版本控制和權(quán)限管理。
資源索引與檢索引擎:快速精準(zhǔn)地從大量翻譯記憶數(shù)據(jù)中提取匹配項(xiàng),降低譯員工作負(fù)擔(dān)。
實(shí)時(shí)更新與增量索引:隨著翻譯內(nèi)容的更新和增加,動(dòng)態(tài)更新索引系統(tǒng),確保最新翻譯結(jié)果及時(shí)納入檢索體系。
4. 底層技術(shù)支撐層
預(yù)處理與后處理:對(duì)原始文檔進(jìn)行格式識(shí)別、結(jié)構(gòu)分析、拆分、標(biāo)記、通過翻譯記憶庫預(yù)翻譯等預(yù)處 理,對(duì)翻譯結(jié)果進(jìn)行內(nèi)容重組、合并、格式還原等后處理。
API 接口與集成:提供標(biāo)準(zhǔn)化應(yīng)用程序接口,便于與其他業(yè)務(wù)系統(tǒng)如翻譯管理系統(tǒng)(TMS)、內(nèi)容管 理系統(tǒng)(CMS)、客戶關(guān)系管理系統(tǒng)(CRM)等進(jìn)行數(shù)據(jù)交換和功能整合。
5. 基礎(chǔ)設(shè)施層
硬件環(huán)境:服務(wù)器、網(wǎng)絡(luò)設(shè)備及終端設(shè)備等硬件設(shè)施,確保計(jì)算機(jī)輔助翻譯軟件/系統(tǒng)穩(wěn)定運(yùn)行。
云服務(wù):部署在云端的計(jì)算機(jī)輔助翻譯軟件/系統(tǒng)還需有云平臺(tái)計(jì)算能力、存儲(chǔ)容量、安全策略以及高 可用性保障等方面支持。
(四)產(chǎn)品形式
計(jì)算機(jī)輔助翻譯軟件/系統(tǒng)的產(chǎn)品形式主要包含桌面應(yīng)用、在線/云端解決方案、插件或集成式工具以及 定制化企業(yè)級(jí)系統(tǒng)四類:
1. 桌面應(yīng)用
為用戶提供獨(dú)立安裝在本地計(jì)算機(jī)上的計(jì)算機(jī)輔助翻譯軟件/系統(tǒng),支持離線工作。
2. 在線/云端解決方案
提供基于 Web 瀏覽器的在線翻譯環(huán)境,方便團(tuán)隊(duì)協(xié)作,實(shí)現(xiàn)遠(yuǎn)程同步翻譯和實(shí)時(shí)更新等。
3. 插件或集成式工具
針對(duì)特定軟件或需求開發(fā)的插件,集成于內(nèi)容生成、存儲(chǔ)和接收系統(tǒng)或運(yùn)營(yíng)、管理和治理平臺(tái)。
4. 定制化企業(yè)級(jí)系統(tǒng)
根據(jù)企業(yè)個(gè)性化需求定制的大型翻譯管理系統(tǒng),不僅包含計(jì)算機(jī)輔助翻譯軟件/系統(tǒng),還可整合流程自動(dòng)化、多語言資源管理、組織/用戶管理、客戶和供應(yīng)商管理等功能。
說明: 以上內(nèi)容主要介紹計(jì)算機(jī)輔助翻譯的基本架構(gòu)和常見產(chǎn)品形式,實(shí)際產(chǎn)品和服務(wù)正隨著市場(chǎng)需求和技術(shù)的進(jìn)步不斷演進(jìn)。
本文來源:《2024 計(jì)算機(jī)輔助翻譯技術(shù)發(fā)展與應(yīng)用藍(lán)皮書》