(原標題:殺死那個人類同傳)
2018年9月20日,知乎上一篇圖文并茂的文章,將人們對“機器翻譯”的質(zhì)疑,再次置于放大鏡下。
文章作者Bell Wang,一名同聲傳譯工作者,指責著名的人工智能公司——科大訊飛在一場由他擔任同傳的會議上,沒打招呼,就直接把他和搭檔口譯的內(nèi)容語音識別成了文字并打到大屏幕上。而屏幕上顯眼的“訊飛聽見”logo,給了現(xiàn)場觀眾很大的誤導,讓人以為這中文字幕是機器翻譯軟件直接翻譯得出的。
這篇文章迅速發(fā)酵,作為上市公司的科大訊飛不得不出面回應,強調(diào)自己“從沒有說過要取代人類”,沒有主觀惡意。在連續(xù)的幾場發(fā)布會和新聞稿中,高深莫測的“人機耦合”概念再次被科大訊飛拿出來,用于解釋他們的機器翻譯理念。
機器翻譯是為了幫助人類翻譯的,科大訊飛說。
盡管如此,同傳界對科大訊飛的負面觀感,并未因此減退。
PingWest品玩采訪了多位同傳從業(yè)者,他們普遍對科大訊飛缺乏正面印象。這并是不來自“機器翻譯搶走人類飯碗”的擔憂,而是源于包括科大訊飛在內(nèi)的一眾“機器翻譯公司”,對同傳從業(yè)者“缺乏起碼的尊重“。
在這種糟糕的互動關系背后,自人類有文明交流以來便出現(xiàn)的語言翻譯,正在走向兩個分岔路。
公然羞辱
2017年底,美國前總統(tǒng)奧巴馬來到中國參加了一場企業(yè)峰會。這場會議后來因大量流出的“微商握手奧巴馬”圖片而走紅。不過在這場走穴現(xiàn)場,真正的主角是科大訊飛。
入行5年的同傳譯員喬亞(化名)是當天會議的同傳之一。會議即將開始前,現(xiàn)場一片混亂,一名主辦方工作人員匆匆找到正在做最后準備的喬亞和她的搭檔,說“科大訊飛也會來”。主辦方告訴她們,科大訊飛在會上會把她們的同傳用語音識別技術展示在大屏幕上,提醒她們翻譯時要“小心一些”。
在當天這場”寸時寸金“的活動上,主辦方安排了多場路演,但由于時間把握的問題,幾個講者在演講末尾不得不提高語速,最終快到同傳無法及時翻譯?!八砸粋€直接結(jié)果就是,當時屏幕出現(xiàn)長時間空白,不一會兒科大那邊就直接把屏幕關了?!?/p>
活動結(jié)束時喬亞一度擔心自己的翻譯完成度,擔心客戶會不滿意。但接下來的一幕卻讓她更加憤怒:
活動全部結(jié)束后,科大訊飛的一名高層突然蹦到臺上,對奧巴馬驕傲地說到:“今天我們在屏幕上看到的實時字幕,都是科大訊飛的翻譯技術做的同傳?!?/strong>
而在當天的活動全程中,科大訊飛自始至終沒有和譯員有過任何接觸。
這樣的做法與Bell Wang在知乎熱文里吐槽的行為如出一轍,而PingWest品玩采訪的多名同傳都表示,自己也受到過相似的待遇。
張偉是一名從事同傳8年的譯員,他記得在至少兩次他同傳的活動中,現(xiàn)場嘉賓在發(fā)言中突然脫稿說,如果他當天帶來了自己公司的翻譯產(chǎn)品,就不需要今天的同傳了。而更加諷刺的是,作為現(xiàn)場的同傳,他還需要把這些言論翻譯成英文告訴老外觀眾。
“第一次遇到這種場景的時候我特別氣憤,但作為譯員我們要保持客觀,我還是給他翻了。當時我和搭檔互相看了一眼,兩人滿臉的抵觸?!?/p>
如今國際化的科技大會越來越多,那些擁有翻譯技術的科技公司嘉賓,總是喜歡拿就在現(xiàn)場的人類同傳說事,并且對這種近乎公然羞辱的行為自我感覺良好。
在接受采訪的多名同傳的描述中,這些機器與人共存的場合,沒有協(xié)同工作,也沒有同場競技,有的只是荒謬的鬧劇, Bell Wang吐槽的這一次與他們經(jīng)歷的并沒有什么區(qū)別。唯一的不同只是,這一次事情“鬧大了”,不再只局限于同傳圈子。
“業(yè)內(nèi)的朋友們也開始在我身上寄托很多期望,希望維護合理的權利和訴求。” Bell Wang 在自己帖子引發(fā)巨大反響后這樣說到。
“從業(yè)者越來越浮躁”
中國人對科技的熱衷,讓“AI取代人類”成了所有人掛在嘴邊的話題。說的多了,許多”震驚體“的標題,也開始被所有人嚴肅對待。
如今你時不時就會在網(wǎng)上看到“AI取代同傳”樣式的標題,在張偉印象中,同傳圈第一次集體因此憤怒是2013年,當時中國移動的前董事長王建宙在央視接受采訪,他強調(diào)4G帶來傳輸速度的飛躍將大大提升機器翻譯的速度,進而替代人類同傳。
“如果4G讓做同聲傳譯的失業(yè)了,那我們這個行業(yè)就太高興了?!?王建宙隨口一說,同傳們焦慮許久。
小L是一名入行不到4年的年輕同傳,她的生活節(jié)奏代表了最典型的同傳譯員。我在她上下午兩場活動的間隙見到她:一身嶄新西裝、腳踏高跟鞋,但依舊走路生風。雖然過往一周每天都在“接會”(擔任會議的同傳),但在她化著淡妝的臉上卻看不到絲毫疲態(tài)。對這種快節(jié)奏的生活,她早已習慣?!斑@是做同傳的常態(tài)。”她說。
在大部分時間里,她都保持著職業(yè)的微笑,只是當談及AI翻譯的話題時,她皺起了眉。
在此次科大訊飛的風波之前,機器翻譯就曾在主流輿論中引發(fā)過一次熱議。今年4月的博鰲亞洲論壇上,騰訊的機器同傳產(chǎn)品“翻譯君”高調(diào)亮相。
小L記得,在博鰲論壇開幕前,她以前合作過的一個客戶給她轉(zhuǎn)來一篇文章,內(nèi)容是騰訊為”翻譯君“亮相而發(fā)布的新聞稿,但題目則被多家自媒體改作“AI即將取代同傳”。
“他什么意思?以后不需要和我合作了?”小L心里想,當時感到有點慌。不過之后的進展讓她松了口氣。
在那個熱鬧的大會上,“翻譯君”僅用幾天時間就從“業(yè)界首個完整AI同傳服務”,迅速淪為一個錯誤百出的蹩腳翻譯,諸如“我們需要一張臉,一張新的臉”的翻譯讓人哭笑不得,整體聽下來也是磕磕絆絆,基本無法通過它弄清楚現(xiàn)場在討論些什么。
小L覺得可笑,但緊跟而來的則是憤怒。
“同傳這個行業(yè)向來是靠實力說話,你的翻譯水平、你的情商,都很重要?!毙說。“但現(xiàn)在突然間機器翻譯來了,誰都還沒看過它們真的翻出什么成果,或者真的證明比我們?nèi)祟悆?yōu)秀,但是一瞬間我們所有人類同傳就是多余的了,連比較一下都不用。這感覺很不爽?!?/p>
小L2014年讀研期間開始跟著老師參加會議的同傳,正式入行。但畢業(yè)后的前2到3年,做為新人,每個月最差時可能就只有2到3場會,天天都很著急?!懊恳粋€機會都要十分珍惜,如何讓客戶滿意,跟翻譯公司維護好關系,讓他們在下一次有會的時候能想起你。然后自己還要強迫自己每天都練習聽力和翻譯??傊Σ蝗菀住!毙回憶說。
但同傳是翻譯行業(yè)的塔尖,而且同傳本身也是一個金字塔型的行業(yè),進入頂端才有機會,因此小L削尖了腦袋也要擠進去?!拔覐牟慌潞屯瑢W、前輩競爭,有機會總是會觀察其他譯者,甚至是我的搭檔,從她們的長處學習,同時也知道他們的毛病在哪?!?/p>
而這一切到了機器翻譯那,卻可以不戰(zhàn)而勝。越來越多科技公司在宣傳時都把“同傳”當成自己機器翻譯技術的靶子。
“很多時候機器犯的錯誤對人類同傳來說就是災難,比如我看到過機器翻譯在一家公司年會現(xiàn)場把人家公司名稱翻錯,在國際論壇把地名翻錯,再比如博鰲這次,連一帶一路這樣的詞語也敢翻錯。”小L說。
她覺得,這與同傳整體的低調(diào)有關:與坐在臺前和講者肩并肩的交傳不同,同傳往往“躲”在現(xiàn)場的某個角落,同時同傳譯員大多是自由職業(yè)者的工作狀態(tài),獨來獨往,競爭激烈,沒有什么抱團的習慣,也不太集體發(fā)聲。
“也許因為我們總坐在角落的箱子里,他們不知道我們的態(tài)度吧。所以這些公司總是把同傳做為宣傳中瞄準的對象。但這些動輒’替代同傳’的言論,其實是一種缺少尊重的表現(xiàn)?!毙說。
“機器翻譯水平這么差,但還把同傳做靶子,也是因為同傳是最高水平,而且也算是一個高薪的工作,說用機器取代我們會更有噱頭,有利于他們吸引關注。而且對于那些上市公司,還有利于抬升股價?!眴虂喺J為。
而張偉則感到困惑,他從行業(yè)估值角度估算了一筆賬,認為就算機器真能取代人類同傳,同傳這點市場也不值得科技公司花費如此巨大的投入。
“我算了一下,同傳市場按照2000名譯員、每名譯員每年150場會,每場按照現(xiàn)在平均水平,譯員5000元、翻譯公司拿另外的5000元,那這樣就是30個億。再加上同傳設備的租賃費大約50個億,這已經(jīng)是很高的估計,但也才多少?!睆垈フJ為,就算把他估計的數(shù)字乘以10,也根本不值得這些科技公司大張旗鼓地做。
“我看,同傳這個概念算是被這些科技公司做市場營銷的給‘綁架’了?!毙憤憤地說。然而,盡管看不上機器翻譯現(xiàn)在的水平,但小L承認,她也不確定未來10年機器翻譯會發(fā)生怎樣的變化。
這種鋪天蓋地的宣傳已經(jīng)開始影響同傳行業(yè)里的每一個人。
喬亞目前還在一所高校兼職教授同傳課程,她記得在給一個研究生班上的第一節(jié)課上,這些未來的同傳主力軍關心的最多的話題也是“AI這么強大,我們還需要學習同傳么?要不要趁早改行”。這讓她哭笑不得。
而張偉認為這很容易理解?!鞍凑宅F(xiàn)在這樣的發(fā)展,未來10年真的不好說。而這些20多歲的學生,10年后正進入事業(yè)黃金期,誰都不想在那時候被機器取代,丟掉飯碗?!?/p>
一方面親眼看著如今機器翻譯的糟糕水準,但另一方面卻又停不住的感到擔憂,如此糾結(jié)往復成了同傳們生活的一部分,給本就壓力不小的生活平添更多煩惱。
小L發(fā)現(xiàn),這幾年關于AI取代人類同傳的討論已經(jīng)取代了所有與業(yè)務相關的討論,成為行業(yè)內(nèi)唯一持久的熱議話題。
“以前還安安靜靜討論討論接會和做翻譯的業(yè)務經(jīng)驗,現(xiàn)在網(wǎng)上和群里就都是討論AI又干了什么。”小L說。“天天想這個,讓從業(yè)者都顯得越來越浮躁了?!?/p>
人類和機器互不理解
在瞄準同傳這一行業(yè)的同時,這些機器翻譯技術的研發(fā)者們對同傳的理解卻與擁有百余年發(fā)展史的同傳這一工種有很大不同。
在被問及科技界對常常提到的“機器同傳”的定義,微軟首席語音科學家黃學東對PingWest品玩表示,他們的理解更多是指語音識別與機器翻譯的結(jié)合。他表示,如今在語音識別上由于抗噪的能力還有所限,這一點比人類是要差點。但機器翻譯方面,它的速度絕對是人類比不上的。
小L就認為,同傳不是機械地翻譯,而是要保證溝通,達到交流的目的。“這些AI翻譯公司所說的同傳,和我們從事的同傳,完全就是兩個事情。”小L說。
科大訊飛在此次風波過后的回應中提到“人機耦合”的獨創(chuàng)概念?!叭藱C耦合翻譯模式,由機器提供語音轉(zhuǎn)寫和翻譯結(jié)果給同傳參考,輔助同傳降低工作強度并提升效率,文字展示區(qū)Logo顯示為‘訊飛聽見’?!?/p>
但這種服務同傳譯員的說法,看起來卻基本是一廂情愿。
根據(jù)業(yè)界的定義,同聲傳譯是指譯者用一種語言把另外一種語言所表達的內(nèi)容,以與發(fā)言人幾乎相同的速度,用口頭形式準確表達出來的一種口譯方式 。
“同傳需要很強的聽力,正確判斷講者的停頓,需要做順句驅(qū)動,也就是和講者同時開口并隨時調(diào)整邏輯確?;就角覝蚀_?!睆垈ソ榻B?!岸鴻C器現(xiàn)在就只是譯一句喘一兩分鐘,這是假同傳?!?/p>
“同傳已經(jīng)成功運行百來年,不須要這樣的支持。有些翻譯軟件其實就挺好用,利用人工智能把資料用兩分鐘譯好,關鍵詞譯的也非常準,這種人工譯員確實可以利用。”張偉說。“但人機耦合就是個偽命題,因為同傳工作路徑與訊飛的工作路徑平行,這怎么耦合?好比兩列齊頭并進的火車,同傳譯員邊聽邊譯,人工智能識別采用的信號起始點與譯員的起始點一模一樣。你不比我們快,你的車頭不可能站我們前邊拉火車。而站我們后面,我們又不需要你了?!?/p>
而且,無論是科大訊飛還是騰訊的翻譯君,在這幾次會議同傳中,都沒有任何輔助人類同傳的行為。
一位曾在博鰲大會與騰訊翻譯君“一同”為觀眾提供同傳的譯員,曾對PingWest品玩回憶當時的工作場景:“會場內(nèi)有一塊屏幕,會出AI同傳字幕,而人類同傳譯員照例坐在會議室后面角落的同傳間里,根本看不到。工作時不可能再分心去關注它,也更沒有‘共同工作’的情況??梢员扔鞒蓛商装嘧油瑫r工作。我們也是從社交媒體上看到有關報道才知道有騰訊的產(chǎn)品在現(xiàn)場的?!?/p>
而在科大訊飛此次的風波中,訊飛聽見系統(tǒng)只是把同傳的聲音轉(zhuǎn)為文字,不僅提不上幫助,而且更多是在依賴人類同傳。而且這種語音轉(zhuǎn)字幕功能在同傳場景下更顯的奇怪,炫技的成分多于解決實際需求的作用。
“現(xiàn)在很多所謂AI同傳在會場的實現(xiàn)方式都是打字幕,這樣的設計明顯是反人類的,可能更適合聽障人士。因為人們通過聽力可以獲取更多信息,而且還能邊聽邊把眼睛用在別的地方,比如看看PPT,或者看著本子記筆記等等,用來看字幕就太奇怪了。”
“從我的觀察來看,這些機器翻譯技術公司里,應該是沒有哪怕一個懂同傳的人來幫他們提供建議?!睆垈フf。
PingWest品玩采訪的多名不同背景的同傳都表示,沒有聽說有翻譯、同傳等專業(yè)背景的人進入科技公司參加機器翻譯研發(fā)的工作,而他們也都沒有和研究機器翻譯的人員有過什么直接交流。
科大訊飛翻譯業(yè)務的負責人翟吉博曾對PingWest品玩介紹,他們的團隊中也有翻譯出身的人,但具體的職責僅僅是測試,對系統(tǒng)進行評估,制訂些標準。也就是并不會參加到最核心的討論中。據(jù)PingWest品玩了解,微軟、搜狗等公司情況也類似,翻譯技術團隊多以機器學習、大數(shù)據(jù)等專業(yè)背景的專家為主,很少有傳統(tǒng)英語學科背景的人加入。
但事實上,雙方的這種”絕緣“并非一直如此。
最早在上世紀70年代,基于規(guī)則的機器翻譯理論最早被提出,也被稱作傳統(tǒng)的自然語義方法,它屬于最初的AI研究流派之一:“symbolic AI”。這種方法實現(xiàn)翻譯的方式是,把所有英語和中文語法規(guī)則和一整本英語詞典及一整本中文詞典編碼進機器,之后輸入英語句子后,機器就對應地得出一句中文。
這其實是嘗試模仿人類對語言的理解?!皞鹘y(tǒng)的自然語義方法是按照人類的理解來理解。”黃學東對PingWest品玩表示。當時最初的機器翻譯研究者,經(jīng)常需要向語言學專業(yè)的專家請教,共同研發(fā)。
但之后,到了90年代,基于統(tǒng)計的方法被應用到機器翻譯領域,并給翻譯效果帶來巨大的躍升。研發(fā)者也紛紛轉(zhuǎn)向基于統(tǒng)計的機器翻譯方法。這種方法更像是純粹的計算機方法,已經(jīng)與傳統(tǒng)自然語義方法有很大不同,也不再對研究翻譯和語言學等學科的人們有太多依賴。
而進入最近5年,深度學習再次推動機器翻譯的進步。2011年谷歌開始研發(fā)和使用的“神經(jīng)網(wǎng)絡”模仿人類大腦由神經(jīng)元構成的結(jié)構,每一層神經(jīng)網(wǎng)絡都會對數(shù)據(jù)進行分析以找到其中存在的規(guī)則,多層的神經(jīng)網(wǎng)絡則類似現(xiàn)在流行的深度學習概念,可以發(fā)尋更多的范式。2016年,谷歌將神經(jīng)網(wǎng)絡用于其翻譯產(chǎn)品上,再次大大提升了翻譯質(zhì)量,逐漸成為現(xiàn)在各家科技公司機器翻譯技術的主流。
至此,機器翻譯的邏輯與人類進行翻譯的方法分別走向兩條岔路。
不確定的未來
“機器翻譯的算法和人類思維很不同?!秉S學東說?!昂唵涡蜗蟮孛枋觯瑱C器翻譯是把一種人類語言投射到一個數(shù)字化的高維空間,然后在此進行解碼,解碼成另外一個語言。這個空間高維到人類不可想象。”
“機器翻譯和人類翻譯的邏輯很不一樣,其實對于我們來說,也沒必要去研究人類同傳或翻譯的邏輯,關鍵的是算力和數(shù)據(jù)?!币幻趪鴥?nèi)科技企業(yè)負責機器翻譯團隊的產(chǎn)品經(jīng)理對PingWest品玩表示。
黃學東也表示,提升機器學習的質(zhì)量,要靠高質(zhì)量的數(shù)據(jù)、不同的算法模型以及性能完善的軟件系統(tǒng)。他表示,今年3月微軟的機器翻譯系統(tǒng)在一個中-英新聞測試集上,達到了可與人工翻譯媲美的水平。此次突破主要依靠的就是機器學習組新研發(fā)的對偶學習、推敲網(wǎng)絡等模型,其中不少都是受人類工作模式的啟發(fā)。
但是,雖然每個模型的原理都能說清楚,靈感也可能是在模仿人類,然而融合了這些模型的端對端系統(tǒng)則是一個超大的神經(jīng)網(wǎng)絡黑箱。它會自己把機器翻譯的模型學習出來,外部很難弄清楚里面發(fā)生了什么。這樣的方式也讓機器翻譯存在著不可解釋性。
在此前博鰲論壇出洋相后,騰訊就對其中出現(xiàn)亂碼的情況進行分析,最終給出的解釋便是:“出現(xiàn)這種情況主要是包括神經(jīng)網(wǎng)絡機器翻譯在內(nèi)的深度學習算法,在原理上或多或少都有一定不確定性,在特定的情況下有一定的概率引發(fā)翻譯偏差?!?/p>
而這些在機器翻譯研究者眼中已經(jīng)習慣的“特性”,對于普通人來說則可能帶來擔憂。小L就對機器翻譯領域大量的晦澀術語十分反感?!拔覍C器翻譯只有很簡單了解過,我看不懂那些復雜的算法和技術?!毙說。“但是我很反感這些公司在犯錯的時候拿什么不確定性或者其他聽起來很嚇人的AI高級術語來搪塞?!?/p>
小L形容,每每聽到科技公司不斷宣傳“只要數(shù)據(jù)足夠多,就能訓練出與人一樣水平的翻譯”時,就好像聽到猴子足夠多就能寫出莎士比亞全集一樣,初聽荒謬可笑,細想?yún)s感到嚇人:“如果失控了怎么辦?”
除此之外,一些以翻譯為終生事業(yè)的人們還在思考,人類與機器在對待語言和翻譯這件事上的不同,會帶來什么后果?
人類學習外語時,以理解這門語言為目的,但機器看起來則僅僅是完成了從輸入到輸出的任務,在不少語言學者的眼里,它似乎永遠不能算是“懂得”了一門語言。
“這是個非常好的問題,有各種各樣不同的觀點?!秉S學東表示,機器翻譯過程中,就是從低維空間到高維空間的投射過程,從計算機角度講,它就是理解了這個語言。反過來說,機器在高維空間非常得心應手,但對于我們?nèi)祟愑质遣豢衫斫獾摹!?/p>
“人類的語言和機器的語言是不一樣的,而我們現(xiàn)在用了一種機器可以理解的方案,來完成人類語言的翻譯,它的效果遠比基于人類知識結(jié)構方法來設計的機器翻譯,要好很多?!秉S學東說?!斑@就是理想與現(xiàn)實的差距?!?/p>
其實我們?nèi)祟愡€不是也一樣,誰也說不清到底人腦是怎么運行,但我們不是一樣在依賴它?那如果有一天我們訓練的機器可以穩(wěn)定輸出,媲美人類,那為什么不能依賴機器呢?”上述產(chǎn)品經(jīng)理對PingWest品玩說。
就這樣,AI繼續(xù)吃進大量的數(shù)據(jù)、補充各種新鮮的模型,從而自我進化,然后參加機器翻譯的比賽,用科技界自己設立的標準來衡量著進步程度;另一邊,人類同傳則繼續(xù)提升自己對語言的理解,磨練自己的翻譯技巧,像傳統(tǒng)的手藝人一樣把這種工匠技藝傳承下去。而且,兩者并不怎么溝通。
人類自有文明交流以來便伴隨出現(xiàn)的語言翻譯這件事,正走入兩個分岔路。兩者就像在兩個平行宇宙運行,何時會重合?還是會帶來沖突?
目前沒人知道。