- 001-汽車技術(shù)行業(yè)語(yǔ)料
- 002-機(jī)械加工行業(yè)語(yǔ)料
- 003-金融財(cái)經(jīng)行業(yè)語(yǔ)料
- 004-通訊技術(shù)行業(yè)語(yǔ)料
- 005-化工技術(shù)行業(yè)語(yǔ)料
- 006-石油鉆井行業(yè)語(yǔ)料
- 007-建筑工程行業(yè)語(yǔ)料
- 008-生物工程行業(yè)語(yǔ)料
- 009-環(huán)境工程行業(yè)語(yǔ)料
- 010-航空航天行業(yè)語(yǔ)料
- 011-醫(yī)療器械行業(yè)語(yǔ)料
- 012-煤炭能源行業(yè)語(yǔ)料
- 013-服飾服裝行業(yè)語(yǔ)料
- 014-品牌廣告行業(yè)語(yǔ)料
- 015-商業(yè)營(yíng)銷行業(yè)語(yǔ)料
- 016-旅行旅游行業(yè)語(yǔ)料
- 017-高新科技行業(yè)語(yǔ)料
- 018-電子產(chǎn)品行業(yè)語(yǔ)料
- 019-食品飲料行業(yè)語(yǔ)料
- 020-個(gè)人護(hù)理相關(guān)語(yǔ)料
- 021-企業(yè)管理相關(guān)語(yǔ)料
- 022-房地產(chǎn)商行業(yè)語(yǔ)料
- 023-移動(dòng)通訊行業(yè)語(yǔ)料
- 024-銀行業(yè)務(wù)行業(yè)語(yǔ)料
- 025-法律相關(guān)行業(yè)語(yǔ)料
- 026-財(cái)務(wù)會(huì)計(jì)相關(guān)語(yǔ)料
- 027-醫(yī)學(xué)醫(yī)療行業(yè)語(yǔ)料
- 028-計(jì)算機(jī)的行業(yè)語(yǔ)料
- 029-化學(xué)醫(yī)藥行業(yè)語(yǔ)料
- 030-合同協(xié)議常用語(yǔ)料
- 031-媒體相關(guān)行業(yè)語(yǔ)料
- 032-軟件技術(shù)行業(yè)語(yǔ)料
- 033-檢驗(yàn)檢測(cè)行業(yè)語(yǔ)料
- 034-貿(mào)易運(yùn)輸行業(yè)語(yǔ)料
- 035-國(guó)際經(jīng)濟(jì)行業(yè)語(yǔ)料
- 036-紡織產(chǎn)品行業(yè)語(yǔ)料
- 037-物流專業(yè)行業(yè)語(yǔ)料
- 038-平面設(shè)計(jì)行業(yè)語(yǔ)料
- 039-法語(yǔ)水電承包語(yǔ)料
- 040-法語(yǔ)承包工程語(yǔ)料
- 041-春節(jié)的特輯語(yǔ)料庫(kù)
- 042-醫(yī)學(xué)詞匯日語(yǔ)語(yǔ)料
- 043-石油管路俄語(yǔ)語(yǔ)料
- 044-電機(jī)專業(yè)行業(yè)語(yǔ)料
- 045-工業(yè)貿(mào)易行業(yè)語(yǔ)料
- 046-建筑工程法語(yǔ)語(yǔ)料
- 047-核電工程行業(yè)語(yǔ)料
- 048-工廠專業(yè)日語(yǔ)語(yǔ)料
- 049-疏浚工程行業(yè)語(yǔ)料
- 050-環(huán)境英語(yǔ)行業(yè)語(yǔ)料
- 051-地鐵常用詞典語(yǔ)料
- 052-常用公告詞典語(yǔ)料
- 英文專業(yè)翻譯
- 法語(yǔ)母語(yǔ)翻譯
- 德語(yǔ)母語(yǔ)翻譯
- 西班牙母語(yǔ)翻譯
- 意大利母語(yǔ)翻譯
- 拉丁語(yǔ)專業(yè)翻譯
- 葡萄牙母語(yǔ)翻譯
- 丹麥母語(yǔ)翻譯
- 波蘭母語(yǔ)翻譯
- 希臘母語(yǔ)翻譯
- 芬蘭母語(yǔ)翻譯
- 匈牙利母語(yǔ)翻譯
- 俄語(yǔ)母語(yǔ)翻譯
- 克羅地亞翻譯
- 阿爾巴尼亞翻譯
- 挪威母語(yǔ)翻譯
- 荷蘭母語(yǔ)翻譯
- 保加利亞翻譯
- 日語(yǔ)專業(yè)翻譯
- 專業(yè)韓語(yǔ)翻譯
- 馬來(lái)語(yǔ)翻譯
- 印地語(yǔ)翻譯
- 波斯語(yǔ)翻譯
- 老撾語(yǔ)翻譯
- 阿拉伯語(yǔ)翻譯
- 哈薩克語(yǔ)翻譯
- 土耳其語(yǔ)翻譯
- 泰米爾語(yǔ)翻譯
- 越南語(yǔ)翻譯
- 柬埔寨語(yǔ)翻譯
- 蒙古語(yǔ)翻譯
- 孟加拉語(yǔ)翻譯
- 簽證資料蓋章
- 移民翻譯蓋章
- 學(xué)歷認(rèn)證翻譯
- 留學(xué)文書(shū)翻譯
- 論文母語(yǔ)潤(rùn)色
- 口譯外派服務(wù)
- NAATI翻譯
- 出生證明翻譯
- 聽(tīng)譯校正服務(wù)
如何評(píng)價(jià)Google神經(jīng)機(jī)器翻譯(GNMT)系統(tǒng)?
翻譯有純?nèi)斯しg,還有借助電腦的機(jī)器輔助翻譯(CAT,computer assisted/aided translation),還有傳統(tǒng)的機(jī)器翻譯(MT,machine translation)。
傳統(tǒng)的機(jī)器翻譯據(jù)說(shuō)源于上世紀(jì)五六十年代的美國(guó),為了破解蘇聯(lián)的大量俄語(yǔ)文件而研制。它的原理是詞匯間的一一對(duì)應(yīng),可以想見(jiàn),產(chǎn)出的譯文肯定是不通的,或許只能大體看出原文在探討的主題。這樣的翻譯模式或者思路,在翻譯天氣預(yù)報(bào)這種語(yǔ)匯固定的文本上有一定用處。據(jù)說(shuō)加拿大魁北克地區(qū)曾用這種方式播報(bào)雙語(yǔ)天氣預(yù)報(bào)。
機(jī)器輔助翻譯是指利用Trados或者wordfast這種工具,它的核心原理在于translation memory,即翻譯記憶語(yǔ)料庫(kù)。軟件工具把之前翻譯過(guò)的或者集中導(dǎo)入的雙語(yǔ)語(yǔ)料儲(chǔ)存起來(lái),遇到相似程度高的原文時(shí),自動(dòng)調(diào)出之前的譯文,譯者在其基礎(chǔ)上修改,完成最終的譯文。其翻譯單位為句子。
以上介紹的基于語(yǔ)匯一一對(duì)應(yīng)的機(jī)器翻譯和基于翻譯記憶數(shù)據(jù)庫(kù)的CAT,其實(shí)代表了實(shí)現(xiàn)人工智能的兩個(gè)思路。我自己只是搞翻譯的,對(duì)于人工智能不太懂,但機(jī)器/電腦翻譯屬于人工智能的范疇。人工智能的關(guān)鍵在于教會(huì)機(jī)器你想讓它認(rèn)知的東西,對(duì)于如何教,有兩個(gè)思路。
舉一個(gè)我在TED演講中聽(tīng)過(guò)的一個(gè)例子。
演講者從事的是圖像識(shí)別軟件的開(kāi)發(fā)。一開(kāi)始采取的套路是通過(guò)描述畫(huà)面來(lái)教會(huì)機(jī)器識(shí)別事物。比如給“貓”設(shè)置“圓臉、尖耳朵、長(zhǎng)尾巴”等參數(shù),但是效果很差,機(jī)器識(shí)別了站立著的貓,就識(shí)別不了坐著的貓。
后來(lái)研發(fā)者換了一個(gè)思路,模擬人類孩童是如何認(rèn)識(shí)貓的——見(jiàn)的多了,就知道這樣的是貓了(孩子并不會(huì)去分析原來(lái)圓臉、尖耳朵、長(zhǎng)尾巴的才是貓)。于是將大量貓咪的圖片存入機(jī)器,并告訴它這是“貓”,后來(lái)機(jī)器遇到類似的圖片,就能識(shí)別出是貓。已有數(shù)據(jù)庫(kù)越大,機(jī)器識(shí)別得就越準(zhǔn)確。
個(gè)人認(rèn)為質(zhì)量較高的機(jī)器/電腦翻譯的實(shí)現(xiàn),也要采取這后一種思路,即基于大量雙語(yǔ)語(yǔ)料的記憶和學(xué)習(xí)——讓機(jī)器記住什么樣的話是什么意思,而不是將語(yǔ)句分解為單個(gè)詞匯再去找它們?cè)诹硪粋€(gè)語(yǔ)言中的對(duì)應(yīng)。
根源還是語(yǔ)言的復(fù)雜性,無(wú)論是哪兩種語(yǔ)言之間,都不像二進(jìn)制和十進(jìn)制之間那樣可以實(shí)現(xiàn)一一對(duì)應(yīng),所以第一種思路的發(fā)展前途已經(jīng)很局限。而第二個(gè)思路或許就是以后的方向,互聯(lián)網(wǎng)實(shí)現(xiàn)的大量語(yǔ)料共享也為它的發(fā)展提供了可能。
------------------------------------
關(guān)于如何看待機(jī)器/線上翻譯的進(jìn)步:
雖然我自己是個(gè)翻譯匠,而且厭惡把線上翻譯隨便改改交差的譯員,但是對(duì)機(jī)器/電腦/線上翻譯本身心存親切——它畢竟不是人,不要笑話它。
它對(duì)于譯者也有用處,對(duì)于某些語(yǔ)匯(不是整句整段),它給的譯文由于基于大量現(xiàn)有語(yǔ)料,往往確實(shí)是業(yè)內(nèi)人士用的比較多的說(shuō)法。
所以大家不要看到機(jī)器翻譯產(chǎn)生可笑譯文就拿來(lái)調(diào)侃,該被調(diào)侃的是那些敢用這些譯文的人。
而且,沒(méi)有必要恐慌自己會(huì)被取代(前提是你的水平遠(yuǎn)高于機(jī)器);機(jī)器差的還比較遠(yuǎn)——如果你知道語(yǔ)言可以美到、精到、妙到什么程度,如果你明白很多時(shí)候它就是人的靈光一現(xiàn)的、獨(dú)一無(wú)二的、偶然的產(chǎn)物,就不會(huì)懷疑這一點(diǎn)。