在全球化的大環(huán)境下,作為制造業(yè)大國,我國擁有世界最大規(guī)模的外貿(mào)出口企業(yè)。而作為開展外貿(mào)必不可少工具之一的網(wǎng)站,為了向海外各地提供本土化的服務(wù),配置符合當(dāng)?shù)卣Z言習(xí)慣的版本非常必要。但也面臨翻譯上的大難題,大多數(shù)中小企業(yè)可能并沒有熟練掌握各種語言的人才,但又急于開展當(dāng)?shù)氐臉I(yè)務(wù),若招聘各種語言的員工必然會增加不少的開支,為公司運(yùn)營帶來更大的壓力。于是,在線翻譯API成了最好的選擇之一。
能提供在線翻譯的API有很多,比如國外的Google翻譯,國內(nèi)的百度翻譯、有道翻譯、阿里翻譯等等。筆者有幸在一個(gè)網(wǎng)站項(xiàng)目中進(jìn)行了實(shí)踐,愿意將這些經(jīng)驗(yàn)向大家進(jìn)行分享。查看各翻譯品牌的產(chǎn)品文檔和技術(shù)文檔后,最終選擇了百度翻譯API,并且獲得了良好的效果,成功打通了13個(gè)(當(dāng)然可以更多)語言版本的翻譯,最終項(xiàng)目上線投入運(yùn)營。本文重點(diǎn)就在網(wǎng)站中集成百度翻譯API進(jìn)行詳細(xì)的分析。
在展開研究之前,先總結(jié)百度翻譯API的一些特性,方便你為后續(xù)的決定做出初步的判斷:
1、可翻譯200多種語言,集成你需要翻譯的語種即可;
2、企業(yè)認(rèn)證后,每月免費(fèi)翻譯50萬字符,超出部分按49元/百萬字符計(jì)費(fèi);
3、支持純文字翻譯(通用文本翻譯)、文章翻譯(文檔翻譯),這兩種在網(wǎng)站翻譯中需要調(diào)用到;
4、百度翻譯的結(jié)果可能并不十分完美,不及專業(yè)人工翻譯,這是可以解理的;
百度翻譯API的價(jià)格
通用文本翻譯:每月免費(fèi)翻譯200萬字符,超出部分按49元/百萬字符計(jì)費(fèi)。適用于純文字翻譯,提交的翻譯內(nèi)容不能帶HTML標(biāo)簽,否則會將標(biāo)簽直接翻譯出來。
文檔翻譯:每月免費(fèi)翻譯50萬字符,超出部分按49元/百萬字符計(jì)費(fèi)。適用于文章翻譯,可選擇HTML翻譯,即后面編輯器中的內(nèi)容,可以帶HTML標(biāo)簽,翻譯結(jié)果中會原樣輸出HTML標(biāo)簽,從而不影響原內(nèi)容的樣式、排版等。
以上2種翻譯API基本上可以覆蓋網(wǎng)站翻譯中的所有需求了,開發(fā)者可以根據(jù)項(xiàng)目需求搭配使用,從而實(shí)現(xiàn)最高的性價(jià)比。由于通用文本翻譯的免費(fèi)額度較大,所以,能用通用文本翻譯的地方,盡量使用通用文本翻譯,這樣可以節(jié)省不少翻譯成本。
省錢妙招:百度翻譯API是通過提交的原始翻譯內(nèi)容字符數(shù)計(jì)費(fèi)的,一個(gè)漢字、一個(gè)英文字母、一個(gè)標(biāo)點(diǎn)符號、空格、換行等均記為一個(gè)字符。不難理解,從中文翻譯成其他語種的性價(jià)比會高得多(幾倍)。
百度翻譯的結(jié)果與誤差處理
就像中文一樣,同一個(gè)詞能夠表達(dá)多個(gè)意思,同時(shí)也與對應(yīng)語種的語法有些關(guān)系。所以,百度翻譯API最終翻譯出來的結(jié)果可能并不能讓人滿意,這完全可以理解,但可讀性是很高的。因此,千萬不要期待能獲得專業(yè)翻譯人士手工翻譯的效果,需要有這個(gè)心理準(zhǔn)備。如果不能容忍這種瑕疵,建議放棄自動(dòng)在線翻譯,轉(zhuǎn)為使用人工翻譯。
翻譯結(jié)果的誤差可以通過程序邏輯在一定程度上進(jìn)行彌補(bǔ)和改進(jìn),例如某個(gè)專業(yè)名詞在百度翻譯結(jié)果中表現(xiàn)并不滿意,這時(shí)可以建立本地的詞語容錯(cuò)庫,即對翻譯出來的結(jié)果進(jìn)行二次匹配處理,用你自定義的翻譯詞來替換翻譯結(jié)果中出現(xiàn)的不那么正確的詞。盡管仍然不可能達(dá)到十分完美的效果,但是在一定程度上能夠有效緩解翻譯結(jié)果誤差的問題,最終將翻譯結(jié)果保存到數(shù)據(jù)庫。即使仍然不太滿意,還可以進(jìn)入對應(yīng)版本,人工對該文章進(jìn)行微調(diào)。
提示:盡管百度提供的自定義術(shù)語庫,但筆者親測僅支持中、英、日、韓四大語種,如果你需要的語種正好命中,可以使用術(shù)語庫,從而使用翻譯結(jié)果更精準(zhǔn)。但筆者作為建站開發(fā)人員,需要面向不同需求的客戶,這四種語言的術(shù)語庫不能滿足需求。所以,通過自定義翻譯詞的方式,建立本地的“術(shù)語庫”完美解決了問題,提升了所有語種的翻譯效果。
SEO問題
如果你重視SEO,那么上面提到的在線翻譯API能夠滿足你的需求?;蛟S你使用過Google翻譯中的一個(gè)組件,它能集成在網(wǎng)站中,讓用戶能夠切換各種語言從而在瀏覽器中獲得對應(yīng)翻譯結(jié)果的網(wǎng)站。但有一個(gè)重大問題,它是通過JS實(shí)現(xiàn)的實(shí)時(shí)翻譯結(jié)果,換句話說,翻譯結(jié)果并不存在于你的網(wǎng)站數(shù)據(jù)庫中,也就是說,這些翻譯出來的內(nèi)容在你的網(wǎng)站中是不存在的,只是臨時(shí)翻譯出來的。所以,搜索引擎無法找到這些翻譯結(jié)果頁面,也就無法收錄了。然而,上面提到的方法,是將翻譯結(jié)果保存到數(shù)據(jù)庫中,是網(wǎng)站中實(shí)實(shí)在在的內(nèi)容,有固定的獨(dú)立頁面,是可以被搜索引擎爬行、抓取和收錄的。
通過調(diào)用百度翻譯API獲得翻譯結(jié)果,再將翻譯結(jié)果保存到數(shù)據(jù)庫,前端生成固定的對應(yīng)展示頁面。是有利于SEO的。
本文大致討論了百度翻譯API在網(wǎng)站中的應(yīng)用,比較粗淺,在實(shí)踐的過程中,筆者也是踩過了不少的坑。更多的問題,期待與您探討、研究。