顯示具有 translation 標籤的文章。 顯示所有文章
顯示具有 translation 標籤的文章。 顯示所有文章

2008年5月12日

Fun with Google Translate

昨天一時興起,考一考 Google Translate。(假如你不知道的話,根據公評古狗翻譯大神是目前最棒的自動翻譯機)

先來簡單的:「壓扁」,答曰「crash」,so far so good。

那麼「壓不扁」呢? 要不要猜猜答案是什麼....Ready?
"Pressure is not Chen Shui-bian"

這個很有意思。那「壓不扁的」呢?
“Chen Shui-bian's no pressure”

那麼,楊逵的小說「壓不扁的玫瑰」呢?
"Chen Shui-bian did not pressure the roses"

唔,單吊一個「扁」字呢?呵呵,果然是
"Chen Shui-bian"

先別說 WTF... Google Translate 用的方法叫 statistical translation models,根据古狗的說明
we feed the computer billions of words of text, both monolingual text in the target language, and aligned text consisting of examples of human translations between the languages. We then apply statistical learning techniques to build a translation model. We've achieved very good results in research evaluations.
看來問題出在古狗的語庫 (corpus) 上,古狗翻譯用Internet上的中文語詞做為其模型的輸入,而阿扁執政八年以來網路上的「扁」這個字有很大的比例指向「陳水扁」,古狗翻譯用這個 heavily skewed 的詞庫來規訓 (train) 它的翻譯機,「差之毫厘,失之千里」也就難怪了。

又:「差之毫厘,失之千里」的古狗翻譯是 「Hao Li of the poor, suffer from a thousand miles」,挺有禪的味道,是不?

2008年4月10日

互相觀看有感

最近和朋友聊起 Peer-to-peer 的中文翻譯,忽然想到我曾在另一個時空裏也與人扯過一回,老夫還做了一幅對聯呢。於是重回桃花源一索,果然還在那裡。只可惜的是相關網頁文本—台灣經濟部智慧財產局的專有名詞網頁 http://www.moeaipo.gov.tw/dataserve/public/terms.asp
都渺如黃鶴了,不勝唏噓之至。好在古狗大神幫忙,「互相觀看」還是斑斑可考,史有明證的呢。

古狗翻譯大神把 Peer-to-peer 翻成「點對點」,也罷也罷。