スポンサーリンク

Google 翻訳の妥当性検証とそのアルゴリズムの帰納的解明の試み#3

ブログ blog

無料版Google 翻訳の検証と解明の真似事を2回ほどやってみたが、今回はちょっと有料版のページにも寄ってみる。


こんな感じの謳い文句。
テキストをコピペしてみる。

Translate API
Google では、より堅牢な有料サービスも提供しています。Translate API を利用すると、ウェブサイトのコンテンツの翻訳だけでなく、ウェブアプリでも翻訳を活用できます。

さて恐らく私だけではあるまい、違和感のある言葉を見付けたのは。

 堅牢

物理的な頑丈さに言及するこの漢語が、一般には物理的な実体が無いと見られるサービスという言葉を修飾している。
Google のページなんだからきっと英語の原文をそれこそGoogle 翻訳で日本語に訳出したんだなと察しは付く。
じゃあ元の語は substantial(しっかりした中身のある)だろうかなどと当て推量してたら、ページ右下に言語切り替えボタンを発見。
押す。
英語を選択。
すると当該の語は robust と判明。
これは頑丈という原義に加え、効果的という派生義を持つ語。
この英文の筆者は有料版の特色を謳うべく後者の意で使ったのだろう。然るに当のマシンが前者と取り、それを日本語に変換してしまった。
というのがこの現象の本質だと察する。

最先端のアルゴリズムと優秀なスタッフのチェックを経て尚こんな(日本語として)ビミョーな言い回しが堂々とウェブ上に放置されているのを目にして、正直なんかほっとする。
自社の文書なんだから当然ケチらず有料版を適用しているだろうし。

ただ、訳文中にこんなにも大胆な訳語を毅然と採用しているのがその道の開拓者然としているという見方も出来る。なぜならちょっとした意味の飛躍を含むこんな用法こそが語義派生のきっかけになるのだろうから(まさかマシンにそんな意図は無かろうが、結果として)。

逆にこの日本語文をそのまま原文として入力し英訳させてみると、構文や使われる語にいくらか違いは生じたが、robust の語はやはり変わらず。
もうとにかく揺るぎ無いスゲエ機械翻訳だって事が言いたいのかも知れない。

訳出には「中間言語」と呼ばれるものが使われているという Google の発表もあった。
メタ言語だか何だか知らないが、それってアルゴリズムを書いてるプログラム言語の事なんじゃねーの?などと素人らしいアホみたいな事を思ったりもする。

境界が曖昧で連続的な人間の認識作業は質においては優れているだろう。しかしそれが故に優柔不断も起こり得る。
片やマシンの識別作業は0か1かで非連続的に粛々と進められる。その処理速度は桁違い。
人間と違って立ち止まる事を許されぬマシンの悲哀を感じもするが、そこへ持ってきて今この時にもコーパスをガンガン食わされドンドン進化しているのだから、質においても日に日に人間に近付いているのは間違い無い。
但し追い付く事は決して無い。
… と思っていたが、上の例の様に人間に先駆けて新たな語義語感を生み出す、つまり人間を追い越し、更には導くなんていうSFみたいな事もあるのかも知れない。「おい人間さんよ、俺が面白い言葉作ったから使ってみなよ、便利だぜ」とばかりに。
新しい語義の生成過程に偶然性があるとしても、そこには人間がかつて無い語感を獲得する場合と同程度の合理性も妥当性も厳然とあるのだから。

コメント

  1. michaelOi より:

    magnificent post, very informative. I wonder why the other specialists of this sector don’t notice this. You must continue your writing. I’m confident, you’ve a huge readers’ base already!

    • deni より:

      >magnificent post, very informative.
      yes indeed, thnx a lot unless it’s a spam thread…