Google翻訳の妥当性検証とそのアルゴリズムの帰納的解明の試み#1
第1回はボブディラン「見張り塔からずっと」の歌詞を翻訳の原文として取り上げます。
67年発表の第8作アルバム John Wesley Harding 所収。
All Along the Watchtower
(Bob Dylan)
Google翻訳には有料版があるがここではブラウザ上で誰でも利用可能な無料版を取り上げる。
無料版しか検証しないのにはきちっとした理由があって、有料版にはお金がかかるからです… ただ有料版の性能の推測めいた事はいくらか出来そう。
検証と解明の第1回にあたってGoogle 翻訳の雰囲気を伝えるべく画像を貼ってみたものの読みやすさを優先しようと翻意、これからはテキストをコピペします。以下の如し。
“There must be some way out of here”
Said the joker to the thief
“There’s too much confusion
I can’t get no relief
Businessmen, they drink my wine
Plowmen dig my earth
None of them along the line
Know what any of it is worth”
↓
「ここから抜け出す道があるはずだ」
ジョーカーは泥棒に言った
「あまりにも多くの混乱があります
私は救済を得ることができない
ビジネスマン、彼らは私のワインを飲む
プラウマンが私の地球を掘る
それらのどれもラインに沿っていない
それが価値あることを知っている ”
“No reason to get excited”
The thief, he kindly spoke
“There are many here among us
Who feel that life is but a joke
But you and I, we’ve been through that
And this is not our fate
So let us not talk falsely now
The hour is getting late”
↓
“興奮する理由はない”
泥棒は親切に話した
「ここにはたくさんの人がいます
人生は冗談だと感じる人
しかし、あなたと私、私たちはそれを経験しました
そしてこれは私たちの運命ではない
だから私たちは今や偽って話さないようにしましょう
遅くなってきている ”
All along the watchtower
Princes kept the view
While all the women came and went
Barefoot servants, too
Outside in the distance
A wildcat did growl
Two riders were approaching
The wind began to howl
↓
すべての塔に沿って
王子は眺めを保ちました
すべての女性が来て行きましたが
裸足のしもべも
離れて外に
ワイルドキャットが唸った
2人のライダーが近づいていた
風が鳴り響くようになった
ざっと見て、概ね精確な翻訳と言える。
細かく見てみる。
まず言葉より前に、符号の変換に面白い現象を見た。
会話部分を括って明示する二重引用符”は2種類の鉤括弧「」に一様に変換されるのだろうと思いきや、バラバラ。
冒頭
↓
「ここから抜け出す道があるはずだ」
第2群第1行
↓
“興奮する理由はない”
主語述語から成る完結した上の文に対し、下は名詞句。
完結した文でなければ会話でなく引用と見なして二重引用符をそのまま当てるのかも知れない。
そして会話の起点は「なのに終点が “となる現象が第1,2群の訳文に共通して見られる。
これは改行が断絶を与え、2つ目の”が会話を閉じるものと認識されるのを阻害しているからだろう。ただ引用符の前に半角スペースが挿入されているのが有意なのかバグなのかは今は分からない。
↓
ジョーカーは泥棒に言った
英語原文の倒置構文を把握した上で普通の日本語訳文に変換する事に成功している。
試しにこの訳文を原文として再入力し英語訳をさせてみる。
↓
The Joker said to the thief
普通の語順の普通の英語文になった。構文に留意した演算が出来ており、また出力においては、より平易で標準的な訳文が選択される事が窺える。前後の接続を斟酌せぬ逐語的な訳出でないのは言わずもがな。
また、冠詞がきっちり冠されており、ここでは2つの名詞に対し共に定冠詞(the)が選択されている。ただこの日本語原文の場合、英語訳文としては the と a の4通りの組合せ全てが妥当ではある。
これは plowman(農夫、田舎者)の語がマシンの語彙に登録されていなかったが為に音訳が選択されたのだろう。
試しに plowmen 単独で入力してやると、ある時にはプラウマン、また別の時にはプールマンと出た。検索エンジンにも使われるタイポ修正のアルゴリズムか何かが近い音を探し当ててカタカナに変換(音訳)した結果だろうか。何にせよ音訳は一様ではなさそう。
ところが単数形の plowman を入力すると、プラウマンでもプールマンでもなく、鋤と出力された。つまり此度は音訳をせず、また plow のみを訳出し man を捨象するという大胆な挙動を示した。
未登録の語が入力されるとマシンはちょっと「苦悶」する模様。
そしてもしこれが有料版だったら語彙がより広いだろうから難なく農夫と吐き出していただろうと推測できる。より正確な言い方をすれば、同じ広さの語彙を参照するも、無料版には規制がかかってアクセスできぬものがある、となろうか。
Know what any of it is worth
↓
それらのどれもラインに沿っていない
それが価値あることを知っている
この2行は1文だが、改行が記号の把握に断絶を与えた様に、文にも区切りを認識させてしまったと見える。
また文頭の大文字(K)も有意で、文の起点と見なす材料となるのだろう。
ならば改行を取っ払い1文とわかる様にしてやって入力。
↓
彼らのどれもが価値があるものを知っている
… ま、これは誤訳と言わざるを得ない。none は単数と見なされる方が多いから knows とやってみるも結果は同じ。
along the line が混乱をもたらしているに違い無い。これは2行前の wine に韻を押した、調子合わせに近い挿入句だから丸々外してみる。
↓
彼らのどれもが価値があるものを知りません
ぎりぎりセー… アウトか…
じゃあ worth という語の機能の多様性に当てられちゃってんのか。扱いづらい語の一つだと察する。
他には、ですます調の選択がランダムであろう事も窺える。
しかし何より、原文の一字一句を把握できなくても、非文を出力する様なダサいマネだけは決してしないと見た。誤訳しといてすましていやがる。人間なんだからお前もちっとは頭使えよとばかりに。こいつ、マシンのくせに相当プライド高いぞ…
でも何だか可愛くて憎めないから第2群は素晴らしい訳出だと褒めておく。第3,4行が例によって改行で断絶されてはいるが、ただもうこれは入力者が斟酌すべき事に過ぎぬ。
そしてここではコンマの有意性(の把握)が見られる。
↓
泥棒は親切に話した
コンマの前後を同格と認識している。
コンマを取っ払うと、
↓
彼が親切に話した泥棒
The thief が目的語になった。
厳密には speak は人を目的語とする他動詞たり得ないので spoke の後に to(或は of)が要るが、勿論これも入力側の問題であり、するとこの訳出もある意味において高度だと言えようか。
但し、上の元の訳文は、「泥棒、彼は…」と、同格と分かる様に明示して訳出されているわけではないので、コンマと he がまた丸々捨象されてしまっている可能性もゼロではない。
さて第3群。頭に本作の表題が現れる。
All along the watchtower
plowman の例に同じく watch が捨象され、塔とのみ訳されている。
この原題よりも、「見張塔からずっと」という邦題に馴染みがある人の方が多かろうか。
辞書を引けば、
all along = 初めから、ずっと
という副詞(句)としての意味が載っている。
しかしここでは副詞ではない。明らかに場所または建造物である the watchtower が後続しているのだからそれを目的語とする前置詞である。つまりこの along は時間でなく空間に言及する言葉。
「ずっと見張塔」じゃ納まりが悪いから苦し紛れに「見張塔からずっと」とやったのだろうが、これなら機械翻訳のアルゴリズムの方が語法の把握において数段上だ。これは恐らくプロトタイプでもしないレベルの、まずい訳出。
辞書に載っている語釈の一つを人間の方が皮肉にも「機械的に」採用し、訳語に短絡させてしまった。そしてその後に「人間的な」柔軟性を発揮して「から」を取って付けた… と、まあこんな所だろう。
ところで私は、翻訳者は原作者の奴隷たるべし、という考えを支持し、また肝に銘じてもおります。
機械翻訳は、まだ不完全ではあるものの、原文と訳文の同一性は一定程度保持されており、その意味においてこの手の邦題やネット上にも跋扈する恣意訳などよりは遥かに素直で優れていると言えます。
それでは最後は私のアルゴリズムが吐き出した訳文。
「こっから抜け出す方法があるはずだろ」
道化が盗人に言った
「ドタバタし過ぎで
ちっとも心が休まらない
商人は俺の酒を飲み
農夫は俺の土地を掘り返す
奴らはどいつもこいつも
それにどんな値打ちがあるかなんて分かっちゃいないくせに」
「まあそう興奮しなさんな」
盗人が静かに口を開く
「人生なんてただの冗談だと思ってる
ダチだってここには多くいる
だがあんたも俺もそんな考えとはおさらばだ
俺達はこんなもんじゃない
だからもう口先だけで話すのはやめようぜ
時間もそんなに無いんだから」
見張塔の上に並んで
遠くまで見晴らす王子達の下には
慌ただしく行き来する女達
それに裸足の下僕達
遠くから
山猫の唸り声が聞こえ
馬を駆る二人の者が近付いていた
風が音を立て始めた
ジミヘンの歌唱は詞がディラン原版とはいくつか異なるが大意に影響無し。
コードはジミヘン版がCm Bb Abで、
ディランはAm G Fをひたすら繰り返す。
コメント