メディアが報じ、新型ウイルスの情報発信は改善されたけれど

2月18日になると、The Japan Timesがこの問題について取り上げ、私も取材を受けました(記事はこちら)。20日には菅官房長官が、機械翻訳(自動翻訳)ではなく人間の翻訳者を使って厚労省のサイトで英語情報の更新を始めていると述べたようです。実際、その後に厚労省のサイトを訪れると、確かに改善されていました。

2月22日現在、厚労省の日本語のサイトには、トップページの真ん中に (ENGLISH) Latest information on Coronavirus disease 2019 (COVID-19) is HERE. と出ており、そこからコロナウイルスの英語情報ページに飛べます。

日本語サイトの右上にある「English site」をクリックすれば、厚労省の英語ページに移りますが、そこにも現在は Latest information on Coronavirus disease 2019 (COVID-19) is HERE. と分かりやすい位置に出ており、そこから同じコロナウイルスの英語情報ページに飛べます(なお、この英語情報ページ、2月18日の時点でも存在していましたが、そこに行くリンクがコロナウイルス関連の情報が載った日本語のページの真ん中にしかなかったので、英語しか理解しない人にとっては見つけにくい情報となっていました)。

ただし、以前と変わらず日本語サイトの左上にある「言語切替」で英語を選択すると、「機械翻訳であること」のお知らせメッセージが出て、「English site」から移る英語ページとは別の、その日本語ページを機械翻訳したページに飛びます。

そしてそこには、2月16日に確認したときと同じ理解しがたい英語が、今も変わらずあふれていました(「機械翻訳であること」のお知らせメッセージの中に、上述の Latest information on Coronavirus disease 2019 (COVID-19) is HERE. の文言と英語情報ページへのリンクはあるので、機械翻訳されたページよりそちらのほうへ導く努力はしているようですが)。

細かくなってしまいましたが、私が言いたいのは、新型コロナウイルスに関する英語情報ページへのアクセスは改善されたものの、機械翻訳に関わる問題は今も変わらないということです。

kopp20200222mhlw-2.png
厚労省のトップページから「言語切替」で英語を選択をした場合に表示される機械翻訳されたページ(2020年2月21日)

例えば、上図は日本語サイトのトップページを機械翻訳した英語ページですが、ここには機械翻訳にありがちな典型的な問題が多く見られます。

文法が分かりにくかったり、不自然だったり、新型コロナウイルスの「新型」をnew-styleとしていたり。また、このページではありませんが、「渡航歴」をstay rekiとするなど、翻訳されずにローマ字のまま残ってしまっている言葉もあります。

とはいえ、全ての機械翻訳が同じクオリティというわけではないようです。比較のため、先ほど引用した私のツイートに出てくる英訳の日本語の原文をそのままグーグル翻訳に入れると、厚労省のサイトにあるものよりも随分と質の高い翻訳が出てきました。

厚労省はサイトにある機械翻訳機能の導入にいくら払ったのでしょうか。あのレベルの機械翻訳になってしまうようであれば、グーグル翻訳など、もっと質が高い機械翻訳をうまく活用する方法を考えたほうがいいと思います。

機械翻訳は便利だが、人間の翻訳者ほどの質は得られない