更新日:
【入門編】機械翻訳を活用するために注意すべき5つのポイント
堀江 真里子
様々な企業が外国人対応の本格化に向けて、サービスや Web サイトの多言語化を進めるべく、機械翻訳を活用する事例が増えています。年々進歩を遂げる機械翻訳のおかげで、あらゆるビジネスシーンやライフスタイルにおいて外国人との距離は日に日に近くなっています。
元言語の文章表現や、運用ルールを適切に設けることで、機械翻訳の品質を高めることが可能です。今回は機械翻訳を活用するための注意点を紹介します。
目次 |
機械翻訳とは?
機械翻訳とは、ある言語を機械(コンピューター)を介して他の言語に自動的に翻訳することです。機械翻訳の種類は、大きく分けると以下の3つが挙げられます。
・ルールベース機械翻訳(Rule-Based Machine Translation : RBMT)
・統計的機械翻訳(Statistical Machine Translation : SMT)
・ニューラル機械翻訳(Neural Machine Translation : NMT)
一般に利用できる機械翻訳ツールのほとんどがニューラル機械翻訳(NMT)です。ただ、ニューラル機械翻訳(NMT)と一言にいっても、それぞれの企業が提供する機械翻訳ツールには特徴があり、得意・不得意があります。それらを踏まえて機械翻訳を活用していくことをおすすめします。
※機械翻訳の種類に関しては「機械翻訳がたどってきた歴史からみる進歩を解説!今後の可能性も紹介」をご覧ください。
機械翻訳の誤訳がなくなったわけではない
近年、機械翻訳の精度は日々向上していますが、機械翻訳も誤訳をすることがあります。機械が翻訳する以上、固有名詞や独特の表現・文章の構成などによって間違いが発生しやすくなります。例えば、2019年には、機械翻訳を使用していた大阪メトロの Web サイトで「堺筋線」という路線名が「Sakai Muscle Line」と誤訳されているのをインターネットユーザーが発見して話題になり、ニュースにも取り上げられました(※)。
現在 Google 翻訳は正しい翻訳を返していますが、こうした予期しない問題がどこで発生するのか、発見された場合にどのタイミングで改善されるのかを予想することは難しく、そのリスクは常に考慮すべきものとなります。
引用:「堺筋線」Google翻訳でも“筋肉線”、「堺筋」は“大腿筋” 機械翻訳の難しさ
→お役立ち資料「機械翻訳の精度に関する一考察」
機械翻訳を上手に活用するための5つの注意点
ここまでお伝えしてきた通り、機械翻訳は完ぺきではありません。機械翻訳を上手に活用するためには、得意・不得意を理解したうえで、不得意な点を補いながら活用することが重要です。ここからは機械翻訳する際、いくつかの注意すべきポイントを紹介します。このポイントを踏まえることで、誤訳を少なくすることができます。
固有名詞の翻訳ルールを設定する
機械翻訳は、膨大なデータベースをもとに適切な翻訳文を提供するため、データベースにない文や名前を翻訳しようとすると、不適切な訳文が当てられることがあります。
具体的には、固有名詞や流行り言葉がまだまだ網羅できていないところが多く、駅名・地名、人や企業名などが大きく誤訳されてしまうことは多々あります。そのため、あらかじめ固有名詞の翻訳ルールを定めておく必要があります。
一般的に長い文章は、20単語未満の短い文章(20単語未満)に比べて、機械翻訳の品質が低いと言われています。今後、機械翻訳の性能が向上する可能性もありますが、できるだけ「1センテンス、1トピック」を意識することで機械翻訳品質が安定します。
係り受けを明確にする
係り受けとは「主語と述語」「修飾語と被修飾語」のように、異なる語句が何かしらの補足説明を行う関係性を指します。係り受けの組み合わせがはっきりしていないと、機械翻訳は細かいニュアンスを汲み取ることができず、意図しない翻訳を行うことがあります。原文において、係り受けの関係が明確になっている文章を使うことが求められます。
(例) 「かわいい猫を飼う女の子」 → "かわいい" が「猫」にかかるのか、「女の子」にかかるかが読み取れない。 「ここではきものを脱いでください」 →「ここで はきもの」、「ここでは きもの」、の2通りの意味に取れる。 |
言語ごとにレイアウトを調整する
Web サイト多言語化特有の課題になりますが、ただテキストを翻訳するだけでは、同じ内容の文章でも、言語によって文字数が異なるため、レイアウトがくずれてしまうことがあります。例えば、日本語から英語へ翻訳すると文字数が増える傾向があり、日本語から中国語へ翻訳すると文字数が減少します。
このようなレイアウトくずれが重要なページで発生すると、ブランド棄損に繋がりかねません。機械翻訳を行う際には、言語ごとにレイアウトの調整をする必要があります。
翻訳すべきでない箇所を除外する
こちらも機械翻訳をつかった Web サイト多言語化特有の課題です。Web サイトでは、翻訳せずに敢えて日本語を残しておくという考えがあります。しかし機械翻訳ツールを使用すると、本来は翻訳しなくてもよいテキストも翻訳されてしまいます。このように、Web サイトの翻訳を機械翻訳ツールだけに頼ると、思いがけないことやコントロールできないという問題が起こります。ツールによってあらかじめ設定をしておけば、あえて翻訳をしないといったことも可能です。
まとめ
今回は機械翻訳を上手に活用するための注意点を解説しました。
機械翻訳は適切に使うことで、人力翻訳よりも安く・スピーディーに翻訳を届けられます。ただし、すべてのコンテンツが機械翻訳に適しているわけではなく、人力翻訳のほうがよい結果を生む状況も数多くあります。加えて、機械翻訳には誤訳があることや、誤訳があった場合のリスクがあるということを事前に理解することも重要です。
機械翻訳にはまだ不得意な点もありますが、それを補うための手法として、ポストエディットや人力翻訳との掛け合わせもあります。ポストエディットについて、詳しい内容は「ポストエディットとはなにか?必要性やその特徴、注意点を解説します!」をご覧ください。これらの手法を活用することで機械翻訳の品質を高め、よりよい情報発信を行っていきましょう。
堀江 真里子
2020年、Wovn Technologies株式会社に入社。新卒で入社した大手事業会社での経験を活かし、2年間営業としてエンタープライズ企業の多言語化の課題解決に邁進。現在は事業開発担当として多言語化にまつわる市場調査や企画活動に従事。