近年、「ディープラーニング」技術を導入したことで、機械翻訳の精度が著しく進化しています。そこで議題にあがるのが、翻訳者(翻訳家)の仕事は無くなるのかということです。人力翻訳の不得意なことを補うために台頭したのが機械翻訳ですが、機械翻訳にも不得意なことはまだまだ残っています。そのため、両者が互いの得意/不得意を上手く補い合うことが必要になります。本記事では、機械翻訳と人力翻訳にどのような違いがあるか、どう使い分けることが適切かについて、解説していきます。
目次 |
機械翻訳は、文字通りコンピューターを利用して翻訳を自動的に行う手法です。現在は、ニューラル機械翻訳が主流となっています。
機械翻訳が初めて発表されたのは1950年代、今の Google 翻訳の原型となった統計機械翻訳により飛躍的に機械翻訳の精度が向上したのは1990年代です。2022年現在は、機械翻訳がニューラルネットワークというアルゴリズムを用い、「人力翻訳に勝てるのでは」という期待が人々の中で膨らんでいます。
"neural"とは「神経の」という意味で、人間の脳神経細胞に似た仕組みのプログラムを活用した機械翻訳です。Google や DeepL が現在使っているのもこの手法で、単語やフレーズだけ考慮するのではなく、もっと広い範囲を見て細かい部分に反映させるのだそうです。機械翻訳の歴史について、さらに詳しい内容は「機械翻訳がたどってきた歴史からみる進歩を解説!今後の可能性も紹介」をご覧ください。
人力翻訳とは、文字通り、翻訳者、人が行う翻訳のことです。
機械翻訳ではデータに基づいて翻訳しますが、人力翻訳の場合は、翻訳者が対象言語の話されている地域の文化・商習慣、原文の文脈や歴史背景などを踏まえて翻訳を行います。このため、人力翻訳では単純に一字一句を対応させた翻訳ではなく、微妙なニュアンスも含めた効果的な表現や想定される読み手や掲載される媒体を意識した言葉の選択が可能です。
また人力翻訳では、翻訳体制が提供企業によって異なり、翻訳品質や納期も異なります。翻訳者一人のみで翻訳する場合や、翻訳者が一度翻訳した後にチェッカーが校正を行う場合など、翻訳会社のポリシーや求める品質や予算などに応じて、翻訳ステップにも違いがあります。
人力翻訳は、翻訳者が作業をするため、機械翻訳よりも多くのコストが発生します。チェッカーといった翻訳の体制、元言語と翻訳言語の組み合わせ、コンテンツの種類・専門性などにより、価格設定は大きく異なります。例えば、日本語から英語へ翻訳する場合、1文字あたりの単価は一般的に10〜30円程度といわれています。
機械翻訳と人力翻訳には、それぞれ得意/不得意があります。どのような情報媒体を翻訳するか、どれくらいの正確性やスピードを求めているか、どれくらいコストをかけられるか、それらに応じた使い分けや掛け合わせが必要となります。それぞれの得意/不得意を見てみましょう。
機械翻訳が得意なことの1つ目は、スピードです。フリーランスの翻訳者が、例えば英語の文章を日本語にする際に一日5,000語程度の翻訳が可能だという目安があります。一日の作業時間を8時間とすると、この8時間分の文字量程度であれば機械翻訳は瞬時にこなしてしまいます。
機械翻訳が得意なことの2つ目は、コストです。先程、日英で人力翻訳を行った際に、1文字あたり10円〜30円くらいの費用がかかるという話をしました。一方の機械翻訳は、機械翻訳エンジンにもよりますが、一般的に人力翻訳よりも1文字あたりの単価が圧倒的に低くなり、翻訳作業にかかるコストを抑えることができます。
機械翻訳が得意なことの3つ目は、対応言語数です。機械翻訳エンジンによって対応している言語の数は異なりますが、例えば Google 翻訳の対応言語数は100を超えています。人力翻訳の場合は、ターゲットにしている元言語・翻訳言語を得意とする翻訳者を探さないといけません。マイナー言語の翻訳であれば、日本で探した場合数人しか見つからない、ということもありえます。
機械翻訳が不得意なことの1つ目は、訳文の正確性です。機械翻訳は文脈や意図を人間のように読み取れる訳ではないので、ニュアンスなどを正確に捉えることはできません。また、場所名や人名などの固有名詞においても誤訳が発生しやすいといわれています。加えてニューラル機械翻訳では、訳文が急に抜け落ちてしまったり、原文にない内容が訳文にあらわれたり、致命的な誤訳も発生してしまいます。
機械翻訳が不得意なことの2つ目は、背景知識や業界理解です。例えば、翻訳者がある企業のコーポレートサイトを人力翻訳する場合、その企業や業界に対する調査・学習を行い、理解を深めた上で翻訳を実施します。それに対し機械翻訳は、翻訳対象に対する背景知識を持っていないため、業界に応じた的確な翻訳が実施できません。また、文脈を掴むのが得意でないため、1つの単語で複数の意味がある単語は、どの意味での翻訳が適しているかが判断できず、誤訳に繋がってしまいます。
→お役立ち資料「機械翻訳の精度に関する一考察」
人力翻訳が得意なことの1つ目は、正確性です。翻訳者自身が誤訳の無いようにセルフチェックを行い、体制によっては2人目の翻訳者がダブルチェックを実施するので、情報の誤った訳文や訳が漏れてしまうことは基本的にありません。
人力翻訳が得意なことの2つ目は、背景を理解した上での翻訳です。人力翻訳の場合、業界理解や背景知識を考慮した、より的確な翻訳が可能です。英語の"account"という単語は業界によって意味が異なります。銀行だと「口座」、営業や取引の文脈だと「顧客」という意味になります。また、日本語は主語を省略しやすい言語ですが、背景を捉えていないと訳に問題が発生します。機械翻訳は背景を十分に捉えられないため、例えば主語を「I」「You」「We」「He」「She」「They」などのどれにすればいいか判断できないです。これはとても基本的な要素ですが、翻訳者は対象の業界や専門領域を最低限調査・把握して翻訳を行うため、よりターゲットにとって読みやすい翻訳となります。
人力翻訳が得意なことの3つ目は、掲載媒体に応じた翻訳です。翻訳者は、地図を翻訳しているのか、商品パッケージを翻訳しているのか、法文書を翻訳しているのか、Web サイトを翻訳しているのかを明確に把握しています。Web サイトのボタンに"home"と書かれているなら、「家」ではなく「トップページへ」と翻訳することができます。また、地図を翻訳していてレイアウトのスペースに制限があるなら、制限を考慮して文字を少なめに翻訳することができます。機械翻訳ではこのような考慮はできません。
人力翻訳が不得意なことの1つ目は、スピードです。機械翻訳は大量のページがある EC サイトでもほとんど時間をかけずに翻訳が完了します。対して、一般的な日英人力翻訳だと、翻訳者が1日で対応できる翻訳量が限られるため時間がかかります。加えて、背景理解のための調査やチェックなどの時間も追加されてしまいます。
人力翻訳が不得意なことの2つ目は、日英人力翻訳では1文字あたり10〜30円程度と話しましたが、より希少性の高い元言語・翻訳言語になると、文字単価がさらに高くなります。また、医療や法律などの専門性の高い領域となると、翻訳を実施できる翻訳者も限られてくるので、文字単価がより高くなってしまいます。
人力翻訳の場合は、ターゲットの元言語と翻訳言語を得意とする翻訳者を探す必要があります。代表的な言語の組み合わせであれば翻訳者を見つけるのにそこまで困らないかもしれません。しかし、希少性の高い言語の組み合わせであれば、翻訳会社に依頼しても翻訳者がいない、もしくはリソースが足りなく対応できないこともあります。対応言語数が100 を超える Google 翻訳と比較すると、苦手な領域だといえるでしょう。
機械翻訳も人力翻訳も、それぞれの得意と不得意があります。どちらが良いという訳ではありません。それぞれの特徴を理解して使い分けることで、お互いの利点を最大限に活用し、お互いの欠点を補うことができます。
コーポレートサイトの例で考えてみましょう。一般的にコーポレートサイトは、社内と社外の両者に向けられて設計された Web サイトですが、社外へ公開されるものとなるので、注意して翻訳を行う必要があります。ニュースリリースは毎日ページが追加、更新されるので、翻訳会社へ翻訳を依頼してしまうと、日本語の発信スピードへ合わせた翻訳をすることは難しく、また毎日人力翻訳するコストが発生してしまいます。コスト面・スピード面を考慮すると、継続的に更新していくサイトになるので、機械翻訳が適しているといえます。
しかし、コーポレートサイトには、社長からのメッセージや企業理念など、機械翻訳による誤訳を発生させたくないページもあります。キャッチコピーの要素が含まれるメッセージに機械翻訳を用いてしまうと、投資家や社員などのステークホルダーへ誤ったメッセージが届いてしまう可能性があるためです。誤訳の可能性を考慮すると、企業理念などを説明したページはプロの翻訳者に人力翻訳をお願いするのが適しています。更新頻度の多くないページであれば、人力翻訳が不得意とする、翻訳コストやスピードという点もカバーできます。
同一サイト内で、機械翻訳か人力翻訳かのどちらかだけを使う必要はありません。Web サイトの性質や、機械翻訳と人力翻訳のそれぞれの得意/不得意を理解して使い分けることで、最適な翻訳を実施できるでしょう。
→お役立ち資料「多言語 Web サイトの翻訳品質向上」
翻訳をするにあたって、機械翻訳をそのまま利用することに不安を覚える方もいらっしゃるかもしれません。そこで、翻訳の品質を高める方法をご紹介します。
1つ目は、ポストエディット(post-edit)です。ポストエディットは、機械翻訳の出力結果を人がチェック・編集することで、機械翻訳で全体を翻訳した後に、翻訳漏れや文法エラーをチェックしたり、その業界やターゲット言語の文化に適した表現に調整したりと、気になるところを人力で編集します。作業者や作業のレベル設定によって最終的なアウトプットの質は異なりますが、機械翻訳と人力翻訳の合わせ技で、低予算でなるべく速く、そして正確に翻訳を実施できるといわれています。ポストエディットについて、詳しい内容は「ポストエディットとはなにか?必要性やその特徴、注意点を解説します!」をご覧ください。
2つ目は、プリエディット(pre-edit)です。プリエディットは、機械翻訳が処理しやすいように、あらかじめ原文に修正や書き換えを行います。機械翻訳は、主語が省略された文章や句読点が欠けている文章を苦手とするため、原文を事前に工夫することで、誤訳を防ぐことができるといわれています。
機械翻訳をそのまま活用する訳ではなく、要望や目的に応じて機械翻訳と人力翻訳を使い分けたり、さらに二つを組み合わせることで、より正確に、効率良く翻訳することができるでしょう。
Web サイト別でどのような翻訳手法が適しているか、具体例と共に紹介します。
社外に公開しないような Web サイトは、機械翻訳が適しているといえます。例えば社内ポータルサイトだと、翻訳の正確性よりも、いち早く全従業員に情報を届けたいと考えることも多いのではないでしょうか。予算との兼ね合いや社内ポータルサイトに掲載している情報の種類によって適切な翻訳手法は様々かもしれませんが、一般的に機械翻訳やポストエディットが適切と考えていいでしょう。
→社内ポータル・Web 社内報での活用方法
コーポレートサイトは、人力翻訳と機械翻訳を使い分けるのが良いでしょう。更新頻度が多くボリュームも多いニュースリリースのページは、人力翻訳をしてしまうとコストが高くなるため機械翻訳を活用し、気になるところがあればポストエディットを実施することでコストを抑えながらスピーディーに情報を届けることができるようになります。企業紹介ページなどでブランディングメッセージが掲載されているページは、ブランディングの観点から、正しいメッセージを届けるために人力翻訳を活用することをおすすめします。このように、メッセージの重要度合いと公開したいスピード、そして予算のバランスを見ながら、使い分けると良いでしょう。
→コーポレートサイトでの活用方法
これまで見てきたように、機械翻訳や人力翻訳にはそれぞれの得意/不得意があります。「機械翻訳が優れている」「人力翻訳が優れている」と決めつけずに、それぞれの特徴を理解するのが非常に重要です。また、機械翻訳もそのまま使うという選択肢だけではなく、ポストエディットやプリエディットなど、機械翻訳の利点を最大限活用できる翻訳手法もあります。翻訳をする対象のコンテンツの特徴や、予算や納期、それらのバランスを考えて翻訳手法を使い分ける、組み合わせるのが大切です。機械翻訳と人力翻訳の得意/不得意をしっかり理解し、最適な手法で最大の効果を生み出しましょう。