
更新日:
社内の機械学習エンジニアは翻訳機能を開発すべき? 翻訳のリアルを踏まえた適切な多言語対応とは

佐藤菜摘

グローバル化に伴い、企業の競争力強化のためには、迅速な多言語対応が求められています。昨今の急激な翻訳テクノロジーの進化により、翻訳機能を自社開発しようと考える企業も少なくありません。
しかし、翻訳機能の自社開発は、機械翻訳に関する高いリテラシーをもつ人材が必要であり、初期投資や運用面のコストもかかるため、思ったほど簡単には進まないケースも多くあります。
そのため、「そもそも翻訳機能を自社開発すべきかどうかは、ROI(投資利益率)の観点から考える必要がある」と Wovn Technologies株式会社で CTO(技術責任者)を務める幾田雅仁さんは指摘します。
では、多言語対応のためのベストな布陣とはどのようなものなのでしょうか。
プロの翻訳者の思考を知るなかで行きついた機械翻訳の効果的な活用法や、多言語対応のための最適な人的リソース配分などについて、幾田さんに聞きました。
<幾田雅仁さんプロフィール>
1997年から NIFTY-Serve の開発に携わり、2007年から SBI 傘下の会社でクレジット決済システムの設計と開発を担当。2012年から株式会社gumi でソーシャルゲーム開発、共通システム・ライブラリの開発を担当した後、CTO に就任。その後、2020年より Wovn Technologies株式会社に CPO としてジョインしたのち、2024年に CTO に就任し、LLM を活用した開発に注力。
目次
|
高品質な翻訳機能を開発するには、機械翻訳に関する高いリテラシーが必須
――翻訳テクノロジーの進化によって、翻訳の世界も大きく変化していますね。
近年、LLM(Large Language Model:大規模言語モデル)を搭載したサービスが増えてきましたね。
LLM は、翻訳を目的とした技術ではありませんが「自然な言語で指示を理解できる特性は翻訳分野に応用できる」として、早い段階から注目されていました。
私たちも、LLM の技術を応用して人力翻訳を効率化するソリューションをいち早く世に送り出しています。
OpenAI や Anthropic の生成 AI サービスは非常にわかりやすくて使いやすいインターフェースですから、「簡単に翻訳機能を開発できそう」と自社開発に取り組むスタートアップ企業も増えましたね。
――実際のところ、翻訳機能の自社開発は容易にできるものですか。
LLM を組み込んで翻訳する機能そのものの開発は、機械学習エンジニアはもちろん、その他の領域のエンジニアや、あるいは少し IT に詳しい人であれば十分に可能だと思います。ただし「ビジネスに耐えうる高い品質」を実現できるかは、別問題です。
翻訳者がすべて人力で翻訳している時代に機械翻訳が登場したとき、期待に反してあまりにも翻訳の質が低く、機械翻訳への幻滅期ともいえる時期を迎えたことがありました。その頃に比べれば LLM はだいぶ高機能なので「LLM はかなり良い」「わりと使える」と思うかもしれません。
それでも、LLM さえあれば多言語対応が叶うとは思わないでしょう。
ましてや、プロの翻訳者に翻訳を依頼しているような品質重視の企業にとっては、「LLM だけに任せることは絶対にできない」と感じると思います。
――LLM を使った翻訳機能の開発は、具体的にはどのあたりが課題なのでしょう。
それを知るには、プロの翻訳者の頭の中を覗いてみる必要があります。一般的に「翻訳する」というと、元の言語の意味をくみ取って単語を置き換えていくことをイメージするのではないでしょうか。
私自身も入社当初は「日本語の文章を一度機械翻訳にかけて、意味が通りにくいところを翻訳し直し、マネージャーが品質をチェックして納品」という表面的な流れしか見えていませんでした。
ところが、社内にいるプロの翻訳者にヒアリングをしてみると、彼らの頭の中ではもっと複雑な作業が行われていることがわかったのです。
まず、機械翻訳にかける前に、言語特有の言い回しや直訳してはいけない文言をピックアップしておきます。例えば「箸が転んでもおかしい年頃」「危ない橋を渡る」のような、文章そのものからは意図を連想しにくいイディオムが良い例ですね。
さらに、背景説明をしないと伝わりにくいフレーズの調査をします。これは、日本語の会話でよく出てくる「ウナギ文」がわかりやすいと思います。ウナギ文とは、店で料理を注文する際に「私はウナギだ」と答えるように、動作が省略された文のことです。本来は「私が注文したいのはウナギだ」という意味であることは、日本人ならすぐわかりますが、これをそのまま英訳すると「I am an eel.」となり、何を伝えたい文章なのかがまったくわからなくなりますよね。
そこで、最初に見直しが必要になりそうな箇所をピックアップしておいたり、原文を修正したりした上で機械翻訳にかけ、アウトプットされた訳文をさらに修正しているのです。
翻訳者はこうした作業をほぼ無意識に行っているので、一見しただけではわかりません。
――LLM でプロの翻訳者と同じ品質を出そうとすると、その全行程を再現できるように指示を出さなければならないということですか。
そのとおりです。LLM は、大量のデータとディープラーニングでパターンを学習し、人間の自然な会話に近い文章を生成できる自然言語処理モデルです。ただ、誰もが簡単に利用できる汎用モデルの LLM は、インターネット上に公開されている情報など、比較的取得しやすい情報を学習データとしています。そのため、特定分野において経験を積んだ人だけが持つ知識や能力と同等の力を最初から発揮することはできません。
つまり、一般的な知識にもとづく翻訳はできても、プロの翻訳者の頭の中を再現した翻訳はできないのです。
プロの翻訳者と同等の訳文をアウトプットさせるには、プロの翻訳者が実践している翻訳プロセスを適切にプロンプトにして、LLM に果たしてほしい役割を示す必要があるのです。先程のウナギ文であれば、「話者が飲食店にいて料理の注文をしようとしている」という背景やコンテキストがわかるようにプロンプトで伝えなければなりません。
高品質な翻訳を自社開発で実現するには、ROI に目をつぶって投資する必要がある
――では、機械翻訳を自社開発するには、どのような人材が必要なのでしょうか。
翻訳機能を自社開発するなら、2つの分野に明るい人材が必要だと考えます。
まずは、翻訳の質を担保できるプロの翻訳者です。ただ、長年、人力で翻訳している人や、翻訳する文章の領域に造詣が深い人だからといって、LLM で高い品質の翻訳を実現できるとは限りません。そこで、翻訳者の頭の中にある明確化されていない翻訳プロセスをすくい上げ、プロンプトに落とし込んでいくコンバーターのような役割を果たす人が必要です。一般的に、プロンプトエンジニアと呼ばれる存在ですね。
この2人がともに協力しあうことで、翻訳機能の開発を進めることができます。とはいえ、一般的に多言語対応のための翻訳は ROI が低いので、翻訳者やプロンプトエンジニアを即採用する決断はしにくいでしょう。
――テック系企業などでは、機械学習エンジニアに翻訳機能の開発を一任するケースもありそうですが…。
そうですね。機械学習エンジニアは、AI をトレーニングするためのデータの収集、用途に応じたアルゴリズムの選択・実装、機械学習モデルが動作するための環境構築などを担うスペシャリストです。
R&D(Research and Development)も得意分野なので、最新の論文から LLM を使った翻訳に活かせるアイディアを見つけてきて、スピーディーな開発を助けてくれると思います。学習済みの LLM に独自のデータを追加し、新しいモデルを作っていくファインチューニングで LLM をカスタマイズしたいときも、彼らの知見が役立つでしょう。
ただ、こと翻訳に関していえば、求められる能力はそこまで高くはありません。機械学習エンジニアではなくとも、プロの翻訳者と連携し、プロンプトチューニングができれば、十分に対応できるのです。
そのため、非常に広範な知見をもつ機械学習エンジニアを、機械学習の一領域である翻訳だけに閉じ込めてしまうのは、もったいないなぁと感じてしまいます。
――機械学習エンジニアには、もっと能力にふさわしい仕事があるということですね。
LLM による翻訳機能を高いレベルで自社開発しようとすると、知見を持った専門性の高い人材が必須ではあります。ですが、より収益に直結する領域に貢献できる機械学習エンジニアをわざわざ翻訳機能の開発に配置する必要性は低いのではないかと感じます。
むしろ、機械学習エンジニアに翻訳機能の開発を任せることで、オーバースペックな学習エンジンを作ってしまったり、プロの翻訳者がいない状態で開発を進めて本質的でないものが出来上がったり、費用対効果に見合った成果が得られない可能性もあります。
それでも、「なるべく早く多言語対応したいから、自社の人材でなんとかしよう」となると、どうしても一番詳しい機械学習エンジニアに業務が割り振られることもあるでしょう。LLM が彼らの専門分野の一部分であることは確かですから、アイディアや意見を求められれば言えることも多いし、もちろん開発もできます。機械学習エンジニア自身がミスマッチだと感じていても説明しにくく、持っている技術や知見を発揮しきれない状態になることも少なくありません。
せっかく機械学習エンジニアが社内にいるなら、もっと自社にとって重要な研究開発やシステムの最適化を任せたほうがいいと、私は思います。高品質な多言語対応を目指す企業には、貴重な専門性を持つリソースを無駄にしないよう、翻訳機能の開発はアウトソースすることをおすすめしたいですね。
「WOVN.io」なら、社内リソースを適正化し、スピーディーに多言語対応を実現できる
――アウトソースの選択肢として「WOVN.io」がありますが、自社開発の課題である翻訳品質やリソースの課題に対して、どのようにコミットできるのでしょう。
既に「WOVN.io」を導入している企業は、私たちの設定変更作業で翻訳エンジンが私たちが開発した LLM に切り替わります。インターフェースや接続の仕方は変わりませんから、システムを改修する必要はありません。また、訳文のエラーチェック、改善提案などを行える「WOVN.copilot」を使うと、「致命的な誤訳」「正確さ」「流暢さ」の3つの観点から訳文を評価して校正すべき点を自動的に示します。これにより、多言語サイトの運用の手間を圧倒的に効率化できるのです。
翻訳経験がない人や開発経験がない人でも多言語サイトを運用できるようになり、社内のリソースの適正化につながるでしょう。
また、すべての Web ページを機械翻訳で対応するのに不安が残る場合は、一定の品質が求められるページのみ、ポストエディットや人力翻訳にすることもできます。ポストエディットとは、機械翻訳の翻訳結果を人が修正する手法のことですね。このように、品質やコスト、納期のバランスを考えて、機能翻訳、ポストエディット、プロの翻訳を柔軟に使い分けできることも「WOVN.io」の特徴のひとつです。
――コスト面ではどうでしょう。
コスト面で特にメリットがあるのは、Web サイトの翻訳をすべてプロの翻訳者に任せているような企業です。予算の兼ね合いで、翻訳できずに日本語のまま埋もれているコンテンツも少なくありません。
そこで、WOVN.io であれば、すべての工程を人が行う人力翻訳よりもコストを抑えられます。さらに、機械翻訳と人力翻訳のそれぞれの得意分野を活かし、不得意分野を補うことで、翻訳品質を落とさずに多くのコンテンツを多言語化することも可能です。
――まさに、「世界中の人が、すべてのデータに、母国語でアクセスできるようにする」という WOVN の理念を企業単位で実現できるわけですね。
そうですね。私たちが提供している「WOVN.io」は、インターネットコンテンツの多言語化ソリューションであって、決してモノとして売っているわけではありません。
当社にはプロの翻訳者が在籍していて、私たちとともに「LLM で翻訳者の頭の中をどう再現するか」を日々実践しながら開発をしています。そのため、文章の翻訳品質はもちろん、多言語サイトの運用面での人的負荷も解消できることが、「WOVN.io」の大きな特徴です。
これからも、より多くの企業が、自社のリソースを適切に配分し、迅速な多言語対応を実現できるようにお手伝いができればと思っています。
Web サイト多言語化のご相談は WOVN へ
Wovn Technologies株式会社は Web サイト多言語化ソリューション「WOVN.io」を提供しています。多言語化についてご興味のある方は、ぜひ資料をダウンロードください。

佐藤菜摘
前職は、広告代理店にて大手CVSの担当営業として、販促物製作やブランディングプロジェクトに従事。2016年WOVN Technologies株式会社に入社し、広報業務を担当。2022年よりMarketingチーム。