更新日:
機械翻訳の仕組みとは?具体的な特徴やおすすめの翻訳ソリューションを紹介
北野 光平
事業の海外展開に備えて、Web サイトなど本格的な翻訳を検討している企業は増えています。利便性の高さから、企業活動だけでなく一般的ユーザーも簡単に利用できるのが機械翻訳です。しかし、どのような歴史を辿りどのような仕組みに支えられてきたか、あまり知られていないかもしれません。本記事では、機械翻訳の基本的な仕組みや歴史、利用例などを紹介します。
目次 |
機械翻訳とは?
機械翻訳とは、翻訳者が翻訳するのではなく、コンピューターが自動で翻訳を行うシステムを指します。文書の翻訳や音声の翻訳を中心として、活用シーンはさまざまです。たとえばテキスト翻訳の場合はニュース記事を機械翻訳したり、音声の場合は店舗で接客の際に通訳ツールとして機械翻訳が用いられたりしています。
機械翻訳のこれまでの歴史について
機械翻訳の歴史は長く、1950年代の初頭には既に開発が行われていました。機械翻訳はコンピューターの発展と密接に関係し、多くの影響を受けて進化してきました。技術レベルの向上とともに、処理できる翻訳データ量の増加や新しい手法の開発が進み、その精度や利便性を高めてきたのです。現代では AI の発達により、機械翻訳は事業でも活発に利用されるようになりました。機械翻訳の歴史に関しては「機械翻訳がたどってきた歴史からみる進歩を解説!今後の可能性も紹介」をご覧ください。
機械翻訳のメリット
機械翻訳のメリットは、低コストでスピーディな翻訳作業が可能な点です。
このため、特に翻訳する量が多い場合や、すぐに翻訳結果を必要とする場合に有効な手法となります。翻訳者に依頼する場合と比較し、低コストで翻訳結果を表示するまでの時間を大幅に短縮でき複数の機械翻訳サービスが無料で提供されるなど、企業だけでなく一般ユーザーでも日常的に利用しやすくなっています。近年は機械翻訳のスピードがさらに進化しており、短文であれば入力後すぐに翻訳結果が表示されます。短い文章を翻訳する場合には、ほとんどタイムラグが発生しません。
機械翻訳のモデル
機械翻訳にはいくつかの方式あり、時代によって主流のモデルが移り変わってきました。以下では、機械翻訳で使用される主な仕組みを紹介します。
ルールベース機械翻訳(RbMT)
ルールベース機械翻訳(RbMT)とは、文章の構造に注目して判定を行い、辞書の情報と照らし合わせて各単語や文法を翻訳するモデルです。主語・動詞が明確に示されたロジカルな書き言葉であれば正確な翻訳が可能です。話し言葉やクリエイティブな文章に関しては、意味の通る翻訳が難しいケースが多く、逆に教科書に載るようなルール通りの文章を翻訳する場合には、ルールベース機械翻訳が活用できる可能性が高くなります。
統計的機械翻訳(SMT)
統計的機械翻訳(SMT)とは、対訳データを与え統計モデルを作成し、訳文を作成する仕組みです。対訳集を分析しそれぞれの言語でのパターンを覚え、翻訳された文章の正しさを確率で判定します。
対訳集の情報を使って最適な訳文を生成するため、頻出する文章の翻訳には強いですが、独特の表現などは正確に翻訳できない場合があります。
ニューラル機械翻訳(NMT)
ニューラル機械翻訳(NMT)とは、脳神経のネットワーク構造を模したモデルを利用した翻訳の仕組みです。機械が自ら学習しながら翻訳を行うのが特徴で、学習データを加えていくことで、翻訳内容の質が向上していきます。
NMT では、翻訳する際、エンコーダーを使って単語を数字列に変換します(例:犬ー>23)。そして出力された数字列を、ニューラルネットワークモデルという複雑なアルゴリズムを介してまた別の数字列として出力します。最終的に、この数字列をデコーダーを使ってまた文字に変換して(23ー> dog)、最終的な翻訳の文章を作ります。現在はこのニューラル機械翻訳が機械翻訳の主流であり、一般ユーザーにも広く使われています。
機械翻訳を支える技術について
機械翻訳は、さまざまな技術や仕組みによって支えられてきました。各システムを把握できれば、より機械翻訳についての理解を深められるでしょう。以下では、機械翻訳を支えているさまざまなシステムを紹介します。
翻訳精度向上を支えるデータベース「対訳コーパス」
対訳コーパスとは、翻訳文を「原文」と「訳文」の形でまとめたデータベースです。機械翻訳の学習データとして使用され、翻訳精度向上を支える下地になっています。
単語や文章にはさまざまな翻訳結果が考えられますが、この対訳コーパスに細かな文脈やニュアンスの違いを人間が入力することで、その微妙な違いを機械翻訳に学習させることが可能で、主に統計的機械翻訳とニューラル機械翻訳の翻訳で利用されます。
単語の意味や関係性を分類する「Word2Vec」
Word2Vec とは、単語を「記号」から計算できる「数値」に変換できるシステムのことです。画像や音声と違い、言語は「物理的な実数値」ではなく「記号」であるため深層学習の応用には大きな障壁がありました。その壁を壊し技術的に大きな進展をもたらしたツールが Word2Vec です。2013年にトマス・ミコロフ氏によって考案された技術で、多くの業界から注目を集めています。単語を「数値」に変換できるようになったことで、前後の単語から意味を表せるようになり、高い精度で言語処理が行えるようになりました。
この技術は、機械翻訳の他にも、チャットボットや感情分析、レコメンドなどにも用いられています。
NMT の基本となるモデル「アテンション機構を用いた系列変換モデル」
多くのニューラル機械翻訳では「アテンション機構を用いた系列変換モデル」という仕組みが採用されています。単純化して説明すると、原文をニューラルネットワークに順次入力し数値化され、各段階の履歴を記憶しておき、適宜記憶を参照しながら訳語を選択して最終的な訳文を合成する仕組みです。この仕組みによって現在のニューラル機械翻訳の品質が支えられています。
機械翻訳を使ったサービスの事例
機械翻訳を使ったサービスには、さまざまな事例があります。以下では、機械翻訳の事例を紹介します。
機械翻訳を使ったサービスの事例① Google 翻訳
「Google 翻訳」とは、検索エンジンで知られる Google が提供するテキスト翻訳システムです。 Web 上でテキストを入力するだけで、簡単に機械翻訳を行えるのが特徴です。アプリ版ではテキスト翻訳だけでなく、音声入力による翻訳やカメラを使った読み取りによる翻訳も可能となっているため、さまざまなシーンで活用されています。
機械翻訳を使ったサービスの事例② POCKETALK
「POCKETALK」は、音声認識機能を備えたポータブル機械翻訳デバイスです。音声入力した内容は即座に翻訳され、そのまま音声として出力されます。音声と同時に文章での翻訳も行われるため、デバイスの画面を見せることでスムーズに意思疎通が可能です。対面でのコミュニケーションが円滑になるため、旅行先や外国人観光客への対応を行う実店舗などで使用されています。
機械翻訳は Web サイトで活用しやすい特徴がある
機械翻訳は、オフラインの観光領域(チラシや看板、案内ポスターなど)から、オンライン施策である EC サイトやコーポレートサイトまで、幅広く活用されています。近年はコロナウイルスの影響により、オンライン施策の翻訳に予算を投じる企業が増えています。特にページ数が多い Web サイトは機械翻訳ツールを使うことで、より効率的かつスピーディーに翻訳が可能なため、今後も機械翻訳の活用が増えるでしょう。
基本的に機械翻訳はページ数が多く頻繁に内容が更新される Web サイトで活用しやすいため、自社のホームページなどを翻訳する際には機械翻訳の利用検討をおすすめします。
機械翻訳を使うのなら翻訳も兼ね備えた多言語化ソリューション WOVN.io がおすすめ
機械翻訳を使う場合には、人手による翻訳のサポート機能も充実した多言語化ソリューション、WOVN.io の導入をご検討ください。WOVN.io には、大きく2点のメリットがあります。
「マルチ翻訳エンジン」で翻訳精度を常にアップデートしている
WOVN.io では「Google 翻訳」に加え、日中・中日翻訳に特に強みを持つ「みらい翻訳」、ビジネス文書に強みを持つ Microsoft Azure Cognitive Services の「Translator」、翻訳精度の高さと翻訳文の自然さ・流暢さに強みを持つ「DeepL」など、複数の機械翻訳エンジンを利用できます。今後もコンテンツや言語ペアに応じて、複数のエンジンから自動で最適な AI 翻訳を選択されるように機能がアップデートされます。Web サイトの正確な翻訳を求める場合、マルチ翻訳エンジンを備えた WOVN.io の導入を検討してみてください。
「ピボット翻訳」や「用語集」など多数の機能が利用できる
WOVN.io には、「ピボット翻訳」と呼ばれる機能が搭載されており、日本語から英語に人力翻訳したデータを活用して他言語への翻訳が可能です。日本語が元言語のときよりも英語を起点とした翻訳の方が品質が高く、ある程度の品質を担保できるので、複数言語への翻訳展開でコストと工数を大幅に削減できます。「ピボット翻訳」の詳しい機能については「ピボット翻訳機能詳細」をご覧ください。
その他、「用語集」の機能を使えば、固有名詞などを事前に登録することで誤訳を回避できます。たとえば、商品名や専門用語の対訳を登録しておけば、その後は登録した対訳が機械翻訳に自動で適用されるため、修正の手間がかかりません。
まとめ
機械翻訳は日常で役立つ便利ツールであるだけでなく、事業の海外展開を支える画期的な技術です。ニューラル機械翻訳の登場によって機械翻訳の精度やスピードはますます向上しているため、グローバル化が進む昨今は事業において欠かせないシステムのひとつといえるでしょう。海外展開を考えている場合は、機械翻訳を活用してみてはいかがでしょうか。
北野 光平
新卒で、国内大手IT企業に入社し、事業企画として新規サービスのPMO、業務改善・事業戦略構築を担当。 2021年に WOVN に入社しCustomer Success として WOVN.io の導入を多数経験。現在は、Marketing Section Headとしてマーケティング戦略・業務全般に従事。