「機械翻訳の精度が高くなった」と聞いて、機械翻訳を導入してみたものの、精度が上がらず困っているという方も多いのではないでしょうか。
この記事では機械翻訳の精度を向上させるコツをお伝えします。
機械翻訳とは?
まず、機械翻訳とは人の手を介さずに、コンピューターで翻訳を行うことです。
機械翻訳には3つの種類があります。
- ルールベース型(RMT)
- 統計ベース型(SMT)
- ニューラルネットワーク型(NMT)
この中でも近年は翻訳精度が高いニューラルネットワーク型が主流です。
機械翻訳についてのより詳しい説明は、機械翻訳の種類や精度について説明している記事もご参照ください。
機械翻訳の精度

機械翻訳の精度はニューラルネットワーク型の機械翻訳の台頭により目覚ましく向上しています。
ただし、精度を高めるためにはコツがあり、使い方を間違えると力が発揮できないという難点があり、注意が必要です。
従来の単語を1つひとつ直訳したような不自然な訳文とは異なり、ニューラルネットワーク型の訳文では「自然な訳文」になることが特徴です。
しかし、この「自然な訳文」は、必ずしも「正確な訳文」というわけではありません。
意図していたものと異なる訳の文章ができあがったり、訳が抜け落ちた文章になってしまうことがあります。
従来の機械翻訳では、翻訳ミスの部分が不自然な場合が多く、訳文を見ただけですぐに翻訳ミスを見つけられました。
しかし、ニューラルネットワーク型の機械翻訳で「自然な訳文」が可能になったために、翻訳ミスを見つけることが難しくなるという新たな問題も出てきます。
機械翻訳の精度を向上させるコツ

機械翻訳の精度を上げるコツには下記の5つがあります。
- 文章を短く区切る
- わかりやすい文章にする
- 同音の平仮名は漢字に直す
- 文章の途中にスペースや改行は入れない
- 社内向け文書は要注意
文章を短く区切る
短い文章と長い文章だと、短い文章の方が理解しやすいのは人間も機械翻訳も同じです。翻訳精度を上げるためには文章はできる限り簡潔に、短く切りましょう。
長い文章を翻訳したい場合には、あらかじめ文章を切り分けておくことをおすすめします。
例のように2文に分けた方が翻訳精度は増します。
例)「展覧会にはたくさんの人がごった返していたので、目当ての作品に辿り着くことができずにそのまま帰ってきた。」
→「展覧会にはたくさんの人がいた。目当ての作品を見ずに帰宅した。」
わかりやすい文章にする
特に英語への翻訳の場合、主語述語がはっきりとわかる文章を作ることが大切です。
日本語には主語が抜けている文章や、文末の述語があいまいな文章があります。
例)「今日は会議に出席する予定。」
→「私は今日会議に出席する予定です。」
機械翻訳にとっては主語述語がはっきりしている文章がより訳しやすいです。
日本語では「何を」という目的語がよく抜け落ちますが、目的語も意識して入れるようにしましょう。
ほかに、機械翻訳を行うときに避けたいのが句読点の多用や代名詞の利用です。
句読点が多い場合は先ほどの「文章を短く区切る」にも通じますが、文章がわかりづらくなっていることが考えられます。まずは文章をシンプルにわかりやすくしましょう。
また、代名詞についても主語述語と同様にはっきりとわかるように書いておく方が良いでしょう。機械翻訳では「それ」が何を指しているのかを文章内からくみ取るのが難しく、誤訳の可能性が増大します。
同音の平仮名は漢字に直す
同音の平仮名が多数存在する場合、誤訳の可能性が増えます。
例えば「きかい」の場合、「機械」と「機会」では全く違う意味ですが、機械翻訳がどちらの意味で捉えるかはわかりません。
また動詞でも、「いたむ」の場合は「痛む」「傷む」「悼む」と選択肢があり、機械翻訳がどの意味をとるかによっては、意図していない文章や誤訳となります。
誤訳を避けるために意味に合った漢字を使うようにしましょう。
文章の途中にスペースや改行を入れない
文章を書くときに、レイアウトをきれいに見せ、読みやすくするために改行やスペースを入れることがよくあります。
しかし、機械翻訳はこの改行やスペースが苦手です。
改行がある場合、機械翻訳は改行までを1つのグループとして認識して翻訳するため、文章の意味が通らない訳文ができあがってしまいます。
文の途中に改行が含まれる場合には、全ての改行を一度削除して文章全体をつなげてから翻訳を行うことが大切です。
社内向け文書は要注意
社内向けの文章には文法的に不完全な文が多く存在します。
また社内でしか通じない専門的な用語が含まれることが多く、機械翻訳ではうまく訳せない可能性が高いのが現状です。
精度の高い翻訳・社内文書の翻訳はアイ・ディー・エーにお任せ

社内向け文書や、自社のホームページや製品情報を翻訳する際は、翻訳会社への依頼をお勧めします。
社内で機械翻訳のみを使用して翻訳業務を行うよりも、人間によるポストエディット、校正を含めたプロによる工程管理を行った方が、効率的かつユーザーに自社の魅力を正確に伝えられる翻訳になるためです。
また、機械翻訳を行う場合、事前に自社用の対訳データを登録できる機械翻訳エンジンもあります。
機械翻訳エンジンは、用語集として登録するものから、コーパスと呼ばれる大規模なデータベースを登録できるものまでさまざまです。いずれの形式でも、そもそも対訳データの精度が低いと、機械翻訳の精度も下がってしまいます。そのため、機械翻訳を行う際に既存の対訳データを活用する場合は、事前に精度を翻訳会社に確認してもらうと良いでしょう。
アイ・ディー・エー株式会社では、翻訳会社として20年以上積み重ねてきたノウハウがあるため、的確なアドバイスと改善提案を行います。
また、機械翻訳と人力での翻訳のハイブリット型の翻訳もでき、費用が抑えられるメリットもあります。
さらに、翻訳データは翻訳資産として次回の翻訳に活かし、翻訳を行うごとに精度を上げ、かつコストを下げることができます。
まとめ
今回は機械翻訳で翻訳精度を上げるコツについてお伝えしました。
機械翻訳を使う際にぜひ活用してみてください。
機械翻訳の精度は確かに上がっていますが、全ての翻訳を任せられるまでにはまだ時間がかかると思われます。
高い精度、正確な翻訳が必要となるビジネス文書については翻訳会社に任せるのがおすすめです。
翻訳する文章に必要な正確さや費用面などを考え、最適な翻訳方法を選びましょう。
翻訳を依頼するなら、多⾔語翻訳と制作で20年以上の実績があるアイ・ディー・エー株式会社がおすすめです。
翻訳言語のネイティブによる翻訳は、80以上の言語と幅広い専門分野に対応しており、翻訳サービスの品質とプロセス管理の国際規格ISO 17100認証を取得しています。
また、翻訳からウェブサイト/印刷物の制作までを⾃社内で⾏うワンストップ体制のため、短納期と低コストを実現しています。
多言語翻訳/多言語ドキュメント制作/多言語ウェブサイト制作
翻訳ソリューション/Author-it / Madcap
動画・YouTube翻訳サービス/インバウンド対策支援

翻訳監修
セス ジャレット:Seth Jarrett
カナダ出身。翻訳会社のアイ・ディー・エー株式会社に13年以上在籍。翻訳者のクオリティーチェックから英語のリライトまで幅広く対応。自らパンやスイーツをつくる料理人でもある。