就職無理学部物理学科

旧帝大の理系大学生が物理とプログラミングのブログ

Google翻訳がニュートラルネットワークを取り入れて、大幅に精度を向上させていた!

こんにちは、しば(@akahire2014)です。

いまTwitterなどのネット上で話題になっているのですが、Google翻訳の精度が、今話題の深層学習を取り入れてまじで向上しています。

 

「存じ上げません」はどうなった?

以前のGoogle翻訳では「存じ上げません」が「zonziage not」っていうくそみたいな役だったんです。まあ、単語の意味を調べるくらいならGoogle翻訳を使う価値はかろうじてあったんですが、weblio辞書とかの方が優秀だったので、僕は全く使っていませんでした。実はGoogle翻訳は1ヶ月前にも少し精度が上がっていて、「I have no idea」くらいには成長していたんです。しかし、もっと長い英文や日文になるとクソみたいな訳しかしてくれませんでした。

Google翻訳の精度向上の話を聞いて、真っ先にこの「存じ上げません」を試してみたのですが、これが「I do not know.」に変換されてました。初期の頃からすると恐ろしい進歩です。

もっと長い文章は?

もっと長い文章ではどうなるんだろうと思って、wikipediaのトランプのページで試してみました。

Donald John Trump (/ˈdɒnəld dʒɒn trʌmp/; born June 14, 1946) is an American businessman and politician who became the President-elect of the United States on November 8, 2016. Since 1971 he had chaired The Trump Organization, the principal holding company for his real estate ventures and other business interests. During his business career, Trump has built office towers, hotels, casinos, golf courses, and other branded facilities worldwide. He was elected as the 45th U.S. president in the 2016 election on the Republican ticket, defeating Democratic nominee Hillary Clinton, and is scheduled to take office on January 20, 2017.

この英文が

ドナルド・ジョン・トランプ(1946年6月14日生まれ)はアメリカのビジネスマンで、2016年11月8日に米国の大統領エレクトに選ばれた政治家です。1971年以来、彼は議長を務めました。 彼の不動産ベンチャーおよび他のビジネス上の利益のための会社。 彼のビジネスキャリアの間、トランプは、世界中のオフィスタワー、ホテル、カジノ、ゴルフコース、およびその他のブランド施設を建設しました。 彼は民主党のヒラリー・クリントンを破って共和党のチケットで2016年の選挙で第45代アメリカ大統領に選出され、2017年1月20日に就任予定です。

このようになりました。すごくないですか?この精度。すこしおかしなところはあるものの、高校レベルの英語の知識があれば、簡単に修正することができます。

OCRと組み合わせたら最強じゃん。論文も読める?

OCRってのは簡単にいうと画像の文字をテキストに起こす技術なんですけど、これ中高生が使ったら宿題なんかすぐ終わるじゃないですか。よく、教科書の英文訳してこいみたいな宿題が出ると思うんですがスマホでパシャって、ちょっとおかしな箇所直してGoogle翻訳にぶちこめば宿題完了ですよね。

僕も、OCRのアプリ使って実験教科書の実験手順なんかはよくテキストにするのですが、まあまあな精度でテキスト化してくれます。

今はブラウザ上でできるサイトもあるみたいで、こんなサイトを見つけました。

nelog.jp

これに論文ぶち込んで、Google翻訳してもらえば論文読まなくていいんじゃないだろうか。。。。論文て基本英語しかないので、読むだけで一苦労なんですよね。

理系の文章でも翻訳してくれるのか試してみました。wikipediaの超電導の英語ページから引っ張ってきました。

In superconducting materials, the characteristics of superconductivity appear when the temperature T is lowered below a critical temperature Tc. The value of this critical temperature varies from material to material.

これが

超伝導材料では、温度Tが臨界温度Tcより低くなると、超伝導特性が現れる。 この臨界温度の値は材料によって異なる。

こうなりました。今回意地悪して、「critical temperature」という専門用語も入れたのですが、しっかり臨海温度というふうに訳せています。

これは、まじで論文を読む負担が大幅に減ります。僕は英語は得意な方ですが、これはかなり嬉しいです。

 

AIに仕事が奪われる感覚がリアルになった。

Google翻訳の精度が大幅に向上して、ぞっとしました。近い将来、翻訳・通訳関係の仕事はなくなりますね。僕は中学生くらいの頃、英語を勉強して仕事にしようと思っていたので、その道に進まなくて本当に良かったと思います。AIに奪われないような仕事を選ぶってこれからの時代めちゃくちゃ大事ですね。

なにはともあれ、これから英語を勉強しなくてよさそうになることはめちゃくちゃ嬉しいですね!みなさんも、Gooogle翻訳使ってみてください!!

 

人工知能と経済の未来 2030年雇用大崩壊 (文春新書)

人工知能と経済の未来 2030年雇用大崩壊 (文春新書)