『BERT』アップデートが日本語にも適用開始!ー影響はどれほどのものか?傾向と対策を考える

GoogleBERTアップデートの日本語検索への影響と傾向対策

2019年12月10日、Googleは予て英語圏で展開されていた『BERT』アップデートを日本語を含む70言語にも適用したことを発表しました。

このBERTアップデート、検索結果においてどのような影響をもたらすのでしょうか?


そもそも『BERT』とは何か?


ところでそもそも『BERT』とは何なのでしょうか?

『BERT』は、2018年10月に発表されたGoogleの新しい自然言語処理モデルです。2019年10月25日にまず英語圏限定で検索エンジンのアルゴリズムに導入され、約1ヶ月半語の2019年12月には日本語を含む70言語にも導入・適用が開始されました。

BERTの何がすごいの?


この『BERT』、何がすごいのかと言いますと、そもそもこれまでの言語処理モデルとは根本から違うということです。

長い文章や文脈理解も人間を超えたレベルに


SEOの観点からはやや外れますので詳細な技術の説明は割愛しますが、BERTはこれまでのAIでは不可能とされていた「人間の理解力(文章読解力)を超える」ことが可能になり、より長い文章や前後の文脈の解釈が可能になったとのこと。

2011年に始まった『ロボットは東大に入れるか(東ロボ)』プロジェクトでも、これまでのAIでは全く歯が立たなかった英語試験の長文読解や単語の並び替え問題を、人間よりも高い正答率で解きこなしました。

検索結果にも大きな違いが


BERTの導入は検索結果を従来のものとは大きく変えます。

実際にGoogleがBERTによってどう検索結果が変わるのか?いくつか例を挙げていますのでご紹介しましょう。

たとえば「Can you get medicine for someone pharmacy」という文章。

直訳すれば「薬局で誰かの薬を買うことができますか」となります。つまり検索者の意図としては、家族や友人など、誰か=自分以外の人のために代わりに薬を買うことができるか?ということになります。

しかしこれまでのGoogleではこの文章を完全に理解することができず(特にsomeoneを無視してしまう)、単に薬局で薬を買う方法として処理し、処方箋を貰う方法のページを検索結果を返していました。これがBERT導入後はより検索意図に沿った答えを返すことができるようになります。

CanYouGetMedicineForSomeonePharmacyのBERT導入前後の検索結果比較


同様に、「2019 brazil traveler to usa need a visa」という文章は、「アメリカに行くブラジルからの旅行者はビザが必要か?」という意味で“to usa”のtoが重要ですが、従来のGoogle検索ではこのtoを理解することができず無視してしまい、結果「アメリカ人がブラジルに行くにはビザが必要か?」と真逆の処理をしてしまっていました。

これがBERT導入後には正確に意味を理解し「ブラジル人がアメリカへ渡るにはビザが必要」と適切な答えが載っているアメリカ大使館のページを表示しています。

2019BrazilTravelerToUSANeedAVisaのBERT導入前後の検索結果比較

私たちはこれまで検索エンジンで何か情報を検索するとき短いいくつかのキーワードを組み合わせて検索してきました。それは検索エンジンが長い文章や話し言葉(自然言語)は理解できないと知っていたからです。

しかしこれがBERTによって、普段の会話で使うような自然言語による検索でも、より精度の高い答えを返してくれるようになったというわけです。

BERTの傾向と対策


革新的な言語処理モデル『BERT』がGoogleの検索アルゴリズムにも導入されたことで、これからのランキング評価にも大きな影響が出ることは間違いないでしょう。

実際に12月10日のBERTの日本語への展開発表後、一部のクエリでは検索結果の変動が見て取れます。

では今後のSEOにおいては、何か特別なBERTへの対応が必要になるのでしょうか?

(すぐに)特別な対策が必要になることはない


結論から言えば、すぐに何か特別な対策が必要になることはないでしょう。

というのも、BERTアップデートが実施されたからと言ってそれがすぐに検索結果に大きな影響を及ぼすわけではありません。

BERTはAIで学習していくものですから、これからも学習と最適化を繰り返していくでしょう。となると逆に現段階ではまだスタートラインに立ったばかりであって、大きな影響力は無いと考えられます。

またBERTが得意とするのはさきほども紹介したように長い文章や話し言葉などの自然言語の処理ですから、それ以外の短いキーワード検索などとは棲み分けがされるでしょう。

Googleが言うにはBERTの影響は検索結果全体の10%とのこと。裏を返せば90%は従来通りということです。

この10%が大きいか小さいかは判断が難しいところではありますが、少なくともBERTアップデートが検索結果全体を揺るがすようなことはないということですね。

日本語の理解がどこまで進むのか未知数


またSEO界隈の人間から言わせてもらうと、はたしてBERTがどれだけ日本語を理解できるのか?は正直未知数です。

これまでもGoogleは長年にわたって検索エンジンの改善を進め、コンテンツやユーザーの検索意図を把握しようと努めてきました。

その甲斐あってか当初は簡単に操作できた検索ランキングも、現在ではスパム的な行為は高い確率で見抜かれブラックハット的な手法でハックすることは非常に難しくなりました。

真っ当なコンテンツが評価される時代は確実にき始めています。

しかしGoogleも完璧ではありません。とりわけ日本語の理解・解釈にはいまだに苦しんでいるように思われ、あきらかに検索ユーザーが求めているものではない、適切ではない検索結果が返されるクエリも多数存在します。

いくらBERTが革新的であっても、これまで散々苦しんできた日本語を急に完璧に理解できることはまずないでしょうし、これからどこまで理解できるようになるかも不明です。

日本語でもBERTが適用されたとはいえ、実際にそれが浸透し、日本語の理解が進み、検索結果に反映されるにはまだ時間がかかると予想しています。

これまで以上にユーザーに役立つコンテンツ制作を


今回は『BERT』アップデートが日本でも適用されたニュースをお届けしました。

ここまでお伝えしてきたように、BERTだからといって必要以上に意識したり特別な対策が必要になるわけではありません。

実際にBERTの影響が出るのはまだ先になるでしょう。


またBERTが実際に浸透し、自然言語検索での検索結果の改善がすすめばそれはチャンスともなり得ます。

これまで理解できなかった検索フレーズをより精度高く理解し、適切な検索結果を反映してくれる…ということは、これまで取りこぼしてたユーザーにアプローチできる可能性が高くなるということです。

ユーザーの検索意図に沿った、ユーザーにとって価値のある真っ当なコンテンツを作っている人にとっては歓迎されるアップデートでしょう。

ビジネスで勝てる!ホームページ制作