2021年02月10日
グーグル・リサーチ: 機械学習の他分野への応用 2021年1月12日E
機械学習の他分野への応用
機械学習は、科学の多くの分野での進歩を支援する上で不可欠であることが証明され続けています。2020年には、HHMI Janelia Research CampusのFlyEMチームと共同で、脳組織の高解像度電子顕微鏡イメージングに適用された大規模な機械学習モデルを用いて再構築された、脳の接続性の大規模なシナプス解像度マップであるショウジョウバエのヘミブレイン・コネクトームを公開しました。このコネクトーム情報は、神経科学者の様々な研究を助け、脳がどのように機能しているかの理解を深めるのに役立ちます。とても格好良いインタラクティブな3D UIをぜひご覧ください!
システム生物学の問題への機械学習の応用も増えてきています。グーグルのAccelerated Science(加速科学)チームは、Calico の同僚と共同で、酵母に機械学習を適用して、遺伝子がシステム全体としてどのように機能しているかをよりよく理解できるようにしています。また、DNAやタンパク質のような生物学的配列を設計するためにモデルベースの強化学習を利用して、医療や工業用途に望ましい特性を持つものを設計する方法も研究しています。モデルベースの強化学習は、サンプルの効率を向上させるために使用されます。実験の各ラウンドでは、前のラウンドの機能測定値にフィットしたシミュレータを使用して、オフラインでポリシーを学習します。DNA転写因子結合部位の設計、抗菌性タンパク質の設計、タンパク質構造に基づいたイジング模型のエネルギーの最適化などの様々なタスクにおいて、モデルベース強化学習が既存の手法の魅力的な代替手段であることがわかります。
また、X-Chem Pharmaceuticals社およびZebiAI社と共同で、有望な分子化合物のバーチャル・スクリーニングを計算機的に行う機械学習技術の開発も行っています。これまでのこの分野の研究では、比較的小さな関連化合物の集合に焦点を当ててきましたが、本研究では、DNAでコード化された低分子ライブラリを用いて、化学空間の広い範囲での「ヒット」を一般化し、アイデアから実用的な医薬品へと発展させるための、時間のかかる物理的なラボ作業を減らすことができるようにしていきたいと考えています。
また、機械学習をコアとなるコンピュータ・サイエンスやコンピュータ・システムの問題に応用することにも成功しており、MLSys(機械学習とシステム)のような新しいカンファレンスが生まれつつある傾向が強まっています。「Learning-based Memory Allocation for C++ Server Workloads (C++サーバ・ワークロードのための学習ベースのメモリ割り当て)」では、ニューラル・ネットワーク・ベースの言語モデルが、コンテキスト依存の割り当てごとのサイト・オブジェクトのライフサイクル情報を予測し、これを利用してヒープを整理してフラグメンテーションを減らします。このモデルは、巨大なページ(TLBの動作に適している)のみを使用しながら、フラグメンテーションを最大78%削減することができます。「End-to-End, Transferable Deep RL for Graph Optimization(グラフ最適化のためのエンドツーエンドの移転可能な深層強化学習)」では、計算グラフ最適化のためのエンドツーエンドの移転可能な深層強化学習手法を説明し、TensorFlowのデフォルト最適化と比較して、3つのグラフ最適化タスクで33%〜60%の高速化を示し、以前の計算グラフ最適化手法と比較して15倍の収束を示しました。
「深層強化学習を用いたチップ設計」でも述べられているように、私達はコンピュータのチップ設計における配置配線の問題にも強化学習を適用しています。これは通常、非常に時間と労力のかかるプロセスであり、チップのアイデアから実際に完全に設計されたチップが製造されるまでに時間がかかる大きな理由となっています。従来の手法とは異なり、私達のアプローチは過去の経験から学び、時間をかけて改善していく能力を持っています。特に、より多くのチップ・ブロックを学習することで、これまで見えなかったチップ・ブロックの最適な配置を迅速に生成することができるようになります。このシステムは通常、人間のチップ設計の専門家よりも優れた配置を生成することができ、私達はこのシステム(TPU上で動作)を使用して、将来の世代のTPUの大部分の配置とレイアウトを行っています。「Menger」は大規模な分散型強化学習のために最近構築したインフラストラクチャで、チップ設計のような難しい強化学習タスクに対して有望な性能を発揮しています。
オープンソースのRISC-Vプロセッサである「Ariane」のマクロ配置。左側は、ポリシーをゼロからトレーニングし、右側は、事前にトレーニングしたポリシーをこのチップ用に微調整しています。各長方形は個々のマクロ配置を表しています。ゼロからの学習で発見された非マクロ・ロジックセルが占める空洞が、事前学習済みポリシーの配置では最初から存在していることに注目してください。
英語原文はこちら
https://ai.googleblog.com/2021/01/google-research-looking-back-at-2020.html
機械学習は、科学の多くの分野での進歩を支援する上で不可欠であることが証明され続けています。2020年には、HHMI Janelia Research CampusのFlyEMチームと共同で、脳組織の高解像度電子顕微鏡イメージングに適用された大規模な機械学習モデルを用いて再構築された、脳の接続性の大規模なシナプス解像度マップであるショウジョウバエのヘミブレイン・コネクトームを公開しました。このコネクトーム情報は、神経科学者の様々な研究を助け、脳がどのように機能しているかの理解を深めるのに役立ちます。とても格好良いインタラクティブな3D UIをぜひご覧ください!
システム生物学の問題への機械学習の応用も増えてきています。グーグルのAccelerated Science(加速科学)チームは、Calico の同僚と共同で、酵母に機械学習を適用して、遺伝子がシステム全体としてどのように機能しているかをよりよく理解できるようにしています。また、DNAやタンパク質のような生物学的配列を設計するためにモデルベースの強化学習を利用して、医療や工業用途に望ましい特性を持つものを設計する方法も研究しています。モデルベースの強化学習は、サンプルの効率を向上させるために使用されます。実験の各ラウンドでは、前のラウンドの機能測定値にフィットしたシミュレータを使用して、オフラインでポリシーを学習します。DNA転写因子結合部位の設計、抗菌性タンパク質の設計、タンパク質構造に基づいたイジング模型のエネルギーの最適化などの様々なタスクにおいて、モデルベース強化学習が既存の手法の魅力的な代替手段であることがわかります。
また、X-Chem Pharmaceuticals社およびZebiAI社と共同で、有望な分子化合物のバーチャル・スクリーニングを計算機的に行う機械学習技術の開発も行っています。これまでのこの分野の研究では、比較的小さな関連化合物の集合に焦点を当ててきましたが、本研究では、DNAでコード化された低分子ライブラリを用いて、化学空間の広い範囲での「ヒット」を一般化し、アイデアから実用的な医薬品へと発展させるための、時間のかかる物理的なラボ作業を減らすことができるようにしていきたいと考えています。
また、機械学習をコアとなるコンピュータ・サイエンスやコンピュータ・システムの問題に応用することにも成功しており、MLSys(機械学習とシステム)のような新しいカンファレンスが生まれつつある傾向が強まっています。「Learning-based Memory Allocation for C++ Server Workloads (C++サーバ・ワークロードのための学習ベースのメモリ割り当て)」では、ニューラル・ネットワーク・ベースの言語モデルが、コンテキスト依存の割り当てごとのサイト・オブジェクトのライフサイクル情報を予測し、これを利用してヒープを整理してフラグメンテーションを減らします。このモデルは、巨大なページ(TLBの動作に適している)のみを使用しながら、フラグメンテーションを最大78%削減することができます。「End-to-End, Transferable Deep RL for Graph Optimization(グラフ最適化のためのエンドツーエンドの移転可能な深層強化学習)」では、計算グラフ最適化のためのエンドツーエンドの移転可能な深層強化学習手法を説明し、TensorFlowのデフォルト最適化と比較して、3つのグラフ最適化タスクで33%〜60%の高速化を示し、以前の計算グラフ最適化手法と比較して15倍の収束を示しました。
「深層強化学習を用いたチップ設計」でも述べられているように、私達はコンピュータのチップ設計における配置配線の問題にも強化学習を適用しています。これは通常、非常に時間と労力のかかるプロセスであり、チップのアイデアから実際に完全に設計されたチップが製造されるまでに時間がかかる大きな理由となっています。従来の手法とは異なり、私達のアプローチは過去の経験から学び、時間をかけて改善していく能力を持っています。特に、より多くのチップ・ブロックを学習することで、これまで見えなかったチップ・ブロックの最適な配置を迅速に生成することができるようになります。このシステムは通常、人間のチップ設計の専門家よりも優れた配置を生成することができ、私達はこのシステム(TPU上で動作)を使用して、将来の世代のTPUの大部分の配置とレイアウトを行っています。「Menger」は大規模な分散型強化学習のために最近構築したインフラストラクチャで、チップ設計のような難しい強化学習タスクに対して有望な性能を発揮しています。
オープンソースのRISC-Vプロセッサである「Ariane」のマクロ配置。左側は、ポリシーをゼロからトレーニングし、右側は、事前にトレーニングしたポリシーをこのチップ用に微調整しています。各長方形は個々のマクロ配置を表しています。ゼロからの学習で発見された非マクロ・ロジックセルが占める空洞が、事前学習済みポリシーの配置では最初から存在していることに注目してください。
英語原文はこちら
https://ai.googleblog.com/2021/01/google-research-looking-back-at-2020.html
【このカテゴリーの最新記事】
-
no image
-
no image
-
no image
-
no image
-
no image
この記事へのコメント
コメントを書く
この記事へのトラックバックURL
https://fanblogs.jp/tb/10529640
※ブログオーナーが承認したトラックバックのみ表示されます。
この記事へのトラックバック