Xilinx、ロープロ対応PCIe Gen4アクセラレータカード「Alveo U50」を発表

Xilinxは8月6日(米国時間)、同社のPCIeタイプアクセラレータカードの新製品として、「Alveo U50」を発表した。この発表に際し、同社のJamon Bowen氏(Photo01)よるAlveo U50の説明会が開催されたので、この内容をお届けしたいと思う。

Alveoそのものは昨年10月にまずU200とU250が発表されており、昨年11月にはAlveo U280も追加された。ただこれらの製品はいずれもPCIeのフルサイズ、ダブルスロット幅の製品であったが、今回発表されたAlveo U50はロープロファイルでシングルスロット幅に抑えられている(Photo02)。また消費電力が75W未満に抑えられているため、補助電源無しでカードエッジからの電源供給のみで稼働する点も大きいとする。

Photo03が今回発表されたAlveo U50を含むAlveoのラインナップ一覧である。恐らく構成から見て、Alveo U50はVirtex Ultrascale+ HBMの「XCVU33P」を搭載していると考えられる。

ちなみにU50、もしXCVU33Pが実装されているとすれば、100GbEを本来は2ポート搭載可能であるが、1ポートに抑えられているのは実装上の問題ではないかと思われる。もっとも「100GbEが1ポートだとStream的に使う事が出来ないのでは?」とBowen氏に確認したところ、「100GbEは実際には25GbE×4の構成になっているので、Ethernet Switchと組み合わせて、50GbE in/50GbE outとするような形でStream的な利用も可能」という話であった。

さて、Alveo U50を含めてのAlveo全体の話であるが、発表から半年強で膨大なソリューションスタックがすでに提供されており(Photo04,05)、実際Bowen氏によれば昨年10月時点との比較で言えばアプリケーション数が2倍、トレーニングを受講した開発者は4倍に膨れ上がっているとする。

ではAlveo U50ではどんな事が可能か? という実例もいくつか示された。まずはマシンラーニング(ML)を利用した音声翻訳(Photo06)で、こうしたものはエッジ(Edge)に近いところで利用されるため、エッジサーバに搭載しやすい事が重要で、その意味でもAlveo U50のコンパクトさと性能の高さが大きなポイントになるとする。

一方、データベース(DB)に対するQueryの高速化(Photo07)では、Xeon Platinum 8260比で4倍(Alveo U50×1)~13倍(Alveo U50×3)の性能改善が可能。

金融向けシミュレーションでもやはり20倍の効率改善(Photo08)を実現できるとし、同じ金融でも電子取引では市況データ入手から発注までを500ns未満で実現できるとしている(Photo09)。

またストレージの分野では、圧縮伸長や暗号化などの処理を、ほぼLine Speed(次の例で言えば10GB/sec)で実現可能としており、これの応用例としてHadoopを利用した場合、圧縮ストレージで利用できるので、ノード数削減やプロセッサ数削減にもつながる、としている(Photo11)。

ちなみにここまでの話は、別にAlveo U50でなく他のAlveoシリーズでも実現できる話であるが、恐らくAlveo U50が一番適しているのはNVMeoF(NVMe over Fiber)であろう(Photo12)。

先ほどもちょっと出てきた話だが、Alveo U50はロープロファイルのカードなので、ストレージ格納に利用される2Uのシャーシでも実装が容易である。

ここでAlveo U50にPCIe Switchを組み合わせる事で、複数枚のNVMe SSDを組み合わせて簡単にNVMeoFが構築できることになる。今回8月6日にこの製品を発表するのは、その8月6日から開催されるFlash Memory Summit 2019でこの製品の発表が行われるためだそうだ。実際Flash Memory Summit 2019ではSalil Raje氏(EVP&GM, Data Center Group)によるKeynoteも予定されているため、ここでAlveo U50が発表されるのではないかと思われる。

ところでちょっとPhoto02に戻るが、Alveo U50は(Alveo U280同様に)PCIe Gen4とCCIXをサポートする形になる。ただAlveo U50に搭載されるXCUV33Pにしても、Alveo U280に搭載されるXCUV35Pにしても、PCIeレーンはGen3 x16ないしGen4 x8という構成になっている。これについてBowen氏に確認したところ、「確かにPCIe Gen4だとx8だが、カードエッジにはこれが2組出てくる。つまりPCIe Gen4 x16ではなく、PCIe Gen4 x8+x8の構成で利用可能なので、帯域的にはx16と変わらない」という話であった。すでにAMDはPCIe Gen4 x16が利用可能な第3世代Ryzenの出荷を開始しており、間も無くサーバ向けにやはりPCIe Gen4 x16レーンを多数持つ第2世代EPYCを出荷予定とされる。Alveo U280や今回発表のAlveo U50は、この第2世代EPYCと組み合わせるのに最適なアクセラレータカード、という事になりそうだ。