The Sound of Cadence

車載、AR/VR、モバイル、監視カメラの市場に向け、ビジョン、AI処理のパフォーマンスを２倍高速化したVision Q7 DSP

はじめに

今年5月、Tensilica® Vision DSP製品群を拡張し、最大1.82 TOPS (tera operations per second) のパフォーマンスを提供する新製品Cadence® Tensilica Vision Q7 DSPについて発表しました。組み込み向けビジョン、AIアプリケーションにおいてますます高まる演算要求に対応するために、Vision Q7 DSPは、前世代の製品Vision Q6 DSPと同じ面積で比較して２倍のAIおよび浮動小数点演算パフォーマンスを提供します。Vision Q7 DSPは、車載、ロボット、ドローン、モバイルなどの市場で広く使われているSLAM（simultaneous localization and mapping）アルゴリズムに特化して最適化されており、未知の環境のマップを自動で生成、修正すると共に、AR/VRなどに向けてはインサイドアウトなトラッキングをサポートします。

市場のトレンドと要求

図1：イメージセンサーの需要

エッジ側のアプリケーションにおいてイメージセンサーに対する需要はますます高まっており、組み込み向けビジョン市場の成長を牽引しています（図1）。今日のビジョン向けアプリケーションにおいては、ビジョンとAIの処理を合わせて行うことが求められており、エッジ向けSoCの開発においては極めて柔軟性が高く、高速で低消費電力のビジョン、AIソリューションが必要となります。さらに、イメージングカメラなどのエッジ側のアプリケーションにおいてもAI処理の前にプリあるいはポストプロセッシングを実行するためのビジョン向けDSPが求められます（図2）。

図2：イメージ処理パイプラインでのVision DSPの役割

またSLAMアルゴリズムの実行と共に、エッジ側のSoCにはパフォーマンスの向上およびレーテンシーの低減が求められ、さらにバッテリー駆動のデバイスに対しては消費電力を更に削減するためのオフロード演算エンジンも必要になります。SLAMアルゴリズムにおいては、必要な精度を達成するために固定小数点、浮動小数点演算を共に活用するので、SLAMに対応するビジョンDSPは両方のデータタイプに対してさらに高いパフォーマンスを提供することが求められます（図3）。

図3：エッジアプリケーションでのSLAM等に対する高パフォーマンス要求

Vision Q7 DSPのアーキテクチャとパフォーマンス

消費電力、アーキテクチャ、命令セットに関する改良により、Vision Q7 DSPは難度の高いエッジ向けビジョン、AI処理に最適なソリューションであり、下記のような重要な指標に対するパフォーマンスを向上しています。

VLIW (very long instruction word) SIMDアーキテクチャにより、Vision Q6 DSPと同面積で比較して最大1.7倍のTOPSを提供（図4）
8/16/32-bitデータタイプ、および単精度、半精度に対応するVFPUオプションをサポートする命令セットの強化によって、Vision Q6やVision P6 DSPに比べてSLAMカーネルに対する処理が2倍高速化（図5）
半精度（FP16）、単精度（FP32）に対するFLOPS/mm2（floating-point operations per mm2）が、Vision Q6、Vision P6 DSPに比べて2倍向上（図4）
Vision Q6と同面積で比較してAI処理のパフォーマンスが最大2倍向上したことにより、GMAC/mm2も2倍向上（図4）

図4：Vision Q7のパフォーマンス向上（Vision Q6比）

図5：Vision Q7のAI/SLAMカーネルのパフォーマンス向上

256 MACをサポートしていた全世代のVision Q6 DSPに対してVision Q7 DSPは512 8-bit MAC をサポートしており、AIアプリケーションに対して柔軟性の高いソリューションを提供します。また、推論専用のアクセラレーターTensilica DNA 100と併用することで、さらにAI処理のパフォーマンスを向上させることも可能です。さらに、Vision Q7 DSPにおいては、３D DMA、コンプレッション、256-bit AXIインターフェースなどiDMAに関する様々な強化が行われています。Vision Q7 DSPは、Vision Q6 DSPとの上位互換性が保たれており、既存のソフトウェアの再利用が可能で、Vision Q6 やVision P6 DSPから容易に移行することができます。

図6：Vision Q7の主なエンハンスメント

Vision Q7 DSPは、Tensilica Xtensa® Neural Network Compiler (XNNC)を通じてCaffe、 TensorFlow、TensorFlowLite等のフレームワークで開発されたAIアプリケーションサポートをしています。XNNCは、ニューラルネットワークをVision Q7 DSP向けに高度に最適化されたハイパフォーマンスなコードにマッピングします。また、Vision Q7 DSPは、Android対応デバイスのオンデバイスAIの高速化に対応するAndroid Neural Network (ANN) APIもサポートしています。

図7：AIソフトウェアプラットフォーム

また、ソフトウェア環境としては、1,700以上のOpenCVベースのコンピュータ・ビジョン関数が完全かつ最適な形でサポートされており、既存のコンピュータ・ビジョンアプリケーションのハイレベルな移行を迅速に行うことができます。さらに、すべての開発ツールおよびライブラリは、SoCベンダーがISO2626 ASIL D (automotive safety integrity level D)に準拠できるように開発されています。

図8：ソフトウェア開発環境とライブラリ

Vision Q7 DSPは先行顧客において試用されており、2019年６月に一般リリースを完了しています。

７月19日開催、CDNLive Japan 2019のセッション（11:20-12:00 E-1）、デモにおいても Vision Q7 DSPをご紹介します。是非、ご来場ください。

テンシリカIP
松岡　祐介

Latest Issue

Volume 30, July 2019

Products

Products

AI

Products

IC設計／検証

Products

システム設計／解析

Solutions

Industries

Services

TECHNOLOGIES

サポート

サポート

トレーニング

会社案内

CORPORATE

Culture and Careers

Media Center

車載、AR/VR、モバイル、監視カメラの市場に向け、ビジョン、AI処理のパフォーマンスを２倍高速化したVision Q7 DSP

はじめに

市場のトレンドと要求

Vision Q7 DSPのアーキテクチャとパフォーマンス