News

デジタルへの移行を加速化するストラドビジョン、 データパイプライン自動化システム構築

2024.08.06

2024年8月6日— AIを基にする映像認識ソフトウェアSVNetを開発するスタートアップ、ストラドビジョン(CEO 金ジュナン)が、デジタルへの移行を加速化するために、データパイプライン自動化システムを構築したことを明らかにした

 

データパイプラインっていうのは、様々なデータソースから集めたものを、分析しやすい形態に変換し、データウェアハウス*に格納する処理過程を意味する。データパイプラインは、通常ETL(抽出:Extracting、変換:Transforming、格納:Loading)の過程で行われる。SVNetの場合、比較的に複雑度が高く、木目細かいデータを用いて学習するため、ETL過程を複数の段階に分けた。このため、全体の流れがややこしくて時間がかかる。

データウェアハウス*:様々なオペレーティングシステムから抽出、変換、統合、管理されるデータベース

 

しかし、データ品質がSVNetのパフォーマンスに大きな影響を与えるため、性能向上を狙って自動化を選択した。ストラドビジョンが構築したデータパイプライン自動化システムは、三つの段階として、前処理、品質、効率パイプラインである。パイプラインは、SVNet性能の向上ができる高品質のデータをすばやく確保するために、クラスタサーバーをベースに並列処理を行い、すべてのデータはデータセンターで加工される。データセンターは、ストラドビジョンで独自開発したデータウェアハウスとして、データ中央化の中心的な役割を果たしている。データパイプラインのデータフロー(Data Flow)を制御し、社内のすべてのメンバーが同じインターフェイスでデータアクセスができる。

 

データパイプライン自動化システム構築がもたらしたのは、誤差を減らし、生産性を高め、コスト削減である。顧客は、この背景で迅速・正確・信頼の高いSVNetを用いられる。

 

  • データの前処理パイプライン:車両から集められたデータを学習用に変換する際、多くの企業が見過ごしているのが、データ同期(Synchronization)と歪み(Skew)である。ライダー、DGPS、レーダー、CANなどの車両センサーデータとカメラからの映像データは、ハードウェア特性によって遅延(Latency)と歪みが発生する。これがもたらした誤差がデータの品質に大きな影響を与える。
    ストラドビジョンは、この問題におけるデータ補正技術を開発し、データ品質を大幅に改善した。この過程で手作業を最小限に抑えるために、自動化されたパイプラインを構築し、データ品質向上とコスト削減目標を達成した。

 

  • データの品質パイプライン:デタの前理パイプラインから抽出されたオブジェクトは、SVNetで認識できるように学習用として使用される。最近、多くのAI企業がデータの量よりデータの質に重みを置く傾向がある。従来は、学習効果を高めるためにデータの量を増やしてきたが、最近、品質を高めたデータを採用したら、同量のデータでも性能向上につながることがわかった。SVNet性能の画期的な向上を狙ってデータ品質パイプラインを導入した。その後、誤差の把握と修正がしやすくなり、データの質を高めることとなった。データ品質パイプラインは、同じデータの量でもノイズを減らし、認識率の改善ができ、AIモデル性能の向上ができた。

 

  • データの効率パイプライン:ストラドビジョンは、デタの率パイプラインによりSVNet学習に必要なデータ生成作業コストを下げ、品質を高めた。AI学習に用いられるデータは、主に手作業で生成されるが、作業者の投入時間と熟練度によってコストと品質が決まるケースが多い。ストラドビジョンは、この問題に着目してAIモデルを開発した。このAIモデルは、データ生成に時間がかかる作業を自動的に分析し、作業者とコラボレーションができる。AIモデルとのコラボレーションによって作業時間の短縮、コストの削減、それぞれの作業者からの結果物において均一品質を持たせることができた。また、AIモデルは継続的に再学習し、リアルタイム更新によって作業者のデータ生成作業もサポートする。

 

ストラドビジョンのJack Sim CTOは、「顧客に迅速、かつ、安定したサービスを提供するために、デジタルへの移行を加速している。これの一環としてデータパイプライン自動化システムを構築した。」とし、「今後も、継続的なプロセス自動化による、運営コストの削減とリソース活用の最適化など、顧客に、より良いサービス提供に全力を尽くす。」と伝えた。