デジタルへの移行を加速化するストラドビジョン、 データパイプライン自動化システム構築
2024年8月6日— AIを基にする映像認識ソフトウェアSVNetを開発するスタートアップ、ストラドビジョン(CEO 金ジュナン)が、デジタルへの移行を加速化するために、データパイプライン自動化システムを構築したことを明らかにした。
データパイプラインっていうのは、様々なデータソースから集めたものを、分析しやすい形態に変換し、データウェアハウス*に格納する処理過程を意味する。データパイプラインは、通常ETL(抽出:Extracting、変換:Transforming、格納:Loading)の過程で行われる。SVNetの場合、比較的に複雑度が高く、木目細かいデータを用いて学習するため、ETL過程を複数の段階に分けた。このため、全体の流れがややこしくて時間がかかる。
データウェアハウス*:様々なオペレーティングシステムから抽出、変換、統合、管理されるデータベース
しかし、データ品質がSVNetのパフォーマンスに大きな影響を与えるため、性能向上を狙って自動化を選択した。ストラドビジョンが構築したデータパイプライン自動化システムは、三つの段階として、前処理、品質、効率パイプラインである。パイプラインは、SVNet性能の向上ができる高品質のデータをすばやく確保するために、クラスタサーバーをベースに並列処理を行い、すべてのデータはデータセンターで加工される。データセンターは、ストラドビジョンで独自開発したデータウェアハウスとして、データ中央化の中心的な役割を果たしている。データパイプラインのデータフロー(Data Flow)を制御し、社内のすべてのメンバーが同じインターフェイスでデータアクセスができる。
データパイプライン自動化システム構築がもたらしたのは、誤差を減らし、生産性を高め、コスト削減である。顧客は、この背景で迅速・正確・信頼の高いSVNetを用いられる。
ストラドビジョンのJack Sim CTOは、「顧客に迅速、かつ、安定したサービスを提供するために、デジタルへの移行を加速している。これの一環としてデータパイプライン自動化システムを構築した。」とし、「今後も、継続的なプロセス自動化による、運営コストの削減とリソース活用の最適化など、顧客に、より良いサービス提供に全力を尽くす。」と伝えた。