フィンランドのエスポーという街をご存知だろうか。フィンランド人でなければ知らないかもしれない。エスポー市はフィンランド南部の人口314,000人の都市で、おそらく国際的にはアールト大学で最も有名でしょう。

しかし、もしあなたが3D LiDARモデルに基づくディープラーニングを研究している研究者なら、この街、少なくとも10km2の街と親しくなれるかもしれない。

それは、最近発表されたExtended Classification of LiDAR for AI Recognitionデータセット(別名ECLAIR)のおかげだ。

エクレール・フィリング

ECLAIRは、フィンランド・エスポー市の 10km2以上の連続したエリアをカバーするオープンソースのデータセットで、長距離高精度LiDARによって取得された5億点以上のポイントで構成されている。

ヘリスコープを使ってヘリコプターで空撮されたデータは、送電線に焦点が当てられ、その結果、点群ネットワークが形成された。このデータセットは、点ごとのセマンティック・アノテーションで補強されている。つまり、ECLAIRは、対象地域の送電線ネットワークの忠実度が高く、データが豊富なデジタル・ツインなのである。

エクレールの数は決して十分ではない

人工知能(AI)に少しでも興味のある人なら、近年の開発の広さとスピードに驚嘆したことだろう。「Chat GPT」や「LaMDA」などは、有名ではないにせよ、ホットなビジネス・バズワードとなった。

しかし、このような進歩は主に大規模言語モデル(LLM)の分野に限られており、その成功は、研究コミュニティが学習用に利用できる多種多様で広範なデータセットに少なからず起因している。

3D視覚・空間データ(特に3D LiDAR)に関しては、同じような広範なデータセットは利用できなかった。例えば、LLaMAモデル(MetaのLLM)で使用されているCommonCrawlデータセットは、約6ペタバイトに及ぶ。これとは対照的に、DALESデータセットは、10km2のエリアにわたる40の航空LiDARシーンを含み、わずか数ギガバイトです。 

これは、DALESのようなデータセットが研究コミュニティにとって非常に貴重なツールであることを批判しているのではなく、LLMコミュニティの研究者が利用できるものと、3D LiDARを扱う研究者との間に格差があることを指摘しているのである。これはある程度理解できる。航空スキャニングを行うにはコストと労力がかかるし、地上スキャニングでさえ、純粋に言語ベースのデータセットを組み立てるよりもコストがかかる。将来的には、無人航空機(UAV/ドローン)によるデータ収集がデータ取得のコスト削減に役立つかもしれないが、今日、他のディープラーニング分野に比べて利用可能なデータが少ないという事実は変わらない。

研究とイノベーションが継続し、加速するためには、より多く、より豊富なデータセットが必要である。

世界にもっとエクレアが必要な理由

なぜそれが重要なのか?屋外の3Dシーンの理解は、自律走行からロボット工学、拡張現実や仮想現実まで、コンピュータビジョンの多くの用途に不可欠です。Sharper Shapeでは、このようなデータを利用して、送電線検査やユーティリティ管理の進歩を推進しています。同様に、同様のアプローチは、道路や橋などのインフラを開発する都市計画者や、建物の詳細な注釈付き点群を使用して既存の構造を特定し、都市の密度を理解し、それに応じて新しい開発を計画するためにも適用できます。

さらに一歩先の未来では、洪水や山火事などの自然災害に対する重要なインフラの回復力を理解し、開発するために、あるいは植生や都市の緑地をより詳細に理解し、保全活動を強化するために、当局がこのようなデータセットを利用することが想像できる。

同様に、ECLAIRのようなデータセットは、モノのインターネット(IoT)デバイスや都市管理システムと統合され、交通の流れからごみ収集まで、都市の機能やサービスを最適化することができる。スマートシティ」はここ数年、魅力的なコンセプトであったが、それを実現できるのは、大規模なデータセットで訓練されたAIである。

都市の高密度化と気候変動リスクの緩和・適応の必要性を背景に、このような航空3D LiDARデータセットに適用されるディープラーニングモデルには、豊富な可能性がある。地上で撮影された3D LiDARや衛星航空画像などの補完的なデータセットと組み合わせることで、これらはさらに強力なツールとなるかもしれない。

これらのユースケースはすべて、実世界のシナリオに正確に汎化できるAIツールの開発に依存している。これは、革新的なディープラーニングモデルの実験と訓練に使用できる、大規模で豊富なデータセットの利用可能性に依存する。

それが抽象的に思えるなら、2001年6月10日、Google Earthが発表されたときのことを思い出してほしい。標準的なPCだけで、全世界の正確なモデルを探索できることに驚き、このプログラムが興奮をもって迎えられたことを覚えているだろうか。理論的には、3D LiDARは、研究者、開発者、探検家のためのサンドボックスとツールボックスを作成し、世界の完全な3D、豊富な注釈付きデジタルツインにそれを強化することができます。今日、私たちはフィンランドのエスポーから始めることができる。

ECLAIRデータセットはGitHubのこちら[LINK]にある。より詳細な情報は論文をご覧ください:ECLAIR: A High-Fidelity Aerial LiDAR Dataset for Semantic Segmentation(ECLAIR:セマンティック・セグメンテーションのための高忠実度空中LiDARデータセット)をSharper Shapeのウェブサイトでご覧ください。

Sharper Shape、テック・リード、アナンド・ウマシャンカー 記