ある企業のデータレイクには複数形式のデータが保管されています。その中の売上データは、年・月・売上高の列を持つ表形式の CSV で、列ごとに型が決まっており、SQL でそのまま集計できます。このデータの種別はどれですか。

1 / 1
回答を選択してください
正解B

解説

表形式で型が決まったデータの種別を選ぶ問題。

  • 1年・月・売上高の列を持つ表形式の CSV行と列で整理された 表形式 のデータ
  • 2列ごとに型が決まっており固定スキーマ を持つ=構造化データ
A不正解

半構造化データ

半構造化データは、タグやキーで階層を表すが厳密な固定スキーマを持たない JSON/XML のようなデータです。

本問は列ごとに型が固定された表形式であり、固定スキーマを持つ構造化データのため不正解です。

B正解

構造化データ

正解。構造化データは、行と列で整理され、列ごとに型(スキーマ)が決まっているデータです。表形式の CSV やリレーショナルデータベースの表が典型例で、クエリや集計がしやすいのが特徴です。

C不正解

非構造化データ

非構造化データは、画像・動画・自由文のように決まった構造を持たないデータです。

本問は列と型が決まった表形式であり、構造が明確なため不正解です。

D不正解

時系列データ

時系列データは、時刻順に並んだ観測値で、傾向や周期の分析に使うデータの用途的な分類です。本問は月別の売上を含み時系列的な側面はありますが、設問が問うのは構造の有無(構造化/半構造化/非構造化)です。列と型が固定された表形式であることを最も的確に表すのは構造化データのため不正解です。

ポイント

正解の『構造化データ』の見分け方を押さえます。
構造化: 行と列・列ごとに型が固定(表形式 CSV、RDB の表)。SQL で集計しやすい。
半構造化: タグ/キーはあるが固定スキーマなし(JSON、XML)。
非構造化: 決まった構造なし(画像、動画、自由文)。
『表形式+列の型が決まっている』なら構造化データです。