A不正解
半構造化データ
半構造化データは、タグやキーで階層を表すが厳密な固定スキーマを持たない JSON/XML のようなデータです。
本問は列ごとに型が固定された表形式であり、固定スキーマを持つ構造化データのため不正解です。
ある企業のデータレイクには複数形式のデータが保管されています。その中の売上データは、年・月・売上高の列を持つ表形式の CSV で、列ごとに型が決まっており、SQL でそのまま集計できます。このデータの種別はどれですか。
表形式で型が決まったデータの種別を選ぶ問題。
半構造化データ
半構造化データは、タグやキーで階層を表すが厳密な固定スキーマを持たない JSON/XML のようなデータです。
本問は列ごとに型が固定された表形式であり、固定スキーマを持つ構造化データのため不正解です。
構造化データ
正解。構造化データは、行と列で整理され、列ごとに型(スキーマ)が決まっているデータです。表形式の CSV やリレーショナルデータベースの表が典型例で、クエリや集計がしやすいのが特徴です。
非構造化データ
非構造化データは、画像・動画・自由文のように決まった構造を持たないデータです。
本問は列と型が決まった表形式であり、構造が明確なため不正解です。
時系列データ
時系列データは、時刻順に並んだ観測値で、傾向や周期の分析に使うデータの用途的な分類です。本問は月別の売上を含み時系列的な側面はありますが、設問が問うのは構造の有無(構造化/半構造化/非構造化)です。列と型が固定された表形式であることを最も的確に表すのは構造化データのため不正解です。
正解の『構造化データ』の見分け方を押さえます。
・構造化: 行と列・列ごとに型が固定(表形式 CSV、RDB の表)。SQL で集計しやすい。
・半構造化: タグ/キーはあるが固定スキーマなし(JSON、XML)。
・非構造化: 決まった構造なし(画像、動画、自由文)。
『表形式+列の型が決まっている』なら構造化データです。