A不正解
構造化データ
構造化データは、列ごとに型が固定された表形式(CSV や RDB の表)です。
本問は固定スキーマを持たない JSON であり、厳密な表構造ではないため不正解です。
ある企業のアプリケーションが、リクエストごとに項目構成が変わるイベントログを出力しています。ログはタグやキーで階層を表すものの、列ごとの厳密な固定スキーマは持たない JSON 形式です。このデータの種別はどれですか。
タグはあるが固定スキーマのない JSON のデータ種別を選ぶ問題。
構造化データ
構造化データは、列ごとに型が固定された表形式(CSV や RDB の表)です。
本問は固定スキーマを持たない JSON であり、厳密な表構造ではないため不正解です。
非構造化データ
非構造化データは、画像・動画・自由文のように決まった構造を持たないデータです。
本問はタグ/キーで要素が区切られた JSON であり、一定の構造を持つため不正解です。
ラベル付きデータ
ラベル付きデータは、各データに正解(ラベル)が付いているかどうかという学習用の区分です。
本問はデータの構造の種別(構造化/半構造化/非構造化)を問うており、ラベルの有無とは観点が違うため不正解です。
半構造化データ
正解。半構造化データは、タグやキーで階層・要素を表すが、表のような厳密な固定スキーマは持たないデータです。JSON や XML が典型例で、構造化と非構造化の中間に位置します。
正解の『半構造化データ』の見分け方を押さえます。
・半構造化: タグ/キーで階層はあるが固定スキーマなし(JSON、XML)。構造化と非構造化の中間。
・構造化: 列の型が固定された表(CSV/RDB)。
・非構造化: 構造なし(画像/動画/自由文)。
『JSON/XML・タグはあるがスキーマは緩い』なら半構造化です。