ある企業のアプリケーションが、リクエストごとに項目構成が変わるイベントログを出力しています。ログはタグやキーで階層を表すものの、列ごとの厳密な固定スキーマは持たない JSON 形式です。このデータの種別はどれですか。

1 / 1
回答を選択してください
正解D

解説

タグはあるが固定スキーマのない JSON のデータ種別を選ぶ問題。

  • 1タグやキーで階層を表す要素を区切る タグ/キー がある=完全な非構造化ではない
  • 2厳密な固定スキーマは持たない JSON 形式表のような固定スキーマがない=半構造化データ
A不正解

構造化データ

構造化データは、列ごとに型が固定された表形式(CSV や RDB の表)です。

本問は固定スキーマを持たない JSON であり、厳密な表構造ではないため不正解です。

B不正解

非構造化データ

非構造化データは、画像・動画・自由文のように決まった構造を持たないデータです。

本問はタグ/キーで要素が区切られた JSON であり、一定の構造を持つため不正解です。

C不正解

ラベル付きデータ

ラベル付きデータは、各データに正解(ラベル)が付いているかどうかという学習用の区分です。

本問はデータの構造の種別(構造化/半構造化/非構造化)を問うており、ラベルの有無とは観点が違うため不正解です。

D正解

半構造化データ

正解。半構造化データは、タグやキーで階層・要素を表すが、表のような厳密な固定スキーマは持たないデータです。JSON や XML が典型例で、構造化と非構造化の中間に位置します。

ポイント

正解の『半構造化データ』の見分け方を押さえます。
半構造化: タグ/キーで階層はあるが固定スキーマなし(JSON、XML)。構造化と非構造化の中間。
構造化: 列の型が固定された表(CSV/RDB)。
非構造化: 構造なし(画像/動画/自由文)。
『JSON/XML・タグはあるがスキーマは緩い』なら半構造化です。