ある研修で、データ種別ごとに適した保存先と分析手法を整理するため、社内で扱うデータを構造化・半構造化・非構造化に分類しています。次のうち、非構造化データに当てはまるものを 2 つ選んでください。

1 / 1
複数選択してください
正解C, E

解説

非構造化データの例を 2 つ選ぶ問題。

  • 1非構造化データに当てはまるもの決まった構造(スキーマ)を持たない データを選ぶ
  • 2当てはまるものを 2 つ画像・自由文 が該当。表形式 CSV/RDB・JSON は除外
A不正解

列ごとに型が決まった売上の CSV

列ごとに型が固定された表形式の CSV は構造化データです。

決まった構造を持つため、非構造化データの例ではなく不正解です。

B不正解

タグ付きの JSON ログ

タグ/キーを持つ JSON は半構造化データです。

一定の構造を持つため、非構造化データの例ではなく不正解です。

C正解

監視カメラの画像

正解。画像は、行と列やタグのような決まった構造を持たない非構造化データの典型例です。

D不正解

RDB のテーブルに入った顧客マスタ

リレーショナルデータベースの表に入ったデータは、固定スキーマを持つ構造化データです。

決まった構造を持つため、非構造化データの例ではなく不正解です。

E正解

顧客が書いた自由形式のレビュー文

正解。自由形式のテキストは、決まったスキーマを持たない非構造化データの典型例です。文章そのものを解析するには NLP が必要です。

ポイント

非構造化データの見分け方を押さえます。
非構造化: 決まった構造なし → 画像・動画・音声・自由形式テキスト。
構造化: 列の型が固定の表(CSV、RDB)。
半構造化: タグ/キーはあるが固定スキーマなし(JSON、XML)。
『画像』『自由文』は非構造化、『表形式』は構造化、『JSON/XML』は半構造化、と即断します。