A不正解
列ごとに型が決まった売上の CSV
列ごとに型が固定された表形式の CSV は構造化データです。
決まった構造を持つため、非構造化データの例ではなく不正解です。
ある研修で、データ種別ごとに適した保存先と分析手法を整理するため、社内で扱うデータを構造化・半構造化・非構造化に分類しています。次のうち、非構造化データに当てはまるものを 2 つ選んでください。
非構造化データの例を 2 つ選ぶ問題。
列ごとに型が決まった売上の CSV
列ごとに型が固定された表形式の CSV は構造化データです。
決まった構造を持つため、非構造化データの例ではなく不正解です。
タグ付きの JSON ログ
タグ/キーを持つ JSON は半構造化データです。
一定の構造を持つため、非構造化データの例ではなく不正解です。
監視カメラの画像
正解。画像は、行と列やタグのような決まった構造を持たない非構造化データの典型例です。
RDB のテーブルに入った顧客マスタ
リレーショナルデータベースの表に入ったデータは、固定スキーマを持つ構造化データです。
決まった構造を持つため、非構造化データの例ではなく不正解です。
顧客が書いた自由形式のレビュー文
正解。自由形式のテキストは、決まったスキーマを持たない非構造化データの典型例です。文章そのものを解析するには NLP が必要です。
非構造化データの見分け方を押さえます。
・非構造化: 決まった構造なし → 画像・動画・音声・自由形式テキスト。
・構造化: 列の型が固定の表(CSV、RDB)。
・半構造化: タグ/キーはあるが固定スキーマなし(JSON、XML)。
『画像』『自由文』は非構造化、『表形式』は構造化、『JSON/XML』は半構造化、と即断します。