ある企業が、社内文書の下書きや要約を任せるため、大量のテキストで事前学習され、人間のような自然な文章を生成できる大規模なモデルの導入を検討しています。このモデルを指す略称はどれですか。

1 / 1
回答を選択してください
正解A

解説

言語を生成する大規模モデルの略称を選ぶ問題。

  • 1大量のテキストで事前学習されテキストの大規模学習で言語能力を獲得
  • 2自然な文章を生成できる大規模なモデル= LLM(大規模言語モデル)
A正解

LLM

正解。LLM(大規模言語モデル, Large Language Model)は、大量のテキストで学習し、文脈に沿った自然な文章を生成できる大規模な言語モデルです。要約・翻訳・チャットなど幅広い言語タスクに使われます。

B不正解

CNN

CNN(畳み込みニューラルネットワーク)は、画像の局所的な特徴を捉えるのが得意で、主に画像認識に使われるニューラルネットワークです(例: 写真に写った製品のカテゴリ分類、医療画像からの病変検出)。

大量テキストで言語を生成する大規模モデルを指す略称ではないため不正解です。

C不正解

SLM

SLM(小規模言語モデル)は、パラメータ数を抑えた軽量な言語モデルの略称で、エッジ環境や低コスト運用に向きます。

自然な文章の生成はできますが、本問が問うのは『大規模な』モデルの略称のため不正解です。

D不正解

RNN

RNN(再帰型ニューラルネットワーク)は、前の出力を次の入力に渡しながら系列データを逐次処理するニューラルネットワークの構造の略称です(例: 時系列の売上予測、文章の次単語予測などの初期手法)。

アーキテクチャの名前であり、『大量のテキストで学習した大規模な言語モデル』という分類を指す略称ではないため不正解です。

ポイント

『大量のテキストで学習・自然な文章を生成・大規模』と来たら LLM(大規模言語モデル)。惜しい選択肢の SLM は同じ言語モデルでも『小規模・軽量』で、規模の条件で切り分けます。CNN(畳み込み)・RNN(再帰型)はネットワーク構造の略称で、モデル分類の呼称ではありません。