COLUMN
コラム
2024年08月20日
GPTからOpenELMまで。代表的な大規模言語モデルまとめ
カテゴリー:テクノロジー
タグ:AI, 生成AI, LLM
大規模言語モデル(LLM)は、自然言語処理(NLP)の分野で最も注目されている技術の一つです。LLMは大量のテキストデータを学習し、テキスト生成、翻訳、要約、質問応答などのタスクを行うことができます。
現在は学習量が大規模化しており、その提供元も大企業になってきています。そうしたLLMについて、幾つかの代表的なモデルを紹介します。
GPT
GPTは、OpenAIによって開発されたLLMファミリーになります。GPTはGenerative Pre-trained Transformerの略で、大量のテキストデータを学習し、テキスト生成に優れています。特に翻訳や要約などの自然言語処理において高い性能を発揮します。
T5
T5は、Googleによって開発されたLLMモデルのシリーズになります。初回のリリースが2019年で、最新リリースはT5Xになります。T5はText-to-Text Transfer Transformerの略で、テキストからテキストへの変換を行います。チャットボット、機械翻訳システム、テキスト要約ツール、コード生成、ロボット工学など、さまざまなアプリケーションに採用されています。
google-research/text-to-text-transfer-transformer
BERT
BERTはBidirectional Encoder Representations from Transformersの略で、2018年にGoogleより発表されたLLMモデルファミリーになります。Transformerを組み込むことで、文章を文頭・文末の双方向から学習し、より高いレベルで文章を解釈できるようになりました。
XLNet
XLNetはBERTの改良版として開発されたLLMです。340Mのパラメータを持ち、330億語で学習されたモデルで、2019年にApache License 2.0にて公開されています。BERTで用いられていたMasked Language Model(MLM)を改良し、Permutation Language Model(PLM)を採用しています。
[1906.08237] XLNet: Generalized Autoregressive Pretraining for Language Understanding
Llama
LlamaはMeta社の開発したLLMモデルになります。Llama2は、ChatGPT 3.5に匹敵するモデルと言われており、Llama3はさらに高い性能を誇ります。オープンソースなので、派生版モデルも数多くあります。
Gemini
Geminiは、Googleが開発したLLMモデルになります。Geminiは、GPT-4のライバルとして位置づけられています。モデルのサイズが複数用意されており、最小のGemini Nanoはスマートフォンへの搭載を想定しています。
Gemma
GemmaはGeminiをベースにしたLLMモデルになります。Gemmaはオープンモデルとしており、Gemmaをベースに独自のチューニングを行って専用AIエンジンを開発できます。商業利用も可能とのことです。
Google AI Gemma オープンモデル |Google for Developers | Google AI for Developers
OpenELM
OpenELMはAppleの発表したLLMです。最小のモデルは2.7億パラメータで、最大のモデルは30億パラメータを持ちます。最小のモデルはiPhoneへの搭載も可能です。iOS 18以降から搭載されるApple Intelligenceでも利用される可能性があります。
まとめ
LLMの多くは汎用的なものであり、これらのモデルをベースに独自のチューニングを行ったり、追加学習を行って特徴を持たせられます。日本語をさらに強化したり、医療分野や法律分野に特化させたりすることも可能です。
それぞれのモデルに特徴や強みがありますので、用途に合わせて選択してください。
- カテゴリー
- タグ
- システム運用 (16)
- TypeScript (1)
- WebAssembly (2)
- ウォーターフォール開発 (2)
- 業務システム (28)
- CSS (2)
- GraphQL (1)
- プログラミング (31)
- スタートアップ (11)
- Nexaweb (1)
- BaaS (10)
- データベース (5)
- SPA (2)
- 基本用語 (26)
- Case study (5)
- Keyword (10)
- FaaS (1)
- システム開発 (69)
- スクラム (1)
- フロントエンド (38)
- AI (26)
- アジャイル開発 (18)
- Supabase (1)
- イノベーション (5)
- Database (2)
- 月額制 (1)
- PaaS (3)
- ACF (1)
- BookReview (3)
- サービス開発 (5)
- React (3)
- Firebase (1)
- クラウドサービス (12)
- low-code (2)
- バックエンド (8)
- ナレッジマネジメント (1)
- ChatGPT (1)
- Vue.js (2)
- Tailwind CSS (1)
- DBaas (2)
- プロジェクト管理 (13)
- セミナー (2)
- Web (21)
- 失敗事例 (2)
- Hexabase_health (1)
- 生成AI (7)
- 受託開発 (1)
- Kubernetes (3)
- WebComponents (1)
- 通知 (1)
- API (6)
- Next.js (1)
- フレームワーク (3)
- ローコード開発 (4)
- ノーコード開発 (1)
- JavaScript (2)
- Hexabase (12)
- LLM (3)
- 画像生成 (1)
- DX (34)