今や当たり前の存在になってきている生成AI。さまざまな場面で活用が進んでいます。一方で、当たり前のように用語が飛び交うがために、ちゃんと意味を知らないままにしているものがあるのではないでしょうか?また、知っていることでより理解を深められるような用語もあります。もっとAIについて理解したい方、「今さらな……」という方向けに、生成AIに関連する用語をさまざまな分野からピックアップして解説します。
基本・概念に関する用語
AI(人工知能、Artificial Intelligence)
人間の脳が行っている認識、思考、学習といった能力・活動を、コンピュータに行わせる技術。データに基づいてパターンを学習し、それをもとにさまざまな要望に応えたり、問題を解決したりすることができます。
機械学習(Machine Learning, ML)
文字や数値、画像、音声といった学習データからパターンや規則性を学習して予測や意思決定を行う手法のこと。自動的に学習するため、人間が明示的にプログラムする必要がありません。これにより、大量のデータや複雑な問題に対して効果的な解決策を見つけることが可能になります。
深層学習(Deep Learning, DL)
人間の脳の神経回路を模倣した「人工ニューラルネットワーク」を使用してデータから学習することで、より高精度な分析を可能にする学習手法。AIの一分野、機械学習の一種で、画像認識、音声処理、自然言語理解などの分野で特に活用されています。この手法によって、学習が難しいとされてきた画像や自然言語などの非構造化データも学習できるようになりました。
生成AI(Generative AI)
既存のデータを学習し、その知識をもとに新しいパターンやアイデア、コンテンツを生み出す技術。文章、音声、画像など、さまざまな種類のデータを生成することができます。
人工ニューラルネットワーク(Artificial Neural Network)
人間の脳が情報を処理する方法を模倣したコンピュータプログラムのこと。
活性化関数(Activation Function)
ニューラルネットワークを作る際に使われるもので、あるニューロンから次のニューロンへの出力過程において、入力された数値を特定の方法で変換し、その結果を出力する関数のこと。
パラメータ(Parameter)
モデルの予測と実際の結果の差を最小限に抑えるために、トレーニング中に調整される数値のこと。これにより、コンテンツを生成するときに次に何が来るかを予測することができます。パラメータが少なすぎると、AIの精度が低下する可能性がある一方で、パラメータが多すぎるとAIが過剰な処理能力を使用し、特化しすぎる可能性があるためバランスが重要です。
モデルの種類に関する用語
GAN(敵対的生成ネットワーク、Generative Adversarial Network)
本物のデータと間違われる可能性のあるデータを対峙させることにより、AIの学習を進めていくモデル。「画像生成器」と「画像識別機」の2つのニューラルネットワークで構成されており、画像生成器によって入力されたノイズから訓練データと類似のデータを生成し、画像識別機はデータが訓練データなのか画像生成器から生成されたものなのか識別します。この2つを競合させることで、本物のデータに近い偽物データを生成することを可能にするのです。
VAE(変分オートエンコーダ、Variational Autoencoder)
訓練用のデータから特徴量を抽出し、元の画像と似た画像を生成して出力するモデル。
拡散モデル(Diffusion Model)
画像生成AIのサービスを中心に利用されている生成AIモデルの一種。画像生成において優れた精度を実現できるため、近年注目を集めています。
LLM(大規模言語モデル、Large Language Model)
与えられたプロンプトにもとづいて、人が書いたようなテキストを作成することができるモデル。大量のテキストデータを学習してそのデータのパターンや構造を理解し、人間のような文章生成や自然言語タスクの実行が可能となっています。歌詞や小説、コードなど幅広いテキストの生成や、文章の要約、機械翻訳などにも活用されています。
マルチモーダルAI(Multimodal AI)
異なる種類の情報を一緒に扱うことができるAI。例えば、画像、音声、テキストという異なる情報を組み合わせたり、お互いに関連付けたりして処理します。
実践・開発関連に関する用語
トークン(Token)
テキストデータを処理する際に使用される基本的な単位。例えば「これはペンです」という文章は「これ」「は」「ペン」「です」と分けられます。このようにトークン化することで、個々の単語、文字、またはサブワードに分割し、コンピュータはそれぞれの単語や句が持つ意味や役割を理解しやすくなります。そして、テキストデータから情報を抽出したり、言語の意味を解析したりするための基礎を築くのです。
エンベディング(Embedding)
単語や文章、画像、音声などのデータを、AIが処理しやすい数値ベクトル表現に変換する技術。「埋め込み表現(Embeddings)」とも呼ばれます。これにより類似性や関連性を計算しやすくなり、機械学習モデルがテキストデータを理解しやすくなり、情報検索、テキスト分類、機械翻訳などのタスクが向上します。
コンテキストウィンドウ(Context Window)
モデルが一度に処理できるテキスト量(トークン数)のこと。コンテキストウィンドウが大きいほど、モデルはより長い文章やより大量の情報を一度に処理できるようになり、文脈を深く理解し、整合性の取れた出力を生成できるようになります。
RAG(検索拡張生成、Retrieval-Augmented Generation)
ChatGPTなどのチャットAIに独自の情報源を付与する仕組み。業務文書・規定などの社内情報や外部の最新情報への検索を組み合わせたりすることが可能です。
ファインチューニング(Fine-tuning)
あるデータセットを使って事前学習したモデルを、追加のくデータセットを使って再トレーニングすることで、新しいタスク向けに機械学習モデルのパラメーターを微調整すること。モデルを再利用するため、一から学習するよりも短時間で少ないデータでモデルの構築ができます。
AI推論(Inference)
特定の入力データにもとづいて、既に訓練されたモデルを用いて結論や出力を導くプロセスのこと。AIのモデルは「学習」と「推論」という2つのプロセスが基本です。身近なことで例えると、レシピをもとに料理を作ることが学習、学んだことや経験をもとに新しい料理を考えて作ることが推論です。
バッチ学習(Batch Learning)
全ての学習データを利用して学習する手法。訓練データを「バッチ」と呼ばれるまとまった単位で処理し、モデルに反映させます。訓練データが大量にある場合や、一度モデルを訓練し終わった後は追加のデータを用いずに運用する場合に使われます。計算コストはかかりますが、全てのデータを利用するため、モデルが安定しやすいのが特徴です。
量子化(Quantization)
機械学習やAIモデルの実行負荷を軽減するための技術。AIの推論に必要なメモリの削減を目的としており、信号処理、データ圧縮、機械学習など、さまざまな分野で広く使用されています。
プロンプトに関する用語
プロンプト
AIとの対話において、ユーザが入力する指示や質問のこと。要求や問いに対して適切な応答や結果を生成するためには、明確でより具体的なプロンプトが必要です。逆に、不適切なプロンプトを使用すると、望ましくない結果を生成する可能性があります。
プロンプトエンジニアリング(Prompt Engineering)
AIから望ましい出力を得るために、指示や命令を設計、最適化するスキルのこと。 生成AIは、プロンプトの出し方によって出力されるコンテンツの精度が大きく異なるため、より適切なプロンプトを作成するスキルが求められています。
Few-shot学習(Few-shot Learning)
ごく少ないサンプルでトレーニングすることでAIモデルが正確な予測を行えるように学習する機械学習フレームワーク。限られたサンプルから高い精度のAIモデルを構築することを可能にし、特にデータが少ない分野でのAI導入の障壁を大きく低減させています。
Chain of Thought(思考の連鎖、CoT)
問題を解くまでの一連の手順をプロンプトに含めるテクニックのこと。人間の推論を反映しているため、一貫した論理的推論を通じて体系的な問題解決することを可能にします。
Zero-shot Learning(ゼロショット)
何も追加情報を与えずに指示を出しただけで回答を得るプロンプト作成テクニック。事前に学習していなくても、何らかの補助情報を訓練済みAIモデルに与えることで、柔軟に適切な分類や予測を行います。
One-shot(ワンショット)
AIに一つの指示を与えることで、目的通りの結果を得るためのプロンプト作成テクニックのこと。新しいプロジェクトを展開し始めた場面やまだ事例が少ないなど、学習データが少ない場合に重宝されます。
学習に関する用語
バッチサイズ(Batch Size)
モデルが一度に処理するデータの量。モデルはデータを一度に全て処理するのではなく、指定されたバッチサイズごとにデータを処理し、パラメータの更新を行います。バッチサイズが大きい場合、モデルはより多くのデータを一度に処理するために計算効率が向上しますが、メモリ要件が増加して過学習のリスクが高まる可能性があります。一方、小さいバッチサイズの場合、モデルはより頻繁に更新し、ノイズの多いデータに対しても柔軟に対応できますが、収束までの時間が長くなることがあります。
エポック(Epoch)
データセットを何回繰り返して学習するかを指します。モデルが学習データをどれだけ深く学習するかに関わるため、適切なエポック数を設定することで、モデルはデータの特徴を十分に捉え、未知のデータに対しても精度の高い予測を行うことができます。
過学習(Overfitting)
AIがデータを学習しすぎてしまい、未知のデータへの予測精度が下がってしまうこと。AIは、データを学習させて精度を上げていくことが求められますが、データ学習の量が増えすぎてしまうと、一定のデータへの偏りが生じます。そのため、AIによって予測したい未知の事象に対して、偏った結果を出力するようになります。過学習をさせないために、人間が介入して学習させるデータの量を調整する必要があるのです。
評価・品質に関する用語
ハルシネーション(Hallucination)
AIが事実に基づかない情報を生成する現象のこと。まるでAIが幻覚(=ハルシネーション)を見ているかのように、もっともらしい嘘(事実とは異なる内容)を出力するため、このように呼ばれています。
AIバイアス(AI-Bias)
人間のバイアスによって元のトレーニングデータやAIアルゴリズムが歪められ、歪んだ出力や潜在的に有害な結果につながること。カーネギーメロン大学の独自調査によって、Google社のオンライン広告システムには、高収入の求人が女性よりも男性に多く表示されることが明らかになっており、ほかにも顔認識ソフトウェアでは有色人種を認識しにくい事例などがあります。
解釈可能性
ブラックボックスとも言われる機械学習モデルに対して、そのモデルが予測を返す仕組みそのものを明らかにできること。機械学習モデルが予測、推定を行ったプロセスを、人間が解釈可能であるかどうかを指します。
説明可能なAI(XAI/Explainable AI)
「なぜその答えを出したのか」を説明できるプロセスと方法のこと。機械学習アルゴリズムで生成した結果とアウトプットを、人間のユーザーが理解し、信用できるようにします。AIを実際に使う際には、説明可能なAIは組織の信頼と信用の構築に不可欠です。また、AIの説明可能性は、組織がAI開発において責任あるアプローチを採用する際にも役立ちます。
セキュリティ・倫理に関する用語
AIガバナンス(AI Governance)
AIの開発と利用を倫理的・法的・社会的基準に沿って監督・管理し、AIによる事故やAI活用に伴うリスクへの対策を行う枠組みのこと。AIの利活用においては、セキュリティリスク、プライバシー侵害、偏見といった課題があり、AI利活用を推進する企業においてはリスクマネジメントが必須です。そこで、AIツールとシステムが安全かつ倫理的であることを確保する役割を果たします。
プロンプトインジェクション(Prompt Injection)
大規模言語モデル(LLM)に対するサイバー攻撃の一種。生成AIを意図的に誤作動を起こさせるような指令入力を与え、提供側が出力を禁止している情報(開発に関する情報、犯罪に使われうる情報等)を生成させます。これにより、攻撃者はシステムの制御を奪ったり、機密情報を盗んだり、機密データを漏洩させたり、誤った情報を拡散させたりする可能性があります。
シンギュラリティ
AIの性能が全人類の知性の総和を超える転換点(技術的特異点)を指す言葉で、未来予測における仮説の一つ。AIが自身よりもさらに優秀なAIを生産し、そのAIがさらに優秀なAIを作り出すことによる暴走が懸念されています。人工知能研究の世界的な権威であるレイ・カーツワイル博士によって、2005年に発表された著作「The Singularity Is Near: When Humans Transcend Biology」の中で提唱されました。博士はシンギュラリティは2045年に起こると予想しているため「2045年問題」としても知られています。
ディープフェイク
本来は「巧妙に一部を改竄された写真/動画」を指す言葉ですが、現在は「AIを用いた偽写真/動画/音声全般」を指して使われることが多いです。生成AIによる結果のクオリティが高まっているため、国際的・社会的な問題になっています。例えば、作られた音声や映像によって認証が突破されたり、人々の不安をあおったり、誰かの尊厳を傷つけたりすることが懸念されています。
最新技術・トレンドに関する用語
AIエージェント(AI Agent)
複数のAI技術やデバイスを組み合わせ、従来のAIではできなかった複数のタスクや複雑なタスクを自動的に実行するための高度なシステム。機械学習や自然言語処理などの技術を駆使して、ユーザーのニーズに応じた対応を行います。意思決定、問題解決、外部環境とのやり取り、アクションの実行など、自然言語処理以外の幅広い作業をすることができます。カスタマーサポートにおけるチャットボットや、パーソナルアシスタントとしてのスマートスピーカーはその一例です。
エッジAI(Edge AI)
ネットワークの端末機器(エッジデバイス)に直接搭載したAI。収集したデータに対してその場でAI処理を行うため、クラウドでAI処理を行うクラウドAIと比べて、通信コストを削減、低遅延処理が可能、プライバシーリスク低減といったメリットがあります。また、学習したデータを端末で即時に処理できることから、リアルタイムでの解析や判断が求められる分野に向いています。加えて、端末が常時インターネットに接続されている必要がないため、農業や災害時の緊急対応など、インターネットアクセスが困難な状況下でも活用が進んでいます。
量子AI(Quantum AI)
量子コンピューティングを、機械学習 アルゴリズムや、ニューラル・ネットワーク、 大規模言語モデル(LLM) などの高度な人工知能製品の研究開発に応用することを目的とするコンピューター・サイエンスの新しい分野。
連合学習(フェデレーテッドラーニング Federated Learning)
2017年にGoogleにより提唱されたモデルで、データを集めることなく、特定のAI解析によって得られた分析結果・改善点などの要素のみを統合する機械学習の方法。従来の機械学習で課題となっていた情報漏洩などのセキュリティリスクを大幅に低減することができるようになっています。また、通信は暗号化されているため、情報漏洩等のリスクも大幅に低減されています。
システム・インフラに関する用語
GPU(Graphics Processing Unit)
3Dグラフィックスなどの画像描写を行う際に必要となる計算処理を行う半導体チップ(プロセッサ)のこと。画像や映像を速くきれいにモニターに映すために必要不可欠な画像処理装置のパーツです。本来、GPUは画像処理装置を意味していましたが、近年は機械学習やビッグデータ処理などの科学技術用途にも用いられています。
TPU(Tensor Processing Unit)
Googleが独自に開発したNPUで、機械学習における大規模な行列演算に特化したハードウェア。GPUと比べて電力あたりの性能に優れていることが特徴です。
ベクトルデータベース(Vector Database)
意味の類似性から情報を検索できるデータベース。テキスト、画像、音声などの非構造化データの格納・管理・照会で利用することができ、企業が自社データを活用した生成AIアプリケーションを開発する際に必須な存在です。今後ますます生成AI活用が急速に増えると予想される中、注目度が高まっています。
クラウドコンピューティング(Cloud Computing)
ネットワークを経由して、インターネット上のサーバーに存在するコンピューター機能を利用する仕組みのこと。「クラウド」とも呼ばれます。サーバー、ストレージ、ネットワーク、データベース、ソフトウェアといった機能を利用することが可能で、自身の端末にアプリケーションをインストールすることなく、異なる端末からでも同一データにアクセスできるのが特徴です。利用者がサーバーやソフトウェアなどを購入したり管理したりする必要がないため、システムの導入や運用にかかるコストを削減することが可能となっています。
データ関連の用語
データセット(Dataset)
ある目的で集められ、一定の形式に整えられたデータの集合体のこと。画像や動画、音声、テキストといったデータや、経済・金融、医療、観光など、そのジャンルは多岐にわたります。企業や研究機関などが収集したデータや、公開されているデータを集めて解析する際に使用されており、この品質が高いほどモデルの性能も向上するため重要な要素となっています。
データ拡張(Data Augmentation)
既存のデータセットからさまざまなテクニックを用いてデータ量を拡張する方法。 例えば1枚の画像に対して、反転、輝度変更、回転、平行移動、合成といった加工をして、全く異なるデータを作成することが可能です。特に深層学習の領域で高性能な手法が続々と登場しており、さまざまな産業や専門分野において注目を集めています。
アノテーション(Annotation)
AIの分野におけるアノテーションは、テキスト、音声、画像・動画データに情報タグを付与することを指します。例えば、人の顔の画像に「目・口・鼻」の位置を記録したり、誰かが書いた口コミに「良い」「悪い」のリアクションを付けたりすることもアノテーションです。これによってデータから正確に情報を読み取ることが可能になり、AIモデルの学習精度を向上させることができます。
評価指標に関する用語
精度(Accuracy)
AIにおいては、AIモデルがどれだけ正確に予測を行うかを示す指標として使われます。AIモデルが問題を解決するために行う予測や分類がどれだけ正確かを測ることができます。
正答率(Accuracy)
モデルが正しく予測できた割合を示す指標。例えば100枚の画像が犬か猫かを分類する問いで95枚の画像を正しく分類した場合、正解率は95%になります。
適合率(Precision)
「陽性」と予測したデータの中で実際に「陽性」だった割合を示す指標。適合率が高ければ高いほど、精度が高いことを表しています。
再現率(Recall)
結果が「陽性」であるもののうち、AIが「陽性」だと予測した割合を示す指標。適合率と対になっています。再現率が高ければ高いほど、精度が高いことを表しています。
F値(F-score)
適合率と再現率の平均。適合率か再現率のどちらか一方が極端に低いとF値も低くなるため、適合率と再現率のバランスが最も取れた状態でF値が最も高くなります。
[参考]
AI(人工知能)とは?意味やビジネスの例も交えわかりやすく解説
活性化関数(Activation function)とは?:AI・機械学習の用語辞典 – @IT
生成言語AIの進化:大規模言語モデルを理解する上で重要なトークンとは? | Hakky Handbook
マルチモーダルAI(Multimodal AI)とは?:AI・機械学習の用語辞典 – @IT
トークン(Token)とは?-AI関連の用語集【クラベルAI】-
Embedding(埋め込み表現)とは何か ”単語や文章が持つ意味を数値で捉える” | Data Driven Knowledgebase
AIの精度は一つじゃない?精度の評価指標をご紹介 | コラム | TechSword
コンテキストウィンドウとは何か?グーグルとメタが本気、生成AI「強化」のカギ?
RAG(Retrieval-Augmented Generation:検索拡張生成)とは?:AI・機械学習の用語辞典 – @IT
生成AIのビジネス活用で注目されるRAG(検索拡張生成)とは? – 仕組みや活用例、精度向上のノウハウなどを紹介 – WOR(L)D ワード|大和総研の用語解説サイト
ファインチューニング(Fine-tuning:微調整)とは?:AI・機械学習の用語辞典 – @IT
AI推論とは?学習との違いやそのプロセスをわかりやすく解説!
Diffusion model(拡散モデル)とは?仕組みやGAN・VAEとの違いを解説
IT用語集 | docomo business Watch | ドコモビジネス | NTTコミュニケーションズ 法人のお客さま
ワンショット学習とは?意味やゼロショット学習、フューショット学習との違いまで徹底解説!
2024年最新!知っておくべきAI用語25選 – PigData | ビッグデータ収集・分析・活用ソリューション
バッチサイズとは?機械学習とディープラーニングでの効果的な設定と最適化方法を徹底解説 | Reinforz.ai
エポック数(epoch)とステップ数(step)の違い、バッチサイズとは【初級 深層学習講座】|Aru’s テクログ(Aruaru0)
AIガバナンス – 生成AI時代に求められる信頼できるAIの実現の道筋|Deloitte Analytics|デロイト トーマツ グループ
フェデレーテッドラーニングとは?AIの進歩や進化に不可欠な技術や新たな未来を切り開く! | Winserverのススメ
ベクトルデータベースとは何かを図解、生成AIで「必須の存在」はどんな役割を担うのか
クラウドコンピューティングとは?仕組みやメリット・デメリットを解説【トゥモロー・ネット テックブログ】
データ拡張 (Data Augmentation) – Global Walkers