人工知能の歴史:ChatGPT登場までの道のり
AIの歩みを振り返る
「生成AI」は突然現れたわけではありません。長い研究の積み重ねの上に生まれた技術です。ここでは、ChatGPTの登場を中心に、AIの歴史を振り返ってみます。AIブームの変遷とまとめ
マッカーシーらがロックフェラー財団への研究提案書で初めて「artificial intelligence」という語を使用。
「Dartmouth Summer Research Project on Artificial Intelligence」開催。AI研究が学術分野として正式に始まる。
簡単なパズルや迷路しか解けず、現実問題への適用が困難。楽観的な期待が先行した時代。
英国政府委託のライトヒル報告書がAI研究の限界を指摘。英米で研究助成が大幅に縮小。
計算リソースの限界と過大な期待の反動で、AI研究の冬の時代が続く。
専門家の知識をルール化した「エキスパートシステム」が企業に普及。AI研究・投資が一時的に復活。
保守コストの高さと汎用性の低さが問題化。再び資金と関心が激減し、2度目の冬の時代へ。
1996年のリマッチで、改良版ディープ・ブルーがチェス世界王者カスパロフに3.5–2.5で勝利。史上初めてコンピューターが現役世界王者をマッチ全体で下した。
トロント大学のAlexNet(Krizhevsky・Sutskever・Hinton)がILSVRC 2012でTop-5エラー率15.3%を記録。2位(26.2%)に約10ポイントの差をつけて優勝。ディープラーニング時代の幕開け。
Google DeepMindのAlphaGoが当時の世界トップ棋士イ・セドル九段に4勝1敗で勝利。「コンピューターが当面勝てない」とされた囲碁での勝利は世界に衝撃を与えた。
Google Brain・Google Researchの研究者ら8名が論文「Attention Is All You Need」を発表(NeurIPS 2017採択)。Self-Attentionのみを用いた革新的なアーキテクチャは、現在の生成AIすべての技術的基盤となる。
1,750億パラメータという当時最大規模のモデル。少数例示(Few-Shot)で多様なタスクをこなす能力が研究者・開発者の間で大きな話題に。一般向けUIはなくAPI限定での公開。
DALL-E 2(OpenAI・4月)、Midjourney オープンβ(7月)、Stable Diffusion オープンソース公開(8月)と続き、画像生成AIが一般ユーザーへ急速に普及。「画像生成AIの民主化」が加速。
OpenAIがGPT-3.5ベースのチャットUIを無料一般公開。公開後5日以内に100万ユーザー、約2ヶ月で月間1億MAU(当時最速)を突破。AIが専門家の道具から「誰でも使えるもの」へ。
ChatGPTへの対抗としてGoogleが発表(一般公開は3月)。AI競争が本格化。MicrosoftのBing AIとも合わせ、三つ巴の競争へ。
OpenAIがGPT-4をChatGPT Plus・APIで提供開始。同日、AnthropicがClaude 1をAPI早期アクセスで公開(安全性重視の設計)。一般向けウェブ公開はClaude 2・同年7月から。
DALL-E 3(9月)・GeminiへのBard改名(2024年2月)など、各社が改良版を次々と発表。AIの進化が加速度的に続く。
生成AIが社会インフラ化。マルチモーダル・エージェント型AIが台頭し、進化は現在も続いている。
第1次(1950〜60年代):推論・探索の時代 → 第1次冬(1974〜1980年)
第2次(1980年代):エキスパートシステムの時代 → 第2次冬(1987〜1993年頃)
第3次(2000年代〜現在):機械学習・ディープラーニングの時代 ← 現在進行中
AI年表解説
8月
「Artificial Intelligence」という語が初めて使用される
ジョン・マッカーシーらがロックフェラー財団への研究助成提案書(1955年8月作成)の中で、「artificial intelligence(人工知能)」という語を公式に初めて使用。
「我々は、10名の研究者による2ヶ月間の人工知能研究を提案する…」
夏
ダートマス夏期研究プロジェクト開催・AI分野として確立
「Dartmouth Summer Research Project on Artificial Intelligence」が開催。1955年の提案書で使われた名称・概念が学術コミュニティに広まり、AI研究分野として正式に確立された。
ダートマス大学の公式記述。1956年に少人数の科学者が「Artificial Intelligence」をテーマとした夏期研究プロジェクトに集まったと明記している。マッカーシーの提案書にある「学習のあらゆる側面は機械に模倣できる」という文言も紹介。
コンピュータ歴史博物館による解説。1956年の会議とその直後の影響を記述。「Artificial Intelligence」という用語の起源が前年の提案書(1955年)にあることを明示。
マッカーシーらによる原文提案書。スタンフォード大学が公開する一次資料。「artificial intelligence」という語の初出が確認できる最重要文書。
1950年代後半〜60年代
1974〜1980年頃
1980年代前半
1987〜1993年頃
1990年代後半〜現在
1980年頃
計算リソースの限界・ライトヒル報告書
英国政府のライトヒル報告書(1973年)がAI研究を痛烈に批判。過大な期待と計算リソースの限界が相まって資金・関心が激減した。英米の政府助成が大幅に縮小された。
前半
エキスパートシステムの台頭(一時的復活)
特定領域の知識をルール化した「エキスパートシステム」が企業に普及し、AI研究・投資が一時的に復活。ただしこのブームも長続きしなかった。
1993年頃
エキスパートシステムの限界露呈・再度の冬
エキスパートシステムの保守コストと汎用性の低さが問題視され、再び資金と関心が激減。1970年代前半に第1次、1980年代末〜1990年代前半に第2次と、計2度の冬の時代が到来した。
後半〜
機械学習・深層学習の台頭
統計的手法や機械学習が主流となり、後の深層学習ブームへとつながっていく。
英国政府の依頼でジェームズ・ライトヒルが作成したAI研究への評価報告書。AI研究の現状を痛烈に批判し、英国内の研究助成の大幅縮小を招いた。第1次AIの冬の直接的な引き金として広く認識されている。
「AI Winter」という言葉自体は研究者の間で広く使われている確立された概念。第1次(1974〜1980年頃)と第2次(1987〜1993年頃)の2度の冬の時代があったことが文献上で一致している。原因は①過大な期待、②計算リソースの限界、③実用化の失敗。
ディープ・ブルー vs カスパロフ ― 人間の勝利
ディープ・ブルーは第1局を制した(AIが世界王者に初めて1局勝利)が、マッチ全体ではカスパロフが4–2で勝利。
| 勝者 | スコア | 意義 |
|---|---|---|
| カスパロフ | 4 – 2 | マッチ全体は人間の勝利 |
| ディープ・ブルー | 第1局のみ | AIが世界王者に初めて1局勝利 |
ディープ・ブルー vs カスパロフ ― AI初の快挙
改良版ディープ・ブルーが3.5–2.5でカスパロフに勝利。通常トーナメント形式でコンピューターが現役世界王者を初めてマッチ全体で破った、史上初の出来事。
(年表記述の推奨:「1996年に1局を初めて制し、1997年のリマッチでマッチ全体(3.5–2.5)で現役世界王者を史上初めて破った」)
| 勝者 | スコア | 意義 |
|---|---|---|
| ディープ・ブルー | 3.5 – 2.5 | 史上初・マッチ全体でAIが世界王者を撃破 |
AIへの社会的注目の転換点
この勝利は世界に衝撃を与え、AI技術の可能性を社会に広く認識させる転換点となった。ただしディープ・ブルーは専用設計のチェスマシンであり、汎用AIとは異なる点に注意。
IBMによる公式記録。1996年・1997年両対戦のスコア、開発経緯、技術的詳細が記載されている。ディープ・ブルー開発チームの一次情報に最も近い公開資料。
ディープ・ブルーの開発者自身による査読付き学術論文。システムのアーキテクチャ、評価関数、1997年対戦の詳細を記述した最も権威ある一次資料。対戦経緯の正確な把握に最適。
9月30日
AlexNetがコンテストに参加・圧勝
Krizhevsky・Sutskever・Hinton(トロント大学)による「AlexNet」がImageNet Large Scale Visual Recognition Challenge 2012(ILSVRC 2012)に参加。Top-5エラー率15.3%で優勝し、2位(26.2%)に10ポイント以上の差をつけた。
ディープラーニングが研究の主流へ
この結果を機に、深層学習(ディープラーニング)がAI研究の主流となり、画像・音声・自然言語処理など幅広い分野へ急速に波及。現代のAIブームの直接的な起点とされている。
AlexNet開発者自身による原著論文(NeurIPS 2012採択)。ILSVRC 2012でのTop-5エラー率15.3%という数値、2位との差、アーキテクチャの詳細が記載されている最重要一次資料。参加日(2012年9月30日)も明記されている。
緑=AlphaGo勝利 橙=イ・セドル勝利(第4局のみ人間が制した)
Google DeepMind(Google傘下)が開発
AlphaGoを開発したのは「Google」ではなく、Google傘下の研究機関「Google DeepMind」(現DeepMind)。「Google DeepMind」と明記するのが正確。
3月
イ・セドル九段(当時の世界トップ棋士)に4勝1敗で勝利
韓国・ソウルで5番勝負を実施。AlphaGoが4勝1敗で勝利した。「当時の世界トップ棋士・イ・セドル九段(韓国)」が正確な表記(「世界チャンピオン」は厳密には要注意)。唯一の人間の勝利となった第4局はとりわけ注目された。
柯潔(コ・ジェ)にも3勝0敗で完勝
翌年には当時の世界ランキング1位・柯潔九段(中国)にも3-0で完勝。「世界チャンピオン」と呼ぶならこちらの方がより正確な表現に近い。
AIが「人間の直感が必要」とされた領域を制覇
チェスと異なり囲碁は「コンピューターが当面勝てない」と考えられていた分野だったため、世界への衝撃は特に大きかった。強化学習と深層学習の組み合わせによる成果として、AI研究の可能性を大きく広げた。
AlphaGoの開発チームによる査読付き原著論文(Nature掲載)。強化学習と深層ニューラルネットワークを組み合わせたアーキテクチャの詳細、および対局結果が記載されている。最重要一次資料。
DeepMind公式による対戦記録・技術概要。開発元が「Google DeepMind」であること、イ・セドル九段との対戦結果(4勝1敗)が明記されており、開発元・スコアの確認に最適。
6月
「Attention Is All You Need」をarXivで発表
Google Brain・Google Research所属の研究者ら(Vaswani et al. 8名)がTransformerアーキテクチャを提案。Self-Attentionのみを用いてRNN・CNNを不要とした革新的な構造で、機械翻訳タスクで当時の最高性能を大幅に更新した。(「Googleが発表」ではなく「Google研究者らが発表」が正確)
12月
査読付き国際会議で正式採択・発表
NeurIPS 2017に採択され、学術コミュニティに正式に発表された。以降、Transformerは自然言語処理の標準アーキテクチャとなっていく。
BERT・GPTなど大規模言語モデルの土台に
翌2018年にGoogleがBERT、OpenAIがGPTを発表。いずれもTransformerを基盤としており、現在のChatGPT・Claude・Geminiに至る大規模言語モデル(LLM)すべての技術的源流となっている。
NeurIPS公式収録の査読済み最終版。Transformerの提案・実験結果・著者情報が完全に記載されている一次資料。引用するならこちらが最も権威ある版。
2017年6月12日公開のプレプリント版。NeurIPS採択前から広く参照されており、AIコミュニティへの影響はこの公開時点から始まっている。内容はNeurIPS版とほぼ同一。
Google Research公式の論文掲載ページ。著者がGoogle Brain・Google Research所属であることを公式に確認できる。「GoogleのAI」という表現の根拠として補足的に参照できる。
5月28日
論文「Language Models are Few-Shot Learners」を公開
Brown et al.(OpenAI)がarXivにプレプリントを公開。1,750億パラメータという当時最大規模のモデルと、少数例示(Few-Shot)だけで多様なタスクをこなす能力が研究者の間で大きな話題となった。
6月11日
招待制APIとして開発者・研究者向けに公開
一般ユーザー向けのチャットUIは存在せず、APIを通じた限定アクセスのみ。開発者・研究者が実験的に利用し、文章生成・コード生成・翻訳など幅広い応用可能性が実証された。
限界
話題は「専門家・開発者コミュニティ」に限定
API限定公開のため、一般社会への普及はChatGPT(2022年11月)まで待つことになる。「自然な文章生成能力が話題に」は正しいが、対象は主に研究者・開発者であり、一般ユーザーではなかった。
位置づけ
「ChatGPT以前」の最重要モデル・LLM時代の幕開け
GPT-3はスケーリング則(モデルを大きくすれば性能が上がる)の有効性を実証し、その後のGPT-4・ChatGPT・Claudeなど現代LLMへの直接的な道筋をつけた。Transformerに次ぐAIの重要なマイルストーン。
GPT-3の原著論文。OpenAI研究チームによるプレプリント(2020年5月28日公開)。1,750億パラメータのモデル仕様・Few-Shot性能・実験結果が詳細に記載されており、日付・スペック・能力すべての確認に使える最重要一次資料。
※ UBS調査(2023年2月)・SimilarWeb分析などをもとに広く報道された比較。ChatGPTは「(当時の)コンシューマーアプリ最速クラス」と称された。2023年7月のMetaのThreadsが「100万人到達」の速さでChatGPTを上回ったため、「当時」という留保が必要。
11月30日
ChatGPT、無料プレビューとして公開
OpenAIがGPT-3.5ベースのチャットUIを無料で一般公開。専門知識なしに誰でも使えるインターフェースが、GPT-3との決定的な違いとなった。公開後5日以内に登録ユーザー100万人を突破。
1月
月間アクティブユーザー1億人達成(当時史上最速クラス)
UBSの調査レポート(2023年2月公表)が「公開約2ヶ月で月間1億MAU」と推計。TikTok(9ヶ月)・Instagram(2.5年)を大きく上回る速度として広く報道された。
7月
MetaのThreadsが「100万人到達」記録を上回る
Metaが2023年7月に公開したThreadsが約1時間で100万ユーザーを突破し、「最速で100万人」の記録でChatGPTを上回った。ただしこれは「100万人」の記録であり、「1億MAU」の記録とは指標が異なる点に注意。
意義
AIが「誰でも使えるもの」になった転換点
GPT-3がAPI限定で専門家向けだったのに対し、ChatGPTはUI込みで一般公開されたことで、AIが初めて大衆に届いた。生成AIブームと社会的議論(教育・著作権・雇用)の直接的な起点となった。
ChatGPT公開当日のOpenAI公式発表。公開日(2022年11月30日)・無料プレビューという位置づけ・モデル仕様の確認に最適な一次資料。
UBSの調査レポートをReutersが報道。「約2ヶ月で月間1億MAU」という数字の出典となった分析レポート。OpenAI公式数値ではなく第三者推計である点に注意。SimilarWebデータなどを組み合わせた分析。
歴史記録サイトHistoryによる記事。「5日で100万人、2ヶ月で月間1億ユーザー」「TikTok(9ヶ月)・Instagram(2.5年)より速い」という比較データを引用・紹介。二次資料だが要点の確認に有用。
7〜8月
Midjourney(7月)・Stable Diffusion(8月)が普及を牽引
2022年7月にMidjourneyがDiscord上でオープンβ公開、同8月にStability AIがStable Diffusionをオープンソースとしてリリースしたことが、一般ユーザーへの急速な普及の実質的な起点。(DALL-E 2は同年4月発表だが招待制)
DALL-E 3発表(9月)・各モデルが進化
2023年はDALL-E 3のChatGPT統合(9月)、Midjourney V5・V6リリースなど改良版が相次いだ年。2022年後半に登場したモデルが成熟・普及した時期として整理すると正確。
ChatGPT・Gemini・Copilotなど主要AIに画像生成が統合
画像生成機能が汎用AIチャットツールに統合され、フリーミアム化が進む。専用ツールだった画像生成AIが「AIの標準機能」となっていった。
Stable Diffusionのオープンソース公開を告知した公式ページ。公開日(2022年8月22日)・オープンソースとしての提供方針が確認できる。「画像生成AIの民主化」を語る上で最も重要な一次資料。
DALL-E 2の公式発表ページ。発表日・機能・招待制プレビューの詳細が記載されている一次資料。
DALL-E 3の公式発表ページ。2023年9月発表・ChatGPTへの統合が確認できる。「2023年は改良版の年」という整理の根拠として参照できる。
Midjourneyの公式ドキュメント。オープンβ開始(2022年7月12日)などリリース履歴の確認に活用できる参考資料。
2月6日
スンダー・ピチャイCEOが公式ブログでBardを発表
Google公式ブログにてBardの存在を公表。「信頼できるテスターに開放し、数週間以内に一般提供を開始する」と明記した。この時点では一般公開ではない。
3月21日
Bardの待機リスト公開・一般ユーザーへのアクセス開始
2月の「発表」から約6週間後、米国・英国の一般ユーザー向けに待機リストが開放された。「2月に発表」は正確だが、「使えるようになった」のは3月であることを混同しないよう注意が必要。
2月
「Bard」が「Gemini」に改名
GoogleはBardを正式に「Gemini」へ改名し、AIブランドをGeminiに統合。年表の「現Gemini」という表記はこの経緯を反映しており正確。
文脈
ChatGPT(2022年11月)への対抗・AI覇権争いの激化
ChatGPT公開からわずか約2ヶ月での発表であり、GoogleがAI分野で「コードレッド(緊急事態)」を宣言したとも報道された。MicrosoftのBing AI(ChatGPT統合)と合わせ、AI競争が本格化した時期として正確。
スンダー・ピチャイCEOによるBard発表の公式ブログ記事。発表日(2023年2月6日)・テスター限定での先行公開・「数週間以内に一般提供」という表現が確認できる最重要一次資料。発表と一般公開の違いを裏付ける直接的な根拠。
3月14日
3月14日
OpenAIがGPT-4をChatGPT Plus・APIで提供開始
GPT-3.5と比較して推論精度・長文処理・安全性が大幅に向上。マルチモーダル(画像入力)対応も発表された。ChatGPT Plusユーザーから順次利用可能となった。
3月14日
AnthropicがClaude 1をAPI経由で限定公開
Anthropicが同日にClaude 1を発表・API早期アクセスを開始。ただし、この時点では承認済みユーザー・企業向けのAPI限定であり、一般ユーザーが自由に使える状態ではなかった。「一般公開」という表現は厳密には不正確。
7月11日
Claude 2が一般ユーザー向けに公開(claude.ai)
claude.aiというウェブUIが公開され、一般ユーザーが登録なしで使えるようになったのはこのタイミング。「Claudeが一般公開された」という意味での正確な日付は2023年7月11日が該当する。
文脈
GPT-4・Claude・Bard(Google)が出揃い三つ巴へ
2023年2月のBard発表、3月のGPT-4・Claude 1 API公開と、わずか数週間の間に主要AIが出揃った。「AI競争が本格化」という年表の表現は正確で、この時期を象徴している。
OpenAI公式によるGPT-4の発表ページ。公開日(2023年3月14日)・ChatGPT Plus・API提供・マルチモーダル対応・性能向上の詳細が確認できる一次資料。
AnthropicによるClaude 1発表の公式ブログ。発表日(2023年3月14日)・API早期アクセス形式での公開・安全性重視の設計思想(Constitutional AI)が記載されている。「一般公開」ではなくAPI先行公開であることもここで確認できる。
