AIで、まだ存在しないものを作る―和訳・要約・自動化の先にあるもの

AI脅威論であったり間違いだらけで信頼できないとかありますが事実です。しかしAI開発の意図を知ったとき使い方が一変するでしょう。私がAIを使用し始めたのは2025年10月からです。会社の社長がブローカーに騙されて期限切れ直前の特許を買わされたことから始まります。

凝集剤の特許でしたが、特許だけで製品化されておらずこれを売れる製品にするためにAIを使用するしか選択肢がなかった。プロフィールにある通り経済学部卒なので化学については大学受験時に勉強した程度でした。

会社も土木工事会社なので化学の分かる人はいません。そこで頼りにしたのが無料版Copilotと無料版Anthropicでした。この記事ではAIの生い立ち、直近のニュース、私が化学製品開発で感じたことを紹介します。

INDEX

1. 生成AIはなぜ生まれたのか―その背景と目的を紐解く
- 1-1. 生成AIが目指すもの
2. AIの長所・短所
- 2-1. AIの長所
- 2-2. AIの短所
3. 化学製品の開発にどう活用したか

生成AIはなぜ生まれたのか―その背景と目的を紐解く

ChatGPTやClaudeといった生成AIが突然世界に現れたように感じる人も多いかもしれません。しかし実際には、数十年にわたる研究の積み重ねと、複数の技術革新が交差した結果として誕生したものです。

STEP1

1950年代〜AIの黎明期：人間の知性を模倣する夢

「機械は考えられるか」というアラン・チューリングの問いに始まり、研究者たちはルールベースのプログラムで知性を再現しようとしました。しかし複雑な自然言語の処理は壁に突き当たり続けます。

STEP2

2000年代〜深層学習の台頭とビッグデータの出現

インターネットの普及で膨大なテキストデータが生まれ、GPUの進化で大規模な計算が可能に。ニューラルネットワークが「データから学ぶ」アプローチで従来手法を次々と超え始めます。

STEP3

2017年〜Transformerアーキテクチャの発明

Googleの研究者が発表した「Attention Is All You Need」論文が転換点に。文章中の単語同士の関係性を並列処理で学ぶ仕組みが、言語理解の精度を劇的に向上させました。

STEP4

2022年〜大規模言語モデルの一般公開

ChatGPTが公開からわずか5日で100万ユーザーを突破。専門家だけのものだったAIが、誰もが使えるツールとして社会に広まりました。

生成AIが目指すもの

知的労働の拡張

文章作成・要約・翻訳・コーディングなど、人間の認知的な作業を補助・代替し、創造的な仕事に集中できる環境をつくる。

知識へのアクセス民主化

専門家に頼らないと得られなかった知識を、誰でも対話形式で得られるようにし、情報格差を縮める。

人間の創造性の触媒

アイデアの壁打ち相手や草稿生成ツールとして機能し、人間の発想をゼロから百へ加速させる存在になる。

生成AIは「人間の代替」を目的として生まれたわけではありません。むしろその根底にあるのは、「人間の知的能力をいかに引き出し、広げるか」という問いです。医療・教育・科学研究など、一人の専門家だけでは届かなかった領域に、AIが橋渡し役として入ることで、社会全体の生産性と可能性を高めることが期待されています。

AnthropicがSpaceXの子会社であるxAI（イーロン・マスクのAI会社）との契約により毎月12億5000万ドル支払い、計算能力の提供を受けるという記事を見た。

AIは計算に弱いのに何に使う計算能力か

「計算に弱い」というのはAIの特性の一面ですが、ここで言う「計算能力」は算数的な演算とは別の話です。
AIの学習・推論に必要なのは行列演算（テンソル演算）の超大規模並列処理です。

具体的には

モデル訓練（Training）：数千億のパラメータを調整するために、膨大な量のデータを何度も通す作業
推論（Inference）：ユーザーが入力した際にリアルタイムで応答を生成する処理

今回の契約でAnthropicが得るのはColossus IクラスターとColossus IIクラスターへの専用アクセスで、合計20万基以上のNVIDIA GPUと数百メガワットの電力供給を含みます。

Anthropicは現在、計算能力の不足が事業の足かせになっていました。つまりこの契約は「モデルの性能を上げるための訓練」と「爆発的に増えているユーザーへのリアルタイム応答」の両方を賄うためのものです。

なぜSpaceX（xAI）だったのか

複数の理由が重なっています。

需要と供給の一致：Anthropic内部のコンピューティング需要が、主要出資者であるAWSやGoogle Cloudが物理的に建設できるペースを完全に上回ってしまっていました。
SpaceX側の事情：SpaceXはこの契約について「インフラの未使用計算能力を収益化できる」と述べており、双方にとってwin-winの構造です。
IPO戦略との連動：SpaceXはIPOに向けて$1.75〜2兆ドルという史上最大規模の評価額を狙っており、Anthropicからの年間150億ドルの安定収入は、投資家に対して財務の堅牢性を示す強力な材料になります。

つまり、「余っている最大級のGPUクラスターを持つ売り手」と「どこよりも早く大量の計算能力が必要な買い手」がたまたま一致したという構造です。ただし政治的には、Anthropicがイーロン・マスクと競合するAI企業（xAI/Grok）のインフラに依存するという皮肉な構図でもあります。

AIの性能を決定するのは何か

「データセンターと電力があれば性能が上がる」というのは半分正解で、現実はもっと複雑です。主要な決定要因を整理すると：

要因	説明
スケール（計算量）	より大きなモデルをより長く訓練するほど性能が上がる傾向（スケーリング則）
アーキテクチャ	Transformerなどの設計思想。ただし現在はほぼ収束済み
データの質と量	何を学ばせるかは計算量と同等以上に重要
RLHFなどの調整手法	人間のフィードバックを使って有用・安全な出力に調整する
推論アルゴリズム	テスト時の思考ステップ数なども性能に直結（例：Chain-of-Thought）

現在のAI研究者の間で最も注目されている変化は「スケーリング則の限界」です。単純にGPUを増やしてデータを増やすだけでは性能向上が頭打ちになってきており、推論時の計算（thinking）の活用やデータ合成・データの質の向上が次の主戦場になっています。つまりアルゴリズムも重要ですが、「どんなデータで・どう訓練するか」という訓練設計が今最も競争が激しい領域です。

プロンプトなしで語り掛けてくる認知能力はないのか

現時点では技術的には存在するが、製品として普及していないが正確な答えです。

エージェント型AIは存在します。特定のトリガー（時刻・センサー・カレンダーなど）で自律的に動き出す仕組みはすでに研究・実装されています
ただし「語り掛ける」にはユーザーの状態や文脈を常時監視する仕組みが必要で、これはプライバシー・倫理・技術の三重の壁があります
AppleのSiriやGoogleアシスタントは「ウェイクワード」という形で部分的に実現していますが、深い文脈理解を伴う自発的な語りかけはまだ製品化されていません

根本的な問いとして、「AIがいつ・なぜ話しかけるべきかを判断する能力」はまだ解決されていません。人間関係においても「なぜ今この話をするのか」という社会的判断は非常に高度です。これは文脈的な自律性の問題で、現在の生成AIの最大の未解決課題の一つです。

日本がAI企業に提供できるデータセンター・電力以外の強み

人材・研究

数学・工学の高水準な基礎研究者層
ロボティクス・制御系AI（強化学習の実応用）では世界トップクラス

産業データ

製造業（自動車・半導体・精密機器）の高品質な工場データは世界的に希少
医療・介護分野の長期縦断データ（高齢化先進国として）
こうしたデータは英語圏のAI企業が持っていないため、訓練データとして極めて価値が高い

規制環境

著作権法の解釈がAI学習に対して比較的柔軟（2018年改正以降）
これはAIの訓練データ収集において欧米より有利な環境

信頼・安全保障

地政学的に中立な立ち位置
米中のAI覇権争いの中で、両陣営から信頼される数少ない先進国
AI安全性の研究拠点として国際的な誘致ポテンシャルがある

インフラ以外の隠れた強み

地震等のリスク管理技術（インフラ耐久性設計）
精密製造によるGPU冷却・省エネ技術への貢献可能性

日本が「電力とデータセンターを提供する場所」で終わるのではなく、産業データの提供者・AI安全性の研究拠点・信頼できる地政学的パートナーとして位置づけることができれば、より高い付加価値を持って国際的なAI競争に参加できると思います。

AIの長所・短所

AI全般に言えることですが、計算が苦手です。よく間違えます。AIが人間を介さずに勝手に何かに指示して動くことはないので、AIが成熟して人間がやることが無くなったということはないです。長所・短所を理解した上で有効活用できれば、強力なアシスタントになります。

最初にAIを有効活用するにはスクリーン・ショットを多用することになります。スピードが上がるだけでなく精度も上がるからです。

AIの長所

コード生成が正確で爆速。しかも難解なC++にも対応していること。
特許や論文の要約も爆速
検証作業に強い

注1)コード生成はAnthropic>Copilot>Geminiの順番で精度の違いが明確です。

注2)特許庁のデータにはAIはアクセスできないので、PDFで読み込ませたらAnthropic以外精度に問題があることが判明。

注3)化学分野の成分分析や性質データに関し、原油の分析についてもGEMINIが最低で間違いだらけの結果を返していました。

AIの短所

地図が作成できないし、図の中にある文字に関しても文字化けした生成となる。
図内にある文字を読むのが苦手。
最初にどの分野の最新のデータ(日付入りで)をベースに答えて欲しいとプロンプトしないと、AIが学習を終えた時点もしくはWEB上で上位のデータを読み込んでくるので注意が必要。
AIの開発は英語圏の人たちが行っているので、AIの学習において英語の資料で蓄積されているという事実を理解しなければならない。日本語の問いかけに変な回答が多くなるのはやむを得ない。

化学製品の開発にどう活用したか

取得した特許情報をPDFでCopilotに読み込ませました。この中で関係物資を特定するための抽出作業を行い、目的を明示しました。

化学物質の抽出作業
配合割合の決定
化学品を調達する際に、グレード、型番、メーカー名が必要になるのでそのリスト作成
製品化した際に売れるかどうかと競合他社の動向

このままでは製品化しても売れないということが判明しました。Copilotからはそんな使い方はしないと言われながらも、あるセメント会社には配合割合を伝えて簡易試験を行っていただけることになりました。

特許事務所に相談したところ、期限切れでその事務所が申請した特許を提示してくれました。ここでAIの出番です。

特許情報をPDFでCopilotに読み込ませる
会社保有の特許と重複しない化学物質の抽出作業
抽出した物質と既存物質とを併せることで新たな効能についての検証

結果については、Anthropicに配合表を読ませ検証させると意外にも特許上では可能な反応が不可能と言ってきました。2つの特許を併合したため効果が打ち消されたわけではなく単純に化学品の持つ単品の効果を勘案しただけでした。

特許で該当する部分を読み込ませると理解が得られました。AIモデルの制御の特徴だと思いますが、Copilotは安全性の制御が甘いので、複合的に考えるのが得意というよりは大局的に制御なしで答えを出したと言えます。Anthropicは安全性の面で少しでも疑義があれば保守的に回答するのでしょう。解釈可能性ということに力を入れているAIなので、実例がないものや複合的に効果が作用して初めて得られる効果については苦手と判断しました。

Anthropicには再度化学品それぞれの効果や目的をリスト化したものを読ませた結果、Copilotとともに開発した設計でGOサインが出ました。

最後は検証試験でデータが取れれば次のステップに進めます。全国様々な検証機関に相談しましたが、北里環境科学センターさんだけが協力的に対応していただけることになりました。もちろん最初はHPの問い合わせからになります。

イラン戦争の影響もあり、原材料調達に支障が出ていますがなんとか克服して検証試験データを取る予定です。