(4)合成データ

合成データとは、実際に存在するデータを元に、生成AIが生成した、実際に存在しない架空のデータ。合成データで学習したAIの性能が向上するのかどうかは議論が分かれるところだが、一部専門家は合成データの有用性を強く主張しているという。

(5)検証能力の向上

AIはプログラミングコードを生成できるが、生成したコードを自らが検証することも可能。この検証能力を向上させることで、より精度の高い答えを出せるようになるとAndreesen氏は主張している。

(6)半導体不足の解消

AI向けの高性能半導体が供給不足になったことで、AIの進化の遅れが懸念されていたが、同氏によると半導体不足は次第に解消され始めているという。

(7)世の中にはまだまだ学習データが存在する

最先端の大規模言語モデルは、ネット上のデータをほぼすべて学習済み。なのでこれ以上AIは賢くならないという意見があるが、同氏は世の中にはネット上で公開されていないデータがまだまだ存在すると主張する。またオープンソースのデータセットでも質のいいものが増えてきているという。

(8)巨額投資が続いている

AIの研究開発に対する巨額の投資が続いているので、同氏によるとAIはまだまだ進化する見通しだという。

(9)優秀なエンジニア

AIモデル自体は研究者が開発するが、その改良に貢献するのがエンジニアだ。AIが注目を集めていることで、世界中の優秀なエンジニアがAIモデルの改良に取り組み始めているという。

(10)学習データ最適化

多くの大規模言語モデルは、あらゆるタイプのデータで学習しているが、Microsoftは重複データを削除したり高品質のデータに焦点を当てるなどの最適化手法を施したデータセットを準備。この方法で小規模ながら大規模モデルと同等の性能を実現させた。同氏は、今後同様の手法でAIモデルが進化する可能性が高いと指摘している。

こうした複数の改良が1つになってAIモデルの進化を促進している。Mark Andreesen氏は「こうした個々の改良が、劇的にAIを進化させる可能性がある。進化が止まるとは考えにくい」(20:26)と語っている。

一方でAIの利用コストが高額だという問題はどうだろう。OpenAIがこのほど発表したGPT-4oは、これまでの最新鋭AIモデルの半額で利用できるという。OpenAIのSam Altman氏によると、AIモデルのアルゴリズムの効率化に成功したからで、同氏は効率化が今後も進むと強調している。

一般ビジネスマンにも活用拡大か
【関連記事】