プレスリリース

OpenAIもAnthropicも超えた!Skywork AIの新マルチモーダルAI「R1V 3.0」がオープンソース化

2025年07月14日(月)13時45分
シンガポールのAI企業Skywork AIは、マルチモーダル推論モデル「Skywork-R1V 3.0」をオープンソースとして公開しました。これはパラメータ数38Bの、同社史上最も強力なマルチモーダル推論モデルであり、複数のマルチモーダル推論ベンチマークにおいて、オープンソース最高(SOTA)の性能を記録しています。
画像1: https://www.atpress.ne.jp/releases/442689/img_442689_1.jpg
画像2: https://www.atpress.ne.jp/releases/442689/img_442689_2.jpg
画像3: https://www.atpress.ne.jp/releases/442689/img_442689_3.jpg
画像4: https://www.atpress.ne.jp/releases/442689/img_442689_4.jpg
画像5: https://www.atpress.ne.jp/releases/442689/img_442689_5.jpg
画像6: https://www.atpress.ne.jp/releases/442689/img_442689_6.jpg


■ 科学、工学から医学、芸術に至るまで包括的な知性を実現するために、クロスモーダル推論と学際的な一般化を結び付ける
Skywork-R1V 3.0は、Skywork AIのマルチモーダルモデルシステムの主要ノードであり、中核を成す基盤です。深層推論機能を様々な分野に汎用化し、優れたクロスドメイン推論能力を発揮します。数学や物理学といった従来の科学技術推論タスクだけでなく、地理、歴史、人文科学、医学、芸術、ビジネス、工学といった分野でも優れたパフォーマンスを発揮します。

権威ある包括的なマルチモーダル評価においてMMMUSkywork-R1V 3.0は76.0オープンソースモデルの最高スコアは、Claude-3.7-Sonnet(75.0)やGPT-4.5(74.4)などのクローズドソースモデルを上回り、人間のジュニアエキスパート(76.2)のレベルに近づきました。

Skywork-R1V 3.0 は、他の重要な多分野にわたる評価ベンチマークでも優れたパフォーマンスを発揮しました。

より難しい視覚的推論ではEMMA-Mini(CoT)オープンソースの最先端40.3これは、Qwen2.5-VL-72B-Instruct や InternVL3-78B などの大型モデルを上回り、クローズドソース モデル Claude-3.7-Sonnet との差を縮めます。

小中学校の知識ポイントを網羅 MMK12R1V 3.078.5Qwen2.5-VL-72B-Instruct、InternVL3-78B などのオープンソース モデルや、GPT-4.5、GPT-4o などのクローズド ソース モデルを凌駕し、再びオープンソース陣営をリードしています。

Skywork-R1V 3.0 は、前世代モデルと比較して、物理学や論理などの複数の主要領域で大幅なパフォーマンスの向上を実現し、現在のオープンソース分野で最も強力なマルチモーダル推論モデルの 1 つになりました。

■ 物理的推論
物理学分野における権威ある評価PhyX-MC-テキスト-最小限 そして シーフィズSkywork-R1V 3.0は52.8 割り算と足し算31.5分裂したオープンソースのベスト結果は、マルチモーダル物理推論における優れた能力を遺憾なく発揮しています。このモデルは、力学や電磁気学といった基本的な物理概念を正確に理解できるだけでなく、グラフィックとテキストが組み合わさった複雑な物理問題(力解析図、回路図、その他の専門図の解析など)の処理にも優れています。その物理推論レベルは、現在主流のオープンソースモデルや、GPT-4.5、Gemini 2 Flashなどの一部クローズドソースモデルを大幅に上回っています。

■ 論理的推論
Skywork-R1V 3.0 は、多くの権威ある論理推論テストでも優れたパフォーマンスを発揮しました。ロジックビスタ テストで得られた59.7ポイント、ヴィジュロジック テストで得られた28.5でMME推論 スカイワークR1V 3.0が優勝42.8 Skywork-R1V 3.0 の優れたパフォーマンスは、クローズドソース モデルである Claude-4-Sonnet を上回り、マルチモーダル ロジックの一貫性、条件付き推論、およびクロスモーダル因果モデリングにおける Skywork-R1V 3.0 の優れた機能を十分に実証しました。

■ 数学的推論
R1V 3.0は、数学問題において優れた問題解決能力を示しました。権威ある数学ベンチマークであるMathVista、MathVerse、MathVisionにおいて、R1V 3.0はそれぞれ77.1、59.6、52.6という優れたスコアを達成し、Qwen2.5-VL-72B-Instruct、InternVL3-78B、QVQ-72B-Previewなどのオープンソースモデルを上回りました。

Skywork-R1Vの研究開発チームは、Skywork-R1V 3.0のクロスモーダルかつ学際的な機能により、医療分野や教育分野における幅広い応用の可能性を秘めていると述べています。例えば、医療分野では、医用画像、医療記録、患者との会話を統合することで、より正確な診断提案を提供することができ、教育分野では、パーソナライズされた学習やインテリジェントな個別指導を提供することができます。

■ コールドスタート+GRPO強化学習は低コストかつ高効率で推論能力を刺激する
同時に、単一次元のモデルの限界を打ち破り、人間の認知推論プロセスに近い、より包括的なマルチモーダル推論モデルを構築することも、Skywork AI の研究チームにとって大きな課題となっています。

Skywork-R1Vの研究開発チームは、Skywork-R1V 3.0のクロスモーダル推論と分野横断的な一般化能力の向上には、2つの重要な要素があると述べています。1つは、クロスモーダル融合メカニズムがより洗練され、より効果的になったこと、もう1つは、強化学習手法を活用することで、一部のクローズドソースの巨大モデルに匹敵、あるいは凌駕する一般化推論能力を実現したことです。

具体的には、Skywork-R1V 研究開発チームは、強化学習 GRPO 戦略、主要なエントロピー駆動型モデル識別メカニズム、コネクタの微調整、および多分野にわたる知識修正の複合効果により、モデル推論パフォーマンスと推論効率の二重の改善を達成しました。

Skywork-R1V 3.0は、前世代モデルであるSkywork-R1V 2.0の抽出データに基づいて「コールドスタート」され、その後、強化学習アルゴリズムGRPOが導入されました。これにより、モデルの推論能力が深化され、画像とテキストのモダリティ間での推論機能の移行が実現され、クロスモーダルおよび多分野シナリオにおける理解と分析のパフォーマンスが向上しました。最終的に、約12,000個の教師あり微調整サンプルと13,000個の強化学習サンプルを用いて学習されました。

モデルの推論能力の一般化を強化するために、研究者らは、主要な推論ノード(「待機...」、「または...」など)に入るときにモデルの出力エントロピーの変化を監視する、主要なエントロピー駆動型モデル識別メカニズムを採用しました。

この背景にある考察は、推論機能を持つモデルはこれらの箇所でより高い不確実性を出力するのに対し、推論のトーンを模倣するだけのモデルはエントロピーが低く決定論的な内容を出力することを研究者らが発見したというものです。これに基づき、研究者らは決定論的なチェックポイントを提案し、推論機能を持つ重み付けされたバージョンを除外しました。

Skywork-R1V 3.0は、より高度な機能を備えています。10,000件の高品質、多分野、マルチモーダルなサンプルに基づいてコネクタを再学習することで、異なる分野の知識の統合を最適化し、分野横断的な推論機能を備えています。

同時に、Skywork AI はクロスモーダルコネクタの特別な微調整も実施し、視覚モダリティによって提供される詳細情報が推論チェーン全体にわたって明確かつ安定した貢献を維持し続けることができるようにすることで、深い推論シナリオにおける Skywork-R1V 3.0 の視覚認識の精度と安定性を確保し、マルチモーダルモデルの推論チェーンが長すぎる場合に視覚情報が薄められ、幻覚が発生するリスクに対処します。

大規模な事前学習をゼロから行うことでマルチモーダル推論能力を強化するという技術的な方法とは異なり、Skywork AIはモデルの学習後段階に焦点を当てています。高度な強化学習戦略を用いることで、低コストでモデルの潜在的な推論能力を刺激し、パフォーマンスの飛躍的な向上を実現します。研究開発チームは、学習後の強化学習は、大規模な事前学習の潜在能力を具体的に活性化し、深化させることができると述べています。同時に、この小規模で高品質なデータ駆動型強化学習は、より経済的で効率的であり、迅速な反復とモデル能力の正確な調整に適しています。

Skywork-R1V 3.0 は、より低コストかつより高い効率でマルチモーダル モデル推論の可能性を刺激するために、AGI を探索するプロセスにおいて Skywork AI が提案した効果的なパスです。

Skywork R1V 3.0の誕生は、Skywork AIのマルチモーダルインテリジェンスの進化における新たな飛躍を象徴しています。これは、汎用人工知能(AGI)の実現におけるクロスモーダル推論能力の重要な価値を証明するだけでなく、業界に、より低コストかつ高効率でマルチモーダルモデルの推論ポテンシャルを刺激する新たなパラダイムを提供します。

■ Skywork-R1V3.0ダウンロード
HuggingFace 住所:
https://huggingface.co/Skywork/Skywork-R1V3-38B
GitHubアドレス:
https://github.com/SkyworkAI/Skywork-R1V

さらに、Skywork は 5 月に世界初のディープ リサーチ AI ワークスペース エージェントをリリースしました。これは、次の Web サイトから体験できます。https://skywork.ai/

■ メディア連絡先
会社名:Skywork AI PTE.LTD.
担当者: ピーター・ティアン
メールアドレス:peter@skywork.ai
州: サイエンスパークドライブ2番地
国: シンガポール
Webサイト:skywork.ai


詳細はこちら
プレスリリース提供元:@Press
あわせて読みたい
ニュース速報

ビジネス

TSMC、第2四半期AI需要で過去最高益 関税を警

ワールド

ウクライナ議会、スビリデンコ氏を新首相に選出 39

ワールド

エプスタイン事件、「トランプ政権が情報隠ぺい」7割

ワールド

ロシア、必要なら西側への「予防的攻撃」開始も=前大
あわせて読みたい
MAGAZINE
特集:AIの6原則
特集:AIの6原則
2025年7月22日号(7/15発売)

加速度的に普及する人工知能に見えた「限界」。仕事・学習で最適化する6つのルールとは?

メールマガジンのご登録はこちらから。
人気ランキング
  • 1
    頭はどこへ...? 子グマを襲った「あまりの不運」が話題に
  • 2
    その首輪に書かれていた「8文字」に、誰もが言葉を失った
  • 3
    日本より危険な中国の不動産バブル崩壊...目先の成長だけ追い求め「失われた数百年」到来か?
  • 4
    アメリカで「地熱発電革命」が起きている...来年夏に…
  • 5
    ネグレクトされ再び施設へ戻された14歳のチワワ、最…
  • 6
    「二度とやるな!」イタリア旅行中の米女性の「パス…
  • 7
    「巨大なヘラジカ」が車と衝突し死亡、側溝に「遺さ…
  • 8
    「異常な出生率...」先進国なのになぜ? イスラエル…
  • 9
    「飛行機内が臭い...」 原因はまさかの「座席の下」…
  • 10
    アフリカ出身のフランス人歌手「アヤ・ナカムラ」が…
  • 1
    頭はどこへ...? 子グマを襲った「あまりの不運」が話題に
  • 2
    その首輪に書かれていた「8文字」に、誰もが言葉を失った
  • 3
    「ベンチプレス信者は損している」...プッシュアップを極めれば、筋トレは「ほぼ完成」する
  • 4
    日本より危険な中国の不動産バブル崩壊...目先の成長…
  • 5
    「お腹が空いていたんだね...」 野良の子ネコの「首…
  • 6
    どの学部の卒業生が「最も稼いでいる」のか? 学位別…
  • 7
    アメリカで「地熱発電革命」が起きている...来年夏に…
  • 8
    千葉県の元市長、「年収3倍」等に惹かれ、国政に打っ…
  • 9
    「二度とやるな!」イタリア旅行中の米女性の「パス…
  • 10
    ネグレクトされ再び施設へ戻された14歳のチワワ、最…
  • 1
    「コーヒーを吹き出すかと...」ディズニーランドの朝食が「高額すぎる」とSNSで大炎上、その「衝撃の値段」とは?
  • 2
    「あまりに愚か...」国立公園で注意を無視して「予測不能な大型動物」に近づく幼児連れ 「ショッキング」と映像が話題に
  • 3
    頭はどこへ...? 子グマを襲った「あまりの不運」が話題に
  • 4
    その首輪に書かれていた「8文字」に、誰もが言葉を失…
  • 5
    10歳少女がサメに襲われ、手をほぼ食いちぎられる事…
  • 6
    JA・卸売業者が黒幕説は「完全な誤解」...進次郎の「…
  • 7
    燃え盛るロシアの「黒海艦隊」...ウクライナの攻撃で…
  • 8
    ディズニー・クルーズラインで「子供が海に転落」...…
  • 9
    「小麦はもう利益を生まない」アメリカで農家が次々…
  • 10
    イランを奇襲した米B2ステルス機の謎...搭乗した専門…
トランプ2.0記事まとめ
日本再発見 シーズン2
CHALLENGING INNOVATOR
Wonderful Story
MOOK
ニューズウィーク日本版別冊
ニューズウィーク日本版別冊

好評発売中